Teknoloji

18 günlük yasak sonrası Claude Fable 5 küresel erişime açıldı: açık, modelde değil saldırıdaydı

Adrian Kessler

Anthropic‘in kamuya açık en güçlü yapay zeka modeli Claude Fable 5, dünya genelinde yeniden kullanıma açıldı. Dönüş, ABD hükümetinin Anthropic‘ten kullanıcıların ulusal kimliklerini gerçek zamanlı olarak doğrulamasını zorunlu kılan ihracat kontrolleri uyguladığında başlayan on sekiz günlük tam askıya almanın ardından geldi. Şirket, bu gereksinimi Claude’un küresel kullanıcı tabanı ölçeğinde karşılayamayacağını belirleyerek kısmi uyum yerine erişimi tamamen askıya almayı tercih etti.

Kontrolleri tetikleyen teknik, Amazon araştırmacılarının keşfettiği belirli bir jailbreak yöntemiydi. Bu yöntem Fable 5’i, ABD ihracat kısıtlamalarının belirli yabancı uyruklu kişiler için yasakladığı biçimlerde yazılım güvenlik açıklarını haritalandırmak amacıyla kullanıyordu. Şirket içi soruşturma, düzenleyici mantığı karmaşık hale getiren bir şeyi ortaya çıkardı: aynı kategorideki güvenlik açıkları çok daha az güçlü modellerle de tespit edilebiliyordu; bunlar arasında Opus 4.8, GPT-5.5 ve Kimi K2.7 vardı. Yani söz konusu kapasite Fable 5’e özgü değildi.

Kontrolleri açan çözüm

Değişen şey, Amazon’un belgelediği atlatma tekniğini engellemek için özel olarak eğitilmiş yeni bir güvenlik sınıflandırıcısı. Anthropic, sınıflandırıcının açıklanan yöntemi vakaların yüzde doksan dokuzundan fazlasında yakaladığını bildiriyor. Bu, gelecekteki jailbreak’lere karşı tam koruma garantisi değil, bilinen bir güvenlik açığına yönelik hedefli bir düzeltme. Sınıflandırıcı giriş katmanında çalışarak belgelenen kalıplarla eşleşen istekleri model onları işlemeden önce yönlendiriyor.

Daha geniş çaplı sonuç, yapay zeka düzenlemesinin nasıl gelişeceği açısından önemli. İhracat kontrolleri Fable 5’e uygulandı, çünkü model zararı tek başına mümkün kıldığı için değil, bilinen bir teknik onu istismar ettiği için. Kaldırıldı, çünkü düzenleyici çerçeve bu soruyu çözdüğü için değil, bir sınıflandırıcı belgelenen boşluğu kapattığı için. Anthropic, Amazon, Microsoft ve Google ile yapay zeka jailbreak’lerinin ciddiyetini dört kriter temelinde değerlendiren ortak bir çerçeve üzerinde çalışıyor: kapasite kazanımı, bu kazanımın kapsamı, silahlaştırma kolaylığı ve keşfedilebilirlik. Bu çerçeve henüz kamuya açık bir standart olarak mevcut değil.

Modelin yapabilecekleri ve maliyeti

Modelin kendisi değişmedi. Fable 5, zorlu uzun vadeli akıl yürütme ve ajansal çalışma için tasarlandı; her adımda insan onayı gerektirmeyen uzun diziler boyunca planlama, uygulama ve yön düzeltmesi gerektiren görevler için. Bağlam penceresi bir milyon token; bu aynı zamanda varsayılan değer. Yanıt başına maksimum çıktı 128.000 token. Düşünme her zaman aktif; akıl yürütme zinciri ham biçimde değil, okunabilir özet olarak döndürülüyor.

Erişim, askıya alma öncesinde geçerli olmayan koşullarla birlikte geliyor. Fable 5 artık 30 günlük veri saklama gerektiriyor; sıfır veri saklama sözleşmeleri kapsamında kullanılamıyor. Bu durum, yapay zeka araçlarının benimsenmesi için sıfır saklama sözleşmelerinin genellikle temel gereksinim olduğu sağlık, hukuk ve kamu sektörü kuruluşlarını doğrudan etkiliyor. Fiyatlandırma Opus seviyesinin üzerinde: giriş başına milyon token için on dolar, çıkış için elli dolar. Güvenlik sınıflandırıcılarını tetikleyen istekler reddedilmek yerine alternatif bir modele yönlendirilebilir; bu değiştirmenin son kullanıcıya görünür olup olmadığı her operatörün yapılandırmasına bağlı.

Kullanılabilirlik

Fable 5’in Claude Mythos 5 adında bir kardeş modeli var; aynı temel kapasitelere ve aynı fiyatlandırmaya sahip ancak Fable 5’in içermediği saldırı amaçlı siber güvenlik işlevleri sunuyor. Mythos 5, ayrı bir erişim katmanı olan Project Glasswing aracılığıyla kullanılabiliyor. İki model eş zamanlı olarak geri dönmedi: Mythos 5 erişimi, belirli ABD kuruluşları için Fable 5’in küresel dönüşünden bir hafta önce yeniden sağlandı.

Fable 5 şu anda Claude Platform, Claude.ai, Claude Code ve Claude Cowork’ta kullanılabilir. Pro, Max, Team ve belirli Enterprise planlar için model, 7 Temmuz’a kadar haftalık kullanım limitlerinin yüzde ellisine kadar dahil; bu tarihten sonra kullanım kredisi fiyatlandırmasına geçilecek. AWS, Google Cloud ve Microsoft Foundry üzerinden erişim aşamalı olarak yeniden sağlanıyor. Yeni bir atlatma tekniğinin ortaya çıkması durumunda nasıl müdahale edileceğini belirleyecek çerçeve henüz inşa aşamasında.

Etiketler: , , , , ,

Tartışma

S kadar yorum var.