Teknoloji

Mythos kamuya açıldı, Claude Fable 5 ile 27 yıllık açık ortaya çıktı

Susan Hill

27 yıl boyunca tek bir açık, bankaların, güvenlik duvarlarının ve gündelik web sitelerinin arkasındaki sunucuların güvendiği işletim sistemlerinden biri olan OpenBSD’nin içinde dokunulmadan durdu. Makineye bir ağ üzerinden ulaşabilen herkes onu çökertebiliyordu ve neredeyse otuz yıl boyunca kimse fark etmedi. Mythos adlı bir Anthropic modeli fark etti. Şimdi bu modelin kamuya açık bir yüzü var: Anthropic, en yetenekli sisteminin herkesin kaydolup kullanabileceği ilk sürümü olan Claude Fable 5’i yayımladı.

Fable 5’i dikkate değer kılan şey bir sıralamadaki yer değil. Altta yatan modelin, yazılımı deneyimli bir denetçinin bir sözleşmeyi okuduğu gibi okuyup her şeyi bozan tek maddeyi bulmasıdır. Anthropic’in Project Glasswing adını verdiği bir araştırma programı kapsamında, ön sürüm bin’den fazla açık kaynak projesini, yani internetin büyük bölümünü çalıştıran özgür ve paylaşılan kodu taradı ve 23.000’den fazla soruna işaret etti. Bunların 10.000’den fazlası yüksek ya da kritik olarak sınıflandırılacak kadar ciddiydi.

Anthropic’in kendi araştırmacılarını bile tedirgin eden ayrıntı, modele bunu kimsenin öğretmemiş olması. Şirket, zayıflıkları bulma ve kullanma yeteneğinin hiçbir zaman bir eğitim hedefi olmadığını, model kod üzerine daha iyi akıl yürüttükçe kendiliğinden ortaya çıktığını söylüyor. FFmpeg en açık örnek. Sayısız akış uygulamasının ve medya oynatıcısının arkasındaki motor olan o video işleme yazılımında bir açık 16 yıldır saklanıyordu; otomatik test araçlarının beş milyon kez tetiklediği, ama tehlikeyi hiçbir zaman görmediği bir kod satırına yerleşmişti. Model gördü.

Çoğu insan için bunların hiçbiri bir şeye benzemiyor. Mythos’un denetlediği yazılım görünmez bir altyapı: tarayıcı motoru, işletim sisteminin çekirdeği, bir telefonun içine gömülü medya kütüphanesi. Ama görünmezlik tam da sorunun kendisi. Ortaya çıkan açıklar, çok eski, çok sıkıcı ya da çok derinde olduğu için kimsenin tekrar tekrar okumadığı bir kodda yaşadıklarından sağ kalmıştı. Tüm bunları yorulmadan yeniden okuyabilen bir araç, internetin temellerini ayakta tutanların ve yanlış ellerde, onlara saldırmak isteyenlerin ihtimallerini değiştiriyor.

Böyle sayılar ancak bir ölçüt karşısında bir şey ifade eder. Bir modelin gerçek bir güvenlik açığını yeniden üretip üretemediğini ölçen CyberGym testinde, Fable’ın içindeki Mythos motoru, önceki Claude Opus 4.6’nın yüzde 66,6’sına karşılık yüzde 83,1 alıyor; aşağı yukarı yetkin bir genç analist ile nadiren yanılan bir uzman arasındaki fark. Kazanımlar güvenlikle sınırlı değil. Analitik şirketi Hex, Fable’ın kendi iç testinde yüzde 90’ı aşan ilk model olduğunu bildirdi; ilk kullanıcılar da yazılım geliştirme, veri analizi ve arayüz tasarımında benzer sıçramalar anlatıyor.

Sonra dönüm noktası geliyor. Kamuya açık Fable 5, onu dikkate değer kılan şeyi tam olarak yapmayacak. Anthropic dört alanı, yani siber güvenlik, biyoloji, kimya ve damıtma denen bir kopyalama tekniğini duvarla ayırdı; bir istek bunlara kaydığında Fable, konuşmayı sessizce daha eski ve daha güvenli Claude Opus 4.8’e devrediyor. Şirket bunun nadiren olduğunu, ilk verilerin oturumların en az yüzde 95’inin tamamen Fable üzerinde çalıştığını gösterdiğini söylüyor. Sonuç alışılmadık bir ürün: Anthropic’in çıkardığı en yetenekli model, en keskin becerisini kullanmaktan bilerek alıkonmuş halde.

Bu tasarım, lansmanın tam olarak yanıtlamadığı sorular bırakıyor. Zamanın yüzde 5’inde kenara çekilen bir koruma, yine de dikişleri olan bir korumadır ve bir yazılımın nasıl çalıştığını açıklamakla onu nasıl kıracağını açıklamak arasındaki çizgi nadiren temizdir. Anthropic, dış bir ödül avı programının sınırları aşmanın evrensel bir yolunu bulmadan 1.000 saatten fazla sürdüğünü belirtiyor; ama bunlar şirketin kendi rakamları, hiçbir dış düzenleyicinin denetiminden geçmedi. Bir de çoğunun önce hissedeceği bir maliyet var: Fable 5, milyon giriş jetonu başına 10 dolar, milyon çıkış jetonu başına 50 dolara mal oluyor; bunlar bir modelin okuma ve yazma için ücretlendirdiği yaklaşık birimler ve Opus 4.8’in iki katı. Ve onu kullanan herkes daha sessiz bir şeyden vazgeçiyor, çünkü Anthropic artık normalde hiç veri saklamamak için ödeme yapan müşterilerde bile 30 günlük kullanım verisi tutuyor ve bunu kötüye kullanıma karşı bir savunma olarak sunuyor.

Şimdilik erişim, Claude’u zaten nasıl kullandığınıza bağlı. Geliştiriciler Fable 5’e Anthropic’in programlama arayüzü üzerinden hemen ulaşabiliyor; Mythos 5 adlı ayrı bir sürüm ise önceden onaylanmış küçük bir kuruluş grubuna, Apple, Google, Microsoft, Nvidia ve Linux Foundation’ı içeren ve modelin bulduklarını saldırganlardan önce yamamaya çalışan bir sektör koalisyonunun yanında verildi. Anthropic, bu onarım işini yapan açık kaynak güvenlik gruplarına 100 milyon dolarlık model kredisi ve 4 milyon dolarlık doğrudan bağış ayırdı.

Daha geniş dağıtım bir takvime göre ilerliyor. Anthropic’in Pro, Max, Team ve koltuk bazlı Enterprise planlarının aboneleri Fable 5’i 22 Haziran’a kadar ek ücret ödemeden alıyor; 23 Haziran’dan itibaren kullanım kredilerden düşüyor. Milyonlarca yeni kullanıcı üzerine yüklendiğinde korumaların dayanıp dayanmayacağı henüz belirsiz olan kısım. Daha çarpıcı olan gerçek belirsiz değil. Bir makine artık modern hayatın altındaki kodu okuyabiliyor ve bir kuşak boyunca herkesin gözünden kaçan çatlakları bulabiliyor; ardından gelen soru ise artık bunu yapıp yapamayacağı değil, kimin ondan bunu isteme hakkına sahip olduğu.

Etiketler: , ,

Tartışma

S kadar yorum var.