Teknoloji

DeepSeek yapay zekâyı ucuzlattı, ABD balonu ise tersine oynadı

Susan Hill

Nicel bir hedge fonundan doğan Çinli laboratuvar DeepSeek, ABD yapay zekâ sektörünün imkânsız diye fiyatladığı şeyi inatla yapıyor. Sınıra yakın performans gösteren modeller kuruyor, bunları ABD’li rakiplerinin harcadığının küçük bir kısmına eğitiyor ve ardından ağırlıkları yayımlıyor; isteyen indirip çalıştırabiliyor. Her sürüm aynı tartışmayı yeniden açıyor: tüm ABD yapay zekâ sektörünün değerlemesi, DeepSeek’in sessizce söktüğü bir varsayıma dayanıyor; o da zekânın pahalı kalmak zorunda olduğu.

Bu varsayım soyut değil. İnşa hâlindeki yüz milyarlarca dolarlık veri merkezini, neredeyse her endeks fonunun içindeki çip üreticilerinin ve bulut sağlayıcılarının hisse fiyatını ve birçok okurun bir sohbet botu için zaten ödediği aylık aboneliği ayakta tutuyor. Bir rakip karşılaştırılabilir sonuçları çok daha ucuza verir ve yazılımı bedava dağıtırsa, kıt ve pahalı işlem gücüne biçilen prim bir hendekten çok bir bahse benzemeye başlıyor.

DeepSeek’in iddiası verimlilikle ilgili, sihirle değil. Mühendisleri, her sorguda modelin yalnızca bir kısmını uyandıran bir uzman karışımı tasarımına, düşük hassasiyetli hesaplamaların yoğun kullanımına ve daha az, kısmen ihracat kısıtlı çiple çalışacak biçimde ayarlanmış eğitim hatlarına dayandı. Ana eğitim koşularından biri için en sık tekrarlanan rakam altı milyon doların altındaydı. Eşdeğer ABD koşularının, tam fatura toplandığında bunun kat kat fazlasına mal olduğu düşünülüyor.

Modelin nasıl yayımlandığı, maliyeti kadar önemli. DeepSeek açık ağırlıklar sunuyor; São Paulo’daki bir geliştirici, Varşova’daki bir üniversite laboratuvarı ya da Seul’deki bir girişim modeli indirip kendi makinelerinde çalıştırabiliyor; her sorgu için bir ABD sağlayıcısına ödeme yapmadan ve verisini yurt dışına göndermeden. İşte ironi: Çin yapay zekâsını en güçlü çipleri keserek yavaşlatmayı amaçlayan ihracat denetimleri, anlaşılan DeepSeek’i azdan çok çıkarmaya itti ve bu tutumlu yöntemler artık açık ağırlıkların gittiği her yere gidiyor.

Bu araçları yalnızca kullanan kişi için anlık etki, seçim özgürlüğü. Daha ucuz modeller abonelik fiyatlarını aşağı bastırıyor, daha yetenekli asistanları sıradan dizüstülere ve telefonlara taşıyor ve tek bir sağlayıcıya bağlanma gerekçesini zayıflatıyor. Kiralanan bir hizmet gibi duran şey, sahip olunabilecek bir yazılıma benzemeye başlıyor.

Balon söylemi büyük çekinceler istiyor. Altı milyon doların altındaki rakam tek bir nihai eğitim koşusunu kapsıyor; onu mümkün kılan araştırmayı, çıkmaz sokakları, maaşları ya da donanımı değil. Dolayısıyla onu bir ABD laboratuvarının toplam harcamasıyla karşılaştırmak, iki ayrı şeyi karşılaştırmaktır. Açık ağırlıklar açık kaynak da değil; eğitim verisi ve yöntemin tamamı gizli kalıyor. Üstelik verimlilik argümanı iki yönlü kesiyor. DeepSeek sorulduğunda Microsoft yönetimi Jevons paradoksuna sarıldı; bir kaynağın kullanımı ucuzladıkça toplam tüketiminin düşmek yerine artma eğiliminde olduğu yolundaki eski gözleme. Daha ucuz zekâ, dünyanın ondan çok daha fazla satın alması anlamına gelebilir; bu da işlem gücü satanlar için kötü değil, iyi haber olurdu.

Balonun ölü ilan edilmesi de ilk kez olmuyor. Aynı laboratuvar bir keresinde ABD tarihinin tek günde en büyük piyasa değeri kaybını tetikledi, bir öğleden sonra tek bir çip üreticisinden altı yüz milyar dolara yakın değeri sildi ve ardından hissenin haftalar içinde çoğunu geri almasını izledi. Büyük ABD yapay zekâ şirketleri daha az harcayarak yanıt vermedi. Daha fazla sermaye topladı ve daha büyük inşa etti. Balonun nihayet patladığı yolundaki her iddia, masada en çok parası olanların bahsi katlamayı sürdürdüğü gerçeğinden sağ çıkmak zorunda.

DeepSeek’in gerçekte yaptığı şeyi dramatize etmek, patlamış bir balondan daha zor. Önde gelen ABD laboratuvarlarının kimsenin tırmanamayacağı bir sermaye duvarıyla korunduğu varsayımının konforunu ortadan kaldırdı. Sınır düzeyindeki bir yetenek ucuza yaklaştırılıp bedava dağıtılabiliyorsa, değer artık modele sahip olmakta durmuyor. Dağıtıma, modelin çevresinde kurulan ürünlere ve müşteriyi elinde tutana kayıyor. Bir sonraki sınav tarih konmamış olsa da çoktan takvimde: her yeni DeepSeek sürümü aynı soruyu yeniden açıyor ve ölçeğin hâlâ kazandığına inanarak daha az değil daha çok harcamaya söz vermiş bir piyasaya iniyor. Bu, önümüzdeki çeyreklerin bilanço çağrılarında ve yatırım öngörülerinde çözülecek; kavgayı şimdiden bitmiş ilan eden bir forum başlığında değil.

Tartışma

S kadar yorum var.