Teknoloji

DeepSeek V4 GPT-5’in beşte biri fiyatına ve Nvidia çipi olmadan çalışıyor

R1 ile Nvidia hisselerini dibe çekmiş olan Çinli laboratuvar, daha büyük, belirgin biçimde daha ucuz ve Çin donanımı için optimize edilmiş bir sürümle geri döndü. V4-Pro bugüne kadar inşa edilmiş en büyük açık kaynak yapay zeka modeli; her iki versiyon da MIT lisansıyla Hugging Face'te hazır ve fiyatlandırma, OpenAI ile Anthropic'in çok altında.
Susan Hill

DeepSeek, V4-Pro ve V4-Flash modellerinin önizleme sürümünü yayınladı — iki açık kaynak dil modeli, net bir teze yaslanıyor: bir milyon tokenlık bağlamı işlemek artık bir kapasite sorunu değil, yalnızca bir verimlilik meselesi. V4-Pro toplam 1,6 trilyon parametre içeriyor; bunların 49 milyarı her sorguda aktif — bir kod tabanının tamamını ya da bir kitabın bütününü tek bir istemde işlemeye yetecek kapasite. Bir açık model ilk kez matematik, programlama ve ajan görevlerinde kapalı modellerin üst sınırıyla ciddi biçimde yarışıyor — hem de maliyetin küçük bir kısmıyla.

Her iki model de MIT lisansı ile birlikte geliyor ve ağırlıklar Hugging Face’te yayımlanmış durumda. V4-Flash toplam 284 milyar parametre ve 13 milyar aktif parametre ile verimli versiyon — kuantize bir sürümünün üst seviye bir dizüstü bilgisayarda çalışabileceği kadar kompakt. V4-Pro amiral gemisi: diskte 865 gigabayt yer kaplıyor ve bulut dağıtımı ile araştırma laboratuvarları için tasarlandı. Her ikisinin de bağlam penceresi bir milyon token — Google’ın Gemini modelini yakalayan ve rakip açık modellerin çoğunun sunduğunun iki katını veren bir sıçrama.

YouTube video

Mimari açıdan kilit hamle Hybrid Attention adını taşıyor: DeepSeek iki sıkıştırma tekniğini birleştiriyor ve bellek maliyetini öyle keskin biçimde aşağı çekiyor ki V4-Pro aynı bağlam uzunluğunda V3.2’nin gerektirdiği hesaplama gücünün yalnızca yüzde 27’sini ve önbelleğin yüzde 10’unu kullanıyor. V4-Flash daha da ileri gidiyor. Pratikte bunun anlamı şu: V4-Pro ile bir milyon tokenlık bir istemi sunmak, bir önceki nesil ile 100 bin tokenlık bir istemi sunmaktan daha az maliyet çıkarıyor. Bu teknik bir ayrıntı değil — uzun bağlamlı modellerin laboratuvar gösteriminden gerçek ticari üretime geçebilmesinin ekonomik ön koşulu.

Fiyat kırılması, lansmanın en sert vurduğu nokta. V4-Flash giriş tokenlarının milyonu için 0,14 dolara satılıyor — OpenAI’ın GPT-5.4 Nano modelinin bile altında. V4-Pro giriş tokenlarının milyonu için 1,74 dolar, çıkış için 3,48 dolar — Anthropic’in Claude Opus 4.7 için aldığı ücretin üçte biri ve OpenAI’ın GPT-5.5 için aldığının beşte biri. Programlama ölçütlerinde V4-Pro Codeforces puanı olarak 3.206’ya ulaşıyor — DeepSeek’e göre bu, modeli dünya genelinde yarışan insan programcılar arasında 23. sıraya yerleştirecek bir değer.

Jeopolitik okuma en az karşılaştırma puanları kadar ağır basıyor. DeepSeek V4’ü Huawei’nin Ascend 950 çipleri ve Çinli üretici Cambricon’un silikonu için optimize etti; Nvidia ya da AMD’ye performans kalibrasyonu için erken erişim vermedi — sektörün standart uygulamasının tersine. Lansman, yıllardır Washington’ın ihracat kısıtlamaları altında çalışan tüm Çin teknoloji zincirinin ticari bir dayanıklılık testi işlevi görüyor. Avrupa açısından soru daha rahatsız edici bir hal alıyor: Pekin egemen ve eksiksiz bir zincir kuruyor — açık ağırlıklar, yerli çipler, kendi çıkarım yazılımı — Washington ise kendisininkini yasal yoldan kapatıyorken, Avrupa’nın dijital egemenliği her iki bloğun altyapısına yapısal olarak bağımlı kalıyor.

Ciddi çekinceler var. V4 önizleme sürümü, üretim sürümü değil; bağımsız üçüncü taraf karşılaştırma testleri henüz tamamlanmadı. DeepSeek’in kendi teknik raporu modelin sınır kapasitesinde GPT-5.4 ve Gemini 3.1 Pro’nun üç ila altı ay gerisinde olduğunu kabul ediyor. Selefi R1, lansmanından birkaç hafta sonra birçok ABD eyaletinde, Avustralya’da, Tayvan’da, Güney Kore’de, Danimarka’da ve İtalya’da yasaklanmış ya da kısıtlanmıştı — V4 bu pazarlarda aynı düzenleyici riski aynı biçimde devralıyor. Pentagon yüklenicilerinin ise ABD’nin 2026 NDAA yasası uyarınca DeepSeek modellerini kullanmaları yasak, açık bir istisna alınmadıkça.

Bu kısıtlı bölgelerin dışında erişim anında. DeepSeek’in web chatbotu V4-Pro’yu Expert modu üzerinden, V4-Flash’ı Instant modu üzerinden ücretsiz olarak sunuyor ve geliştiriciler API’yi basitçe model adını deepseek-v4-pro ya da deepseek-v4-flash olarak değiştirerek çağırabiliyor.

Lansman, DeepSeek-R1’in 20 Ocak 2025’te küresel yapay zeka piyasalarını sarsmasından tam bir yıl sonrasına denk geldi — takvim bilinçli seçilmiş. Önizleme aşamasının ardından kesin API fiyatlandırması henüz belirsiz ve eski uç noktalar deepseek-chat ile deepseek-reasoner 24 Temmuz 2026’da devre dışı bırakılacak; tüm trafik otomatik olarak V4’e yönlendirilecek. Burada söz konusu olan tek bir karşılaştırma puanının ötesine geçiyor: rakip bir gücün Amerikalı tedarikçilere bağımlı kalmadan eksiksiz, rekabetçi ve düşük maliyetli bir yapay zeka yığını sunabildiğinin ilk kamusal kanıtı bu — ve bu kanıt tek başına, bundan sonraki her egemen yapay zeka stratejisi için oyun kurallarını yeniden yazıyor.

Tartışma

S kadar yorum var.