Teknoloji

LongCat 2.0, Nvidia olmadan GPT-5.5’i kodlamada geride bıraktı

Susan Hill

LongCat 2.0, 1,6 trilyon parametreye sahip, bir milyon token bağlam penceresini işleyebilen ve gerçek yazılım mühendisliği için kullanılan en zorlu kıyaslamada OpenAI‘nin GPT-5.5’ini geçen bir model. Geliştiren ise Meituan — Çin dışındaki insanların, biliyorlarsa bile, yalnızca bir yemek teslimat uygulaması olarak tanıdığı bir şirket.

Model, SWE-bench Pro’da GPT-5.5’in 58,6’sına karşı 59,5 puan aldı. Fark küçük görünebilir; ama bu sistemin nasıl inşa edildiği asıl önemli olan kısım. Meituan, LongCat 2.0’ı 50.000’den fazla yerli Çin AI hızlandırıcısıyla eğitti — 2022’den bu yana Çin’in büyük miktarlarda ithal edemediği Nvidia donanımı kullanılmadı. Çip üreticisi henüz resmî olarak açıklanmadı, ancak teknik çevreler Huawei Ascend 910B’yi işaret ediyor. Doğruysa, Huawei çipleriyle eğitilmiş bir modelin şeffaf kamuya açık kıyaslamalarda en üst düzey performansa ulaştığı ilk örnek olacak.

LongCat 2.0, Mixture-of-Experts mimarisi kullanıyor: her sorguda yalnızca 33 ila 56 milyar parametre etkinleşiyor, bu sayede çıkarsama hızlı kalıyor. Bir milyon tokenlik bağlam penceresi, tüm bir kod tabanını tek seferde okumaya olanak tanıyor. SWE-bench Multilingual’de 77,3; gerçek Unix ortamında gezinmeyi test eden Terminal-Bench’te ise 70,8 aldı.

Resmî duyurudan önce model, yaklaşık iki ay boyunca OpenRouter’da “Owl Alpha” adıyla sessizce çalıştı. Kullananlar olağanüstü kodlama yeteneklerini fark etti ama kaynağını bilmiyordu. Meituan, lansmanın ardından Owl Alpha’nın LongCat 2.0’ın erken değerlendirme aşaması olduğunu doğruladı.

MIT lisansı hikâyenin yalnızca bir bölümü. Mevcut en açık ve ticarî kullanıma en elverişli lisanslardan biri olmasına karşın model ağırlıkları henüz yayımlanmadı. GitHub deposu ve Hugging Face sayfasının her ikisi de “yakında” diyor. Şu an için LongCat 2.0’a yalnızca barındırılan bir API üzerinden erişilebiliyor; indirme, ince ayar ve yerel çalıştırma henüz mümkün değil.

Meituan günlük 50 milyondan fazla yemek siparişi işliyor ve dış piyasaya açılmadan önce sessizce Zhichi adında bir içsel dil modeli geliştirmişti. LongCat 2.0, şirketin ilk kamuya açık modeli ve kıyaslama performansına göre açık lisans altında sunulan en yetenekli kodlama sistemlerinden biri.

Ağırlıklar kullanıma sunulduğunda LongCat 2.0, indirilebilir en güçlü açık kodlama modeli unvanı için Meta’nın Llama 4.1’i ve DeepSeek-V4 Pro ile doğrudan rekabete girecek. Bu sonuçları mümkün kılan yerli çiplere ilişkin soru, AI dünyasının çok ötesinde anlam taşıyacak.

Etiketler: , , , , ,

Tartışma

S kadar yorum var.