Teknoloji

Ollama 0.22.1, Gemma 4 tool calling özelliğini dizüstünüzde API anahtarı olmadan çalıştırıyor

Susan Hill

Ollama 0.22.1, ciddi yerel yapay zekâ çalışması için anlamlı olan iki yeteneği nihayet destekleyen güncellenmiş bir Gemma 4 renderer’ı getiriyor: açık düşünme modu ve fonksiyon çağrısı, yani tool calling. Tool calling, modelin bir dış fonksiyonu ne zaman çağıracağına kendi karar vermesini sağlıyor — bir web sayfası açmak, bir veritabanına sorgu atmak, bir hesap çalıştırmak — ve sonucu yeniden kendi muhakemesine örüyor. Düşünme modu, modelin ara adımlarını dışarı veriyor, böylece bir uygulama bunları yakalayıp üzerine işlem yapabiliyor. Her ikisi de büyük bulut API’lerinin para aldığı özelliklerdi. Her ikisi de şimdi hiçbir dış servis aracılığı olmadan, yerelde Gemma 4 üstünde çalışıyor.

Bu duyurunun başka bir model çıkışından daha ağır basmasının nedeni donanım aritmetiği. Google’ın Apache-2.0 lisansıyla yayımladığı Gemma 4 ailesi dört boyutu kapsıyor: E2B, E4B, 26B A4B ve 31B. Küçük varyantlar, tümleşik grafiği ve on iki ila on altı gigabayt RAM’i olan güncel bir dizüstü bilgisayarda çalışıyor. 26B A4B ve 31B sürümleri masaüstü GPU istiyor ama yine de açıkça tüketici sınırları içinde kalıyor. Eskiden ücretli bir API sözleşmesini ya da dört haneli fiyatlı bir ev sunucusunu zorunlu kılan aynı mimari, makul ölçüde modern bir makinesi olan herkes için bir cumartesi öğleden sonrası kurulumuna dönüşüyor.

Kod yazmayanlar için pratik sonuç şu: bir bütün ajan uygulamaları sınıfı — e-postanızı okuyan, yanıt taslakları hazırlayan, belge indiren, form dolduran, toplantı özetleyen türden uygulamalar — bu verileri artık üçüncü taraf sunucuya yollamak zorunda değil. Gerçek ajan otomasyonu isteyen, mahremiyetine düşkün bir kullanıcının şimdiye kadar iki seçeneği vardı: bir bulut sağlayıcısının veri politikasına güvenmek ya da yerelde tool calling’i olmayan çok daha zayıf bir model çalıştırmak. Orta yol bir boşluktu ve Ollama 0.22.1 bu boşluğu Gemma 4 sıkletinde kapatıyor.

Şüpheci okuma şu: Ollama ve Gemma 4, bulut sınırının karşılığı değil. Yerelde barındırılan bir 31B model, karmaşık muhakemede ne Anthropic’in Claude’una ne de OpenAI’nin GPT-5’ine yetişiyor. Uzun zincirler üzerinde araç çağrısı doğruluğu, küçük varyantlarda fark edilir biçimde daha kötü. Çok kipli girdiler çalışıyor, sadece daha yavaş. Ve entegrasyon yükü kullanıcının üstüne biniyor: Gemma 4 artı Ollama tabanlı, bitmiş bir SaaS akışıyla yarışabilecek kadar cilalı bir ajan uygulamasını henüz kimse kurmadı. Donanım tavanı ve yazılım cilası hâlâ gerçek eksikler.

Sürüm, Ollama’nın macOS, Linux ve Windows için standart kurulum programı üzerinden şu anda kullanıma açık. Gemma 4 ağırlıkları, Ollama’nın model kütüphanesinde gemma4 ad alanı altında barındırılıyor; 0.22.1 ile gelen çalışma zamanı değişikliği, indirildikten sonra hangi boyuta olursa olsun otomatik olarak uygulanıyor.

Tartışma

S kadar yorum var.