Google, Gemini 3 tabanlı teknolojilerden beslenen yeni nesil açık ağırlıklı model ailesi Gemma 4’ü resmi olarak duyurdu. Üstelik bu kez en dikkat çekici değişim yalnızca teknik değil, lisanslama tarafında da köklü bir dönüşüm söz konusu.
Dört farklı modelle geliyor
Yeni Gemma 4 ailesi, farklı donanım seviyelerine hitap edecek şekilde dört ayrı modelden oluşuyor. Daha sınırlı kaynaklara sahip cihazlar için geliştirilen 2 milyar (E2B) ve 4 milyar (E4B) “Effective” modeller, özellikle akıllı telefonlar ve gömülü sistemleri hedefliyor. Daha güçlü sistemler için ise 26 milyar parametreli Mixture of Experts (MoE) ve 31 milyar parametreli Dense modeller sunuluyor.
Google’ın verdiği teknik detaylara göre 26B MoE modeli, çıkarım sırasında yalnızca 3,8 milyar parametreyi aktif olarak kullanarak yüksek hız sağlıyor. Bu yaklaşım, benzer büyüklükteki modellere kıyasla daha yüksek token üretim hızına ulaşılmasına imkan tanıyor. Öte yandan 31B Dense modeli ise hızdan ziyade maksimum doğruluk ve kaliteye odaklanıyor.
Büyük modeller, teorik olarak tek bir 80GB Nvidia H100 GPU üzerinde bfloat16 formatında çalışabilecek şekilde tasarlanmış. Daha düşük hassasiyetle kuantize edildiklerinde ise tüketici sınıfı GPU’lara da sığabiliyorlar.
Yerelde çalışma ön planda
Gemma 4’ün en kritik özelliklerinden biri, yerel donanımda çalışma yeteneğinin ciddi şekilde geliştirilmiş olması. Google, özellikle gecikme sürelerini azaltmaya odaklandığını belirtiyor. Şirketin açıklamasına göre küçük modellerde “neredeyse sıfır gecikme” seviyesine ulaşıldı. E2B ve E4B modelleri, Qualcomm ve MediaTek ile yapılan ortak çalışmalar sayesinde akıllı telefonlar, Raspberry Pi ve Jetson Nano gibi cihazlar için optimize edildi. Bu modeller, önceki nesle kıyasla daha az bellek ve batarya tüketiyor.
140’tan fazla dil desteği
Gemma 4 ailesinin tamamı yalnızca metinle sınırlı değil. Modeller, görüntü ve video işleyebiliyor, bu da özellikle OCR (optik karakter tanıma) ve grafik analizi gibi alanlarda kullanımını güçlendiriyor. Küçük modeller ayrıca ses girdisi ve konuşma tanıma desteği de sunuyor.
Google, modellerin 140’tan fazla dilde eğitildiğini ve geniş bağlam pencereleri sunduğunu belirtiyor. Edge modellerde 128 bin token, büyük modellerde ise 256 bin token bağlam desteği bulunuyor. Google’ın en iddialı açıklamalarından biri, Gemma 4’ün “parametre başına düşen zeka” seviyesinde önemli bir sıçrama yaptığı yönünde. Şirketin paylaştığı verilere göre 31B modeli Arena AI sıralamasında üçüncü, 26B modeli ise altıncı sırada yer aldı. Bu performans, kendilerinden 20 kat daha büyük modelleri geride bırakmalarıyla dikkat çekiyor.
Gemma 4 ayrıca akıl yürütme, matematik ve komut takibi gibi alanlarda Gemini 3 seviyesine yakın iyileştirmeler sunuyor. Bunun yanında yerleşik fonksiyon çağırma, yapılandırılmış JSON çıktısı ve API entegrasyonları gibi özelliklerle agentic iş akışlarına hazır hale getirildi.
Bunların yanında yeni model ailesi aynı zamanda internet bağlantısı olmadan kod üretimi de yapabiliyor. Google, Gemma 4’ün özellikle büyük varyantlarının yeterli donanım ile bulut tabanlı çözümlere yakın kalitede kod üretebildiğini vurguluyor.
Apache 2.0 lisansa geçildi
Belki de en kritik değişim teknik değil, hukuki tarafta yaşandı. Google, önceki Gemma sürümlerinde kullanılan tartışmalı özel lisansı terk ederek Apache 2.0 lisansına geçti.
Bu değişimle birlikte geliştiriciler artık modelleri serbestçe değiştirebilecek, ticari projelerde kullanabilecek ve kendi altyapılarında veya bulutta özgürce dağıtabilecek.
Gemma 4 modelleri şu anda Hugging Face, Kaggle ve Ollama üzerinden indirilebilir durumda. Ayrıca Google AI Studio ve AI Edge Gallery platformları üzerinden de test edilebiliyor. Yerel kullanım odaklı geliştirilen modeller, isteyenler için Google Cloud üzerinden ücretli olarak da çalıştırılabiliyor.