ChatGPT neden aniden Arapça konuşmaya başladı?

ChatGPT, son dönemde Amerika’daki kullanıcılarını oldukça tuhaf bir “dil labirenti” içine sürükledi. Normal şartlarda İngilizce akıcı bir şekilde diyalog kuran sistemin, son bir aydır yanıtlarının arasına hiçbir mantıklı sebep yokken Arapça başta olmak üzere farklı dillerden kelimeler serpiştirdiği rapor ediliyor.

Sosyal medya mecralarında hızla yayılan ekran görüntüleri, mutfaktaki yemek tarifinden ciddi bir iş raporuna kadar her türlü metnin aniden yabancı alfabelerle bölündüğünü kanıtlıyor. Birçok kullanıcı bu durumu başlangıçta cihazlarındaki bir virüs veya bölgesel bir ayar hatası sansa da sorunun çok daha derin ve sistemsel olduğu anlaşıldı. Reddit platformunda deneyimlerini paylaşan bir kullanıcı, Arapça konuşulan bir bölgede olmamasına rağmen hem mobil hem de masaüstü cihazlarında aynı karmaşayı yaşadığını belirtiyor. Örneğin, bot bir kek tarifi verirken malzemelerden birini aniden Arapça harflerle yazabiliyor. Üstelik bu durum sadece Arapça ile sınırlı kalmayıp; İbranice, Çince veya Ermenice gibi dillerin de zaman zaman devreye girdiği görülüyor.

Kelime seçimi değil, matematiksel bir tercih

Kamuoyunda “yapay zeka sanrıları” ya da “halüsinasyon” olarak nitelendirilen bu garip davranışın arkasında aslında sistemin temel çalışma mantığı yatıyor. Büyük dil modelleri metinleri kelime kelime değil, “token” (belirteç) adı verilen küçük veri parçacıkları halinde işler. Bu parçalar bazen bir harf dizisi, bazen de bir ekten ibarettir.

Yapay zeka bir sonraki adımı hesaplarken tamamen matematiksel olasılıklara ve verimliliğe odaklanıyor. Eğer İngilizce bir kavramı ifade etmek için üç farklı veri parçası kullanması gerekiyorsa ve aynı anlamı taşıyan başka bir dildeki (örneğin Arapça) tek bir parça daha “kısa ve verimli” görünüyorsa, sistem tamamen işlemci gücünden tasarruf etmek adına o yabancı kelimeyi cümlenin ortasına yerleştirebiliyor. Yani bot aslında bilinçli bir dil değişikliği yapmıyor; sadece hedefe giden en kestirme ve en ucuz veri yolunu seçiyor.

Anlamsız karakterlerden anlamlı sızıntılara

OpenAI geçmişte benzer sorunlar yaşamış olsa da bu son vaka diğerlerinden farklı. Daha önceki hatalarda robot tamamen anlamsız karakter dizileri üretirken, şimdiki durumda araya giren kelimeler bağlamla kusursuz bir uyuma sahip. Örneğin, düşük yağlı bir üründen bahsederken “az” kelimesinin yerini tam olarak Arapça karşılığı alıyor. Bu durum, hatanın rastgele bir veri bozulmasından ziyade sistemin karar verme mekanizmasındaki bir değişimden kaynaklandığını düşündürüyor.

Kullanıcı cephesinde ise şaşkınlık ve merak söz konusu. Bir kullanıcının bu durumu robota doğrudan sorması üzerine aldığı “Yanlışlıkla araya sızmış” cevabı, yapay zekanın kendi hatasını bile absürt bir insani dille savunmaya çalıştığını gösteriyor. OpenAI yetkililerinden bu yeni nesil dil karmaşası hakkında henüz kapsamlı bir teknik analiz gelmemiş olsa da bu durum, milyarlarca dolarlık yapay zeka sistemlerinin hala ne kadar öngörülemez olabileceğini bir kez daha kanıtlaması açısından önemli.