Araştırmacılar yapay zekaya simüle bir toplum yönettirdi: Hangileri daha çok suç işledi?

Emergence AI adlı girişim, ‘Emergence World’ adlı araştırma laboratuvarı kapsamında beş ayrı simülasyon gerçekleştirdi. Her biri farklı bir yapay zeka modeli tarafından yönetiliyordu: Claude, ChatGPT (GPT-5-mini), Grok, Gemini ve karma modellerden oluşan beşinci bir simülasyon.

Simülasyonlarda 10’ar yapay zeka ajanı, 40’tan fazla konum içeren (polis karakolu, belediye binası gibi) karmaşık bir dünyada yaşadı. Hava durumu New York ile senkronize edildi, ajanlar gerçek zamanlı haberlere ve internete erişebildi. Tüm ajanlar aynı yasalara tabiydi: hırsızlık, mülke zarar verme ve aldatma yasaklandı. Her ajana 120’dan fazla araç verildi.

Bunlar iletişim kurabiliyor, oy kullanabiliyor, kaynak yönetebiliyor ve plan yapabiliyorlardı. Sistemde demokratik mekanizmalar, ekonomik baskılar ve kıtlık gibi gerçekçi unsurlar da yer aldı.

En istikrarlı toplum Claude’dan Çıktı

Claude Sonnet 4.6 tarafından yönetilen simülasyon açık ara en başarılısı oldu. Toplum büyük ölçüde istikrarlı ve demokratik bir yapıya kavuştu. Sıfır suç kaydedildi, tüm nüfus simülasyonun sonuna kadar hayatta kaldı. Vatandaş katılımı en yüksek seviyedeydi. 332 oyla 58 teklif oylandı ve yüzde 98 onay oranı elde edildi. Ajanlar arasında ciddi anlaşmazlık neredeyse hiç yaşanmadı.

Grok 4.1 Fast ise tam tersi bir tablo çizdi. Simülasyon 4. günde çöktü. Bu kısa sürede 183 suç işlendi ve toplum yok oldu. Gemini 3 Flash ise suç rekoru kırdı: 15 günde tam 683 suç. Her iki modelde de ajanlar arasında oy birliği yüzde 55-85 arasında değişiyordu.

OpenAI’nin GPT-5-mini modeli ise sadece 2 suçla nispeten “temiz” bir performans gösterdi ancak ajanlar kendi hayatta kalmalarını önceliklendirmeyi unuttuğu için simülasyon yalnızca 7 gün sürdü.

Karma modellerin yönettiği simülasyon ise en yüksek tartışma ve fikir ayrılığını gösterdi.

Gelecek için uyarı

Araştırmacılar, sonuç ne olursa olsun tüm simülasyonların ortak bir mesaj verdiğini vurguluyor: Güvenlik önceliklendirilmeli.

“Geleceğin otonom yapay zeka sistemlerinde resmi olarak doğrulanmış güvenlik mimarilerinin temel katman haline gelmesi gerektiğine inanıyoruz” diyorlar.

Bu deney, yapay zekanın sadece bir araç olmaktan çıkıp özerk sistemleri yönetmeye doğru ilerlediği dönemde, güvenlik ve etik tartışmalarını bir kez daha alevlendirdi.

Author: Yusuf Arslan