Google Whisk, Eğlence Amaçlı Görseller Kullanarak Komut Vermenize Olanak Tanıyor

Google, şu anda deneysel olan Whisk adlı başka bir üretken yapay zeka aracıyla ayrıntılı metin istemleri yerine girdi olarak görüntü göndermenize ve karşılığında yeniden düzenlenmiş bir görüntü almanıza olanak tanıyor. Araçta konu, stil ve sahne gibi çeşitli yönler için birden fazla görüntü girebiliyorsunuz. Whisk daha sonra Gemini’yi kullanarak arka planda bir metin istemi oluşturuyor ve bunu Google’ın görüntü oluşturma modeli Imagen 3‘e iletiyor.

Referans olarak, metinden görüntüye modeli bu yılın başlarında piyasaya sürüldü ve Google, Imagen 3’ün önceki modellerinden daha iyi ayrıntı, daha zengin aydınlatma ve daha az dikkat dağıtıcı eser içeren görüntüler üretebilen en yüksek kaliteli görüntü modeli olduğunu iddia ediyor.

Google, bir blog yazısında yeni üretken yapay zeka aracının “konunuzun özünü yakaladığını, tam bir kopyasını yakalamadığını” açıkladı. Araç, giriş görüntüsünden tüm özellikleri çıkarmıyor. Bu da çıktı görüntüsünün beklentilerinizden farklı olmasına neden olabilir. Örneğin, oluşturulan görüntünün konusu farklı bir cilt tonuna, boya veya saç stiline sahip olabilir.

Whisk, oluşturulan görüntüde kaybolmuş olabilecek önemli öğeleri telafi etmek için metin istemini ayarlamanıza olanak tanıyor. Google, “Bu özelliklerin projeniz için önemli olabileceğini ve Whisk’in hedefi kaçırabileceğini anlıyoruz, bu nedenle altta yatan istemleri istediğiniz zaman görüntülemenize ve düzenlemenize olanak tanıyoruz,” dedi.

Whisk şu anda Google’ın deneysel üretken yapay zeka özelliklerine erişim sağlayan Google Labs programına kaydolan ABD’de yaşayan kişilere sunuluyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir