Kısa bir süre önce internette "Nano Banana" adıyla ortaya çıkan ve yapay zeka kıyaslama platformu LMArena'da zirveye oturan yeni yapay zeka modelinin Google DeepMind tarafından geliştirildiği ortaya çıktı.



Google, modeli Gemini uygulamasına entegre ettiğini duyurdu.



Nano Banana'yı deneyen kullanıcılar, modelin görsel düzenlemede bir devrim olabileceğini iddia ediyordu. Bazıları, bu yapay zeka modellerinin Photoshop gibi fotoğraf düzenleme uygulamalarının yerini alabileceği görüşünde.



TUTARLI VE GERÇEKÇİ DÜZENLEMELER



Google, yılın başlarında Gemini'ye temel görsel düzenleme yetenekleri eklemişti. Ancak önceki sistemlerde, her düzenlemede görüntünün beklenmedik biçimde değişmesi sık görülen bir sorundu. Görüntünün kullanıcının istediği gibi düzenlenebilmesi için birçok deneme yapmak ve bir dizi komut girmek gerekiyordu.



Yeni model, resmi adıyla Gemini 2.5 Flash Image, bu sorunu büyük ölçüde çözüyor. Google'a göre model, yapılan düzenlemelerde benzersiz bir tutarlılık sağlıyor ve değişiklikler sırasında orijinal görselin ayrıntılarını hatırlayabiliyor.



Bu özellik sayesinde kullanıcılar, örneğin bir kişinin fotoğrafını yükleyip kıyafetini değiştirebiliyor ya da farklı stillerde yeniden hayal edebiliyor.

Birden fazla düzenleme üst üste yapılsa bile, sonuçlar hâlâ orijinal fotoğraftaki kişiye benziyor.



KOLAJ YETENEĞİ



Yeni model yalnızca tek bir görsel üzerinde değişiklik yapmakla sınırlı değil. Kullanıcılar birden fazla fotoğrafı birleştirerek yeni kompozit görüntüler oluşturabiliyor. Google'ın verdiği örnekte, ayrı ayrı yüklenen bir kadın ve bir köpek fotoğrafı, köpeğin kucağa alındığı yeni bir sahneye dönüştürüldü.



Ayrıca model, daha soyut kombinasyonlar yaparak kullanıcıların yönlendirmelerine göre özgün görüntüler üretebiliyor.



Google, yeni düzenleme aracının salı günü itibarıyla tüm Gemini kullanıcılarına sunulduğunu açıkladı. Model ayrıca yakın zamanda Gemini API, AI Studio ve Vertex AI üzerinden geliştiricilere de açılacak.



Google DeepMind ürün sorumlularından Nicole Brichtova, modelin özellikle tüketici kullanım senaryoları için tasarlandığını söyledi. Buna ev ve bahçe projelerini görselleştirmek, birden fazla referansı (örneğin bir kanepe, oturma odası fotoğrafı ve renk paleti) tek bir tasarımda birleştirmek gibi uygulamalar da dahil.



Brichtova, "Bu güncelleme düzenlemeleri çok daha sorunsuz hâle getiriyor ve çıktılar, istediğiniz her şey için kullanılabilir" dedi.



NASIL KULLANILIR?



Geliştiriciler API üzerinden token bazlı ödeme yağarken (görsel başına 0,039 dolar), bireysel kullanıcılar ise bu modele erişimi sağlayan Google AI Pro gibi abonelik planları kapsamında ödeme yapıyor.



Google AI Pro planını kullanan aboneler, aylık yaklaşık 20 dolar civarında ödüyor. Bu plan, bazı gelişmiş modellere ve özelliklere erişim sunuyor.



Ancak şunu belirtmek önemli: Gemini uygulamasında Flash Image'ın bireysel kullanıcılar için ayrı bir fiyatlandırması yok. Modelin dahil olduğu plan kapsamında erişim sağlanıyor.



Yeni modeli denemek isteyenler, Google Play Store veya App Store'dan "Gemini" uygulamasını indirebilir. Ardından menüden veya ayarlardan Gemini Advanced / AI Pro yükseltmesine girerek abone olmak mümkün.



Web sürümüne ise "gemini.google" sitesinden ulaşılıyor. Sol altta veya profil kısmında "Gemini Advanced'e yükselt" seçeneğinden abonelik başlatılabiliyor.



Uygulamanın akışı ise diğer yapay zeka araçlarıyla benzer. Uygulamada "görsel yükle" seçeneğini seçtikten sonra düzenleme için komut veriliyor. Örneğin: "Bu kişinin kıyafetini 90'lar tarzına çevir" veya "Arka planı sil ve yerine kumsal ekle" gibi komutlar vermek mümkün.



REKABET KIZIŞIYOR



Google'ın hamlesi, OpenAI'nin mart ayında GPT-4o ile duyurduğu görsel üretim özelliklerinin ardından geldi. O dönem ChatGPT'nin kullanımında büyük artış yaşanmış, sosyal medyada "Studio Ghibli" tarzında üretilen görseller büyük yankı uyandırmıştı.



Meta da geçen hafta Midjourney'den görsel modelleri alacağını duyurmuştu. Almanya merkezli Black Forest Labs'ın FLUX modelleri de hâlen sektördeki en yüksek performanslı çözümler arasında gösteriliyor.



Google, Gemini'nin gelişmiş görsel düzenleme yeteneklerinin, şirketin OpenAI karşısındaki kullanıcı farkını kapatmasına yardımcı olabileceğini düşünüyor. Şu anda ChatGPT haftalık 700 milyon kullanıcıya ulaşırken, Google CEO'su Sundar Pichai, Temmuz'daki kazanç çağrısında Gemini'nin aylık 450 milyon kullanıcıya sahip olduğunu açıklamıştı.



DEEPFAKE RİSKİNE KARŞI ÖNLEMLER



Google'ın diğer yapay zeka görüntü modellerinde olduğu gibi, Gemini 2.5 Flash Image ile üretilen her görselin köşesinde "AI" ibaresi bulunuyor. Ayrıca görsellerde, düzenlense bile arka planda tespit edilebilen görünmez SynthID dijital filigran yer alıyor.



Google bu şekilde deepfake tehdidine karşı önlem almak istiyor. Ancak şirket, sosyal medyada hızla paylaşılan ve dezenformasyon için kullanılan görsellerde bu tür işaretlerin gözden kaçabileceğini de kabul ediyor.



Geçmişte Gemini'ın görüntü üretimindeki sorunlar gündeme oturmuştu. Şirket özellikle tarihsel açıdan hatalı insan görselleri (örneğin Elon Musk'ı siyahi resmediyordu) nedeniyle özür dileyip sistemi geri çekmek zorunda kalmıştı. Şirket şimdi daha dengeli bir yaklaşım geliştirdiğini belirtiyor.



Google'ın kullanım şartları, izinsiz mahrem içerik üretimini açıkça yasaklıyor. Bu noktada Google, rakiplerinden farklılaşıyor. Örneğin Elon Musk'ın xAI şirketinin geliştirdiği Grok, ünlülere benzeyen cinsel içerikli yapay görsellerin üretilmesine izin vermişti.

