DALL-E 2, Midjourney ve Stable Diffusion gibi yapay zekÂlar, hayatımıza istediğimiz gorseli sadece yazıyla anlatarak oluşturma gibi olağanustu bir imkÂnı soktu. Tabii yeni gelişen her teknolojide olduğu gibi bu teknolojilerin de gelişme hızı, inanılmaz miktarda yuksek seviyede.
Bu teknolojilerin ozellikle acık kaynak olarak yayınlanması halihazırda bu gelişime buyuk bir katkı sunarken, bugun Stable Difusion ’dan heyecanlandıran duyuru geldi. Yapay zekÂnın ardındaki ekip, Stable Diffusion ’un ikinci versiyonunu kullanıma sundu.
“Stable Diffusion 2.0” neler sunuyor?
CompVis tarafından geliştirilen yapay zekÂnın yeni surumu Stable Diffusion 2.0, metinden gorsel oluşturma imkÂnını yepyeni boyuta taşıyacak. LAION-5B veri seti ile eğitilen yeni model, daha yuksek cozunurluklu gorseller oluşturabilecek, duşuk cozunurluklu gorselleri yuksek cozunurluğe kavuşturabilecek ve gorseller icin cok daha tutarlı alternatifler sunabilecek. Gelin, tum bunlara detaylarıyla bakalım.
Cok daha yuksek cozunurluklu gorseller elde edilebilecek:
Stable Diffusion 2.0 ile birlikte kullanıcılar, 512x512 veya 768x768 cozunurluklerinde cıktılar alabilecekler. Ek olarak oluşturulan tum fotoğraflar, LAION ’un NSFW filtresinden gecerek yetişkin iceriklerden arındırılacak.
Tabii istediğiniz fotoğrafı alırsanız, bunun cozunurluğunu cok daha yuksek seviyelere taşıyabileceksiniz:
Yeni surum, artık 2048x2048 piksel ve daha yuksek cozunurlukte ‘upscale ’ imkÂnı da sunacak. Oluşturduğunuz gorsellerden beğendiğiniz orneği alıp, 512x512 pikselden cok daha yuksek cozunurluklere taşıyabileceksiniz.
Gorselden gorsel oluşturmada da yeni geliştirmeler yapıldı:
‘depth2img ’ adlı yeni model ile birlikte 2.0 surumu, gorselleri cok daha iyi bir şekilde analiz edebilecek. Bu sayede yapay zekÂ, sunduğunuz bir gorselin farklı alternatiflerini daha yuksek anlam bağıyla oluşturabilecek.