Metinden görsel oluşturan yapay zekâlar gittikçe yaygınlaşırken son zamanların popüler yapay zekâ sistemi DALL-E’nin arkasındaki şirket OpenAI’dan yeni bir hamle geldi. Elon Musk’ın da kurucuları arasında yer alan ABD merkezli şirket, dün yeni yapay zekâsı Point-E’yi tanıttı. Yeni sistem, yapay zekâ alanında büyük ses getireceğe benziyor.
Yeni yapay zekâ, genel olarak DALL-E’ye benzese de amacı farklı. Point-E, gittikçe yaygınlaşan 3D modelleme yapmada kullanıyor ve metinleri direkt olarak 3 boyutlu objelere dönüştürebiliyor. Bu tarz sistemlerin mevcut olduğunu belirtelim; ancak OpenAI’ın yeni yapay zekâsı çok daha hızlı ve verimli. Örneğin Google’ın DreamFusion’ı benzer işlevler için saatlere ve birden fazla GPU’ya ihtiyaç duyarken Point-E, bunu birkaç dakikada tek bir GPU ile yapabiliyor.
Point-E, metinleri önce görsele daha sonra 3D modellere dönüştürüyor
Point-E, modelleri ilk başta metinleri sentetik 3D görsellere, sonrasında ise çıktıyı renkli ve 3 boyutlu bir nokta bulutuna dönüştürerek yapıyor. ChatGPT’nin de arkasında olan OpenAI’dan Alex Nichol de yaptığı açıklamalarda sürecin saniyeler içinde gerçekleştirilebildiğini ve pahalı optimizasyon prosedürlerini ihtiyaç olmadığına dikkat çekiyor.
Paylaşılan örneklerden Point-E’nin oluşturduğu 3 boyutlu nesneleri görebiliyoruz. Bunlara bakarak oldukça başarılı olduğunu söyleyebiliriz. Ancak OpenAI, yaptığı açıklamalarda sistemin objelerin bazı kısımlarını kaçırabileceğini ve henüz mükemmel olmadığını da ekliyor. Bu da en sonda karşımıza çıkan modellerin şimdilik bozuk şekillere sahip olabileceğini ortaya koyuyor.
OpenAI araştırmacıları, Point-E’nin 3 boyutlu baskı gibi yollarla gerçek nesneler üretmek için kullanılabileceğini ifade ediliyor. Sistem biraz daha geliştirildiğinde oyun ve animasyon gibi konularda da kullanılma potansiyeline sahip. Bu da yeni yapay zekânın sinemadan metaverse’e, uzay araştırmalarından oyunlara kadar birçok farklı alanda kullanılan 3 boyutlu modellemeye büyük katkı sağlayabileceğini gösteriyor.