Dijital animasyon şirketleri gün geçtikçe kendilerini daha da geliştirip karşımıza harika ürünlerle çıkabiliyorlar. Yapılan bazı animasyonlar insana gerçeği aratmayacak derecede güven veriyor. Bu şirketler kendilerini daha da geliştirmek istediklerinden günümüzün popüler teknolojisi olan yapay zekaya başvurma çabasındalar. Pixar animasyon şirketi de kaliteyi iyileştirmek ve maliyeti düşürmek adına GAN ağlarını (Generative Adversarial Networks) kullanıyor.
Pixar Animasyon Stüdyoları’nın direktörü olan Vaibhav Vavilala, bu alanda çalışmalar yaptıktan sonra bu ilerlemelerin başına geçti. Vaviala geçtiğimiz günlerde düzenlenen Transform 2020 konferasında açıklamalarda bulundu.
Vavilala son olarak Incredibles 2 (İnanılmaz Aile 2) ve Toy Story 4 (Oyuncak Hikayesi 4) gibi Pixar filmlerinde aydınlatma ve render optimizasyonu üzerine çalışan ekiple birlikte çalıştı. Ancak birkaç yıl önce Derin Öğrenilmiş Süper Çözünürlük adlı bir konsepte odaklanmaya başladı ve Pixar’da birlikte çalıştığı Mark Mayer ile çalışmalarını detaylandıran bir makale yayımladı.
2K ve 4K Çözünürlük Oldukça Zahmetli
Vaibhav Vavilala sunumu sırasında dijital animasyon endüstrisinin karşılaştığı en büyük zorluğun, 2K ve 4K gibi yüksek çözünürlükle animasyon oluşturmak olduğunu belirtti. Bu animasyonlar oluşturma zamanı ve maliyet bakımından şirketleri oldukça zora sokmakta.
Vavilala açıklamasında “2K çözünürlükte bir kare oluşturmak en az 50 CPU saati alır. 90 dakikalık bir film için 24 kare hazırlıyoruz ve her çekimi sanatçıların tekrarladığı gibi birçok kez yapıyoruz. Ayrıca belli zamanlarda uğraşmamız gereken birden fazla film oluyor. Tüm bunlar kaynaklarımızı oldukça zora sokuyor. 4K gibi daha yüksek çözünürlükte bu pikseller 4 katına maliyet ise 2 katından fazlasına çıkıyor.” ifadelerini kullandı.
Vavilala ayrıca açıklamasında “Render daha iyi teknolojilerle daha ucuz hale geldikçe, yapımcılar genellikle daha fazla ışık, daha fazla geometri, daha fazla sis ve daha karmaşık görüntüler gibi şeylerle bu kaynakları tüketiyorlar.” ifadelerine yer verdi.
Bu sorunlar Vavilala’yı Derin Öğrenilen Süper Çözünürlük üzerine çalışmaya sürükledi. Bu teknik ile animatörler düşük kalitede animasyonlar üretebilecekti ve yapay zeka bunları daha yüksek çözünürlüklü hale getirecekti.
Vavilala bu fikri geliştirmek için PyTorch ortamı kurdu ve Nvidia GPU’ları ile Linux üzerinde bir demo hazırladı. Ardından oluşturduğu ekip, modeli Pixar’ın filmlerinden düşük ve yüksek çözünürlüklü görüntüler ile eğitmeye başladı.
Ekip ışık ve renk ayarlarını doğru şekilde öğretmenin oldukça zor olduğunu gördükten sonra GAN yapay sinir ağlarını kullanmaya karar verdi. GAN istenilen sonucu elde etmek için iki sinir ağının birbiri ile etkileşimde olduğu bir yapıdır. Yeni görüntüler üretmeye çalışan “Generator” ve gerçek ile sahteyi ayırt etmeye çalışan “Discriminator” ile GAN yeni nesil ve yüksek performanslı bir sinir ağı.
Vavilala son modelleri, 1K’lık görüntüleri 2K’ya çıkarmak için kullandığını ve %50 ve %75 arasında bir tasarruf elde ettiklerini açıkladı. Şu an için ümit vadediyor. Ama tahminimizce yakın zamanda Pixar GAN ağlarını aktif bir şekilde kullanıyor olacak.