Teknoloji Forumu

Unity Sentetik Veri Setleri Kullanmayı Tercih Ediyor

Koronavirüs pandemisinin insanları evlere kapatması otonom araç gelişimlerini de olumsuz yönde etkiledi. Bunun sebebi ise veri eksikliği. Veri günümüzde petrol görevi görmektedir. Yapay zeka modellerini eğitmek içinse en önemli yapı taşıdır. Yapay zeka modelleri eğitim süreçlerinde onlara verilen verilerden belirli algoritmalar yardımı ile gerekli şeyleri öğrenir ve bir tahmin mekanizması oluşturur. Otonom araçlarda da durumlar aynı. Örnek vermek gerekirse arabanın trafik lambalarını tanıması için ona aynı bir bebek gibi yüzlerce hatta belki de binlerce trafik lambası fotoğrafı gösterip öğretmelisiniz. Fakat insanların pandemi sebebiyle evlerine kapanması otonom araçları eğitecek verileri elde etmeyi büyük ölçüde engelledi. Otonom araç üreticileri ise bu konuda Unity gibi motorlar ile oluşturdukları sentetik veri setleri ile çözümler üretmeye çalışmakta.

Gerçek dünya verileri gerçekten paha biçilemezdir. Fakat geçtiğimiz günlerde düzenlenen Transform 2020’deki bir sunumda Unity Yetkili Makine Öğrenmesi Mühendisi Cesar Romero, sentetik veri setleri ile otonom araçları, robotları ve daha fazla yapay zeka modeli eğitimini desteklediklerini belirtti. Unity her ne kadar oyun motoru ile ünlü olsa da ulaşım, film, mimari, mühendislik ve inşaat endüstrileri için de araçlar sunmakta. Tüm bu alanlarda çalışan şirket, ihtiyaç duydukları bazı verilerin gerçek dünyadan karşılanmasının çok güç olduğunu bu nedenle sentetik veri setlerinin önemli olduğunu vurguladı.

unity-sentetik-veri-setleri

Sentetik Veri Setleri Veri İhlallerini Ortadan Kaldırabilir

Unity yetkilisi açıklamasında “Öncelikle veri konusunda GDPR (Genel Veri Koruma Yönetmeliği) problemimiz bulunmakta. Bu yönetmelik toplanan verinin toplayan işletmeye değil, bireye ait olduğunu vurgulamaya çalışır. Bu durum da kullanıcıların haklarını ihlal etmeden veri toplama işini oldukça zorlu hale getirmekte. Ancak simüle edilmiş, sentetik veri ile böyle bir sorun kalmamaktadır. Veriler tamamen sentetik olduğundan ihlal edilecek bir gizlilik veya sorgulanacak bir sahipliği yoktur” ifadelerini kullandı.

Ayrıca gerçek dünyada veri toplamak oldukça zor ve pahalı bir işlemdir. Örnek vermek gerekirse otonom araçların kaza durumunu öğrenmesi için onlara kaza içeren görseller sunmamız gerekir. Gerçek hayatta böyle görseller o kadar zor bulunur ki bazen modeli eğitecek yeterli sayıda veriye sahip olamazsınız. Fakat bir simülasyon ortamı ile arabaların davranışlarını belirleyip kaza anında nasıl bir sonuç çıkacağını bulabilirseniz herhangi bir masrafa gerek kalmadan modeliniz için veri bulmuş olursunuz.

Simülasyon ortamında oluşturulan eğitim nesneleri sadece 2 boyutlu olmak zorunda değil. 3 boyutlu nesneler oluşturup onları döndürebilir, yakınlaştırıp uzaklaştırabilir ve arka planı değiştirebilirsiniz. Bu sayede fazla varyasyonda eğitim verisine sahip olursunuz.

Sentetik verilerin, gerçek dünya verilerine göre maliyetinin daha az olduğunu belirtmiştik. Cesar Romero’nun verdiği bu grafik de bunu kanıtlar nitelikte.

sentetik-veri-setleri-istatistik

Romero aynı zamanda sentetik veri seti örneği olarak otonom araçları eğitmek için kullanılan Synthia Veri Seti’ni örnek gösterdi. Makale olarak ise 2017 yılında yayımlanmış robot kolları eğitmek için “Derin Sinir Ağlarını Simülasyondan Gerçek Dünyaya Aktarmak için Etki Alanı Rasgeleleştirmesi” adlı makaleyi örnek gösterdi. Üçüncü bir örnek olarak ise Google Cloud AI Araştırma Ekibi’nin süpermarket ögelerini algılamak için geliştirdikleri modelde kullandıkları sentetik verilerin gerçek verilerden daha efektif olduğunu belirtti.

Romero simülasyonlar ve sentetik veriler için Unity’nin halihazırda açık kaynak olarak sunduğu SynthDet’in kullanılabileceğini belirtti. Fakat kendi donanımınızda çalıştırıyorsanız SynthDet’i kullanmamanız gerektiğini söyleyen Romero, eğer büyük çaplı simülasyonlar gerekiyorsa bulut hizmeti olarak sundukları Unity Simulation’ın kullanılabileceğini belirtti.

Verinin altın değerinde olduğu bu dönemlerde sentetik verilerin çok büyük işlere imza atmamıza yardımcı olacağı şüphesiz.

Teknoloji'den geri kalmamak için e-posta listemize abone olun!

Özgür Doğan (Okunuşu: Özgür Do:an) : Teknoloji içerikleri yazmayı ve okumayı seven kişi, kimse, topluluk.


Yorum yapın