Derin Öğrenme Nedir? Yapay Sinir Ağları Ne İşe Yarar?

Yapay zekanın hayatımıza girmesiyle onun getirdiği yeni terimler de daha sık duyulmaya başlandı. Farklı alt dallara sahip olan yapay zeka konusunda, son zamanlarda çokça söz edilen ve üzerine çalışma yapılan alan derin öğrenmedir. Otonom araçlardan, yüz tanıma sistemlerine, hastalık teşhislerinden, doğal dil işleme modellerine kadar pek çok alanda kullanılan derin öğrenme nedir?

Derin Öğrenme Nedir?

Derin Öğrenme; göreve özgü daha dar yapay zeka algoritmalarının aksine, verilere özgü öğrenme şekline sahip olan bir makine öğrenmesi alt dalıdır. Derin öğrenmede, öğrenmeler supervised (denetimli), unsupervised (denetimsiz) ya da semi-supervised (yarı denetimli) olabilir.

Derin öğrenme insan beyninin işleyiş yapısını, nöronların etkileşimini anlamaya çalışılırken ortaya çıkmış bir disiplindir. Derin öğrenme insan beynine benzeyen yapay sinir ağları ile çalışır. Günümüzde hesaplama gücünün artması sebebiyle kesin bir sayı koyulmasa da çok katmanlı (>100 katman) yapay sinir ağlarına derin öğrenme denir. Yapay sinir ağlarını derin öğrenme ile eğitmek, çok sayıda etiketli verinin yanı sıra muazzam bir bilgi işlem gücü gerektirir.

Yapay Zeka, Makine Öğrenmesi, Derin Öğrenme

Derin öğrenme, makine öğrenmesinin bir alt dalıdır. Makine öğrenmesi ise aynı şekilde yapay zekanın bir alt dalıdır. Yani her derin öğrenme algoritması bir makine öğrenmesi algoritmasıdır. Fakat her makine öğrenmesi algoritması derin öğrenme kullanmaz.

derin-ogrenme-nedir-venn-semasi

Makine Öğrenmesi ve Derin Öğrenme Arasındaki Temel Farklar:

  • Makine öğrenimi, verileri ayrıştırmak, bu verilerden öğrenmek ve öğrendiklerine göre bilinçli kararlar vermek için algoritmalar kullanır.
  • Derin öğrenme, kendi başına akıllı kararlar alabilen ve öğrenebilen “yapay sinir ağları” oluşturmak için katmanlardaki algoritmaları yapılandırır.
  • Derin öğrenme, makine öğreniminin bir alt dalıdır. Her ikisi de yapay zeka kategorisine girerken, derin öğrenme, en insan benzeri yapay zeka modelleri üretebilir.

Yapay Sinir Ağları Nedir?

Yapay Sinir Ağı, her bir nöronun bir bilgi işlem birimini temsil ettiği, birbirine bağlı yapay nöronlardan (veya düğümlerden) oluşan bir ağdır. Bu birbirine bağlı düğümler, insan beynini taklit ederek bilgileri birbirlerine aktarır. Düğümler birbirleriyle etkileşime girer ve bilgi paylaşır. Her düğüm girdi alır ve iletmeden önce üzerinde bazı işlemler gerçekleştirir.

Bu işlemler, aktivasyon fonksiyonu olarak adlandırılan doğrusal olmayan matematiksel fonksiyon tarafından gerçekleştirilir. Aktivasyon fonksiyonu girdiyi, daha sonra diğer düğümler için girdi olarak kullanılacak bir çıktıya dönüştürür.

yapay-sinir-aglari

Düğümler arasında belirli ağırlıklar vardır. Bu ağırlıklar modelin her öğrenme turunda güncellenir. Performans (doğruluk) oranı yüksekse ağırlıklar güncellenmez. Bu ağırlıklar her turda geri besleme ile doğruluğu arttırmak adına güncellenir. Ağdan çıkan sonucun doğruluğuna göre belirli fonksiyonlar sayesinde bu ağırlıklar yenilenir.

En soldaki katman giriş katmanı en sondaki ise çıkış katmanı olarak geçer. Aradaki tüm katmanlar gizli katman olarak geçer. Gizli katmanların ve içerisindeki düğümlerin artması genellikle doğruluk oranını arttırır fakat çok fazla hesaplama gücü gerektirir. Bazı durumlarda gizli katman sayısını arttırmak beklenenin aksine doğruluğu düşürür.

Yapay Sinir Ağları Çeşitleri

Multilayer Perceptron (Çok Katmanlı Algılayıcı)

Perceptron (algılayıcı) yapay sinir ağlarının en basit halidir ve sadece tek bir yapay sinir hücresinden oluşur. Multilayer Perceptron ise 3 veya daha fazla katman ve çoklu perceptrona sahip olan modellerdir. Genellikle doğrusal olmayan aktivasyon fonksiyonlarını (Tanh ve ReLU gibi) kullanırlar. Kayıp oranını hesaplamak içinse Ortalama Kare Hatası (MSE) veya Logloss fonksiyonlarını kullanırlar. Bir katmandaki her düğüm, sonraki katmandaki her düğüme bağlanarak ağı tam olarak birbirine bağlar.

multilayer-perceptron

Convolutional Neural Network (CNN/Evrişimli Sinir Ağı)

Bir evrişimli sinir ağı bir veya birden fazla evrişimli katman içerir. Evrişimli katmanlarda bir filtre görsel üzerinde gezdirilir. Bu sayede görseldeki belirli özellikler elde edilir. Ardından bir feature matrisi elde edilir. Bu matrise Max-Pooling yardımıyla havuzlama uygulanır ve görseller daha küçük matrislerde saklanır. Bu tekrarlayan katmanların ardından ise fully-connected katmanı sayesinde matrisimiz tek boyutlu bir vektöre dönüştürülür.

Günümüzde Evrişimli Sinir Ağları genelde bilgisayarlı görme alanında kullanılır. Görüntü sınıflandırma, video işleme, otonom araçlar gibi pek çok yerde karşımıza çıkar.

evrisimli-sinir-aglari

Recurrent Neural Network (RNN/Yinelenen Sinir Ağları)

Yinelenen sinir ağları, ileri beslemeli bir sinir ağının aksine, nöronlar arasındaki bağlantıların yönlendirilmiş bir döngü oluşturduğu yinelemeli yapay sinir ağının bir çeşididir. Yinelenen sinir ağlarında çıktı sadece mevcut girdilere göre değil, aynı zamanda önceki adımın nöronunun durumuna da bağlıdır. Bu bellek, kullanıcıların el yazısını tanıma veya konuşma tanıma gibi doğal dil işleme sorunlarını çözme de kullanılır.

Long-Short Term Memory (LSTM/Uzun Kısa Vadeli Hafıza Ağları)

Uzun Kısa Vadeli Hafıza Ağları, geçici dizileri ve uzun menzilli bağımlılıklarını geleneksel yinelenen sinir ağlarından daha doğru modellemek için tasarlanmış, özel bir yinelenen sinir ağı mimarisidir. LSTM, tekrar eden bileşenleri içinde aktivasyon işlevini kullanmaz, saklanan değerleri değiştirmez ve vanishing gradient (gradyan kaybolma) problemi yaşamaz. Genellikle, LSTM birkaç birimle “bloklar” halinde uygulanır. Bu bloklar 3 ya da 4 kapıya sahip olur. Örnek vermek gerekirse girdi kapısı, unutma kapısı ve çıkış kapısı.

lstm

Derin Öğrenme Kullanım Alanları Nedir?

Sağlık Sektörü

Derin öğrenme sağlık sektöründe gittikçe benimsenmeye başlandı. Araştırmacılar çeşitli hastalık vb. teşhislerde derin öğrenmeyi kullanmaya başladı. Bazı hastahanelerde kanserli hücrelerin önceden belirlenmesi adına derin öğrenme modelleri kullanılmakta.

Otonom Araçlar

Otonom araçların belki de temel bileşeni olan yapay zeka kısmında en fazla kullanılan disiplin derin öğrenmedir. Bilgisayarlı görme sayesinde görüntüler derin öğrenme modellerine girdi olarak verilir ve bu modeller trafik ışıklarını tespit etme, yakındaki araçların hızını hesaplama ya da trafik işaretlerini algılamak gibi işlemlerde kullanılır.

Havacılık ve Savunma

Derin öğrenme ile birlikte uydudan gelen görüntülerden tehdit unsuru özellikler tespit edilebilir. Ya da birlikler için güvenli, güvensiz bölgeler belirlenebilir.

Yüz Tanıma Sistemleri

Derin öğrenme sayesinde daha önce çekilmiş görüntülerden ya da canlı videolardan insan yüzleri tespit edilebilir. Eğitim verisine göre de bu yüzlere gerekli etiketlemeler yapılabilir. Kişinin yaşı, cinsiyeti, ırkı gibi özellikleri derin öğrenme sayesinde sadece yüz tanıma sistemleri ile tahmin edilebilir.

Teknoloji'den geri kalmamak için e-posta listemize abone olun!

Özgür Doğan (Okunuşu: Özgür Do:an) : Teknoloji içerikleri yazmayı ve okumayı seven kişi, kimse, topluluk.