Bu makalede, iki ayrı Makine Öğrenimi (ML) tekniğine; yani “Naive Bayes Sınıflandırıcısı" ve “Yapay Sinir Ağları” algoritmalarına değineceğiz ve nasıl çalıştıklarını öğreneceğiz.
Kendi kendine gidebilen Otonom Araçlar ve video oyunu oynayabilen Yapay Zeka robotlarının giderek daha görünür hale geldiği günümüzde, bu teknolojilerin arka planına bakıp; makine öğrenim programlarının gerçekte “nasıl öğrendiklerini” bilmemizde çok büyük faydalar var.
Bu makalede, iki ayrı makine öğrenimi (ML) tekniğini (spam e-postaları filtreleme ile yapay sinir ağları algoritmalarını) sizlere anlatmak ve nasıl çalıştıklarını göstermek istiyorum.
Ancak makine öğreniminin ne olduğundan bile habersizseniz, yapay zeka, makine öğrenimi ve derin öğrenme arasındaki farklar hakkında çeşitli makaleler okumanızda da fayda görüyorum.
Basit Bir Örnek: Naive Bayes Sınıflandırıcısı
Spam (istenmeyen, gereksiz) e-postaları filtrelemek için kullanılan Naive Bayes sınıflandırıcısı yaygın bir makine öğrenimi algoritmasıdır.
“Nijeryalı Prensin Parasal Yardımınıza İhtiyacı Var!” gibi gereksiz ve istenmeyen e-postaları, gelen kutunuzdan uzak tutar.
Peki bu algoritma nasıl çalışıyor?
“Spam Olarak İşaretle” düğmesini her tıkladığınızda, aslında devasa büyüklükte bir “spam e-posta veritabanını güncelliyorsunuz” demektir. Bir bilgisayar programı, bu spam olarak işaretlediğiniz e-posta içerisindeki çeşitli kelimeler veya ifadeler ile ilgili istatistiksel verileri toplayabilir. Örneğin, spam e-postalarının % 25'inin “Cinsel Gücü Artırma” veya % 30'unun “Hemen hızlı para kazan” gibi ifadeler içerdiğini bu istatistiksel veriler sayesinde öğreniyoruz.
Bu yüzdesel veriler sayesinde, Naive Bayes sınıflandırıcı algoritması artık gelen e-postaları meşru veya spam olarak işaretlemek için ihtiyaç duyduğu tüm bilgilere sahiptir. Yeni bir e-posta aldığınızda, algoritma; e-posta içindeki tüm kelimelerle ilgili istatistikleri arar. Daha sonra, e-postayı spam olarak sınıflandırmak veya sınıflandırmamak için bu istatistikleri bazı matematiksel işlemler ile (özellikle Bayes kuralı olarak adlandırılan olasılık hesapları ile) birleştirir. Hepsi bu kadar!
Tabii ki, bu Makine Öğrenim (ML) algoritmasının gerçekte “öğrenme” süreci oldukça basittir. Yalnızca kelimeler / kelime öbekleri ile ilgili istatistikleri güncelleyerek bir öğrenme gerçekleştirir (örneğin, “Nijeryalı Prens” ibaresi ile gönderilen e-postaların % 40'ı spam e-postadır).
Karmaşık Bir Örnek: Yapay Sinir Ağları
Yapay Sinir Ağları gün geçtikçe daha da gelişen ve çok popüler olan bir Makine Öğrenimi (ML) algoritmasıdır.
Geçen yılın temmuz ayında, Google, veri merkezinin soğutma maliyetlerini % 40 oranında düşürmek için yapay sinir ağlarını kullandığını kamuoyuna açıkladı. Maliyetleri düşürmek için, güç kullanım etkinliği (PUE)’nin; sunucu yükü, su pompası sayısı, soğutma kulesi sayısı ve diğer veri merkezi özellikleri gibi değişkenlere göre nasıl değiştiğini tahmin etmenin bir yoluna ihtiyacı vardı.
Google ayrıca araç park etme zorluğunu tahmin etmek için de makine öğrenimini kullanıyor ve bunlar makine öğreniminin birçok uygulamasından sadece bir kaçıdır.
Böyle bir hesaplama, bir mühendisin elle formüle edebilmesi açısından çok karmaşıktır, bu yüzden yapay sinir ağları kullanılmaktadır.
Google’ın yapay sinir ağları çok karmaşıktır, ancak bilmeniz gereken tek şey, veriler girilirken güncellenen parametreleri içermesidir. Veri merkezi örneği bağlamında, “veri” yükü, zaman içinde farklı noktalardaki PUE seviyelerini, sunucu yükünü, su pompası sayısını, vb. değerleri ifade gelir. Bu parametreler küçüldükçe, sinir ağının PUE’yi doğru bir şekilde hesaplama yeteneği artar. Sonuçta, size bir mühendisin yapamayacağı bir şekilde; enerji veriminin veri merkezi soğutma yapılandırmasına göre nasıl değiştiğini söyleyebilecek bir program algoritmasıdır yapay sinir ağları.
Google, bu algoritmayı maliyetlerde % 40'lık bir düşüş sağlamak için kullandı. Özetle, Google’ın yapay sinir ağı, veri merkezinin yapılandırmasına bağlı olarak PUE’nin nasıl tahmin edileceğini “öğrendi”. Ancak şunu da unutmayın, bu “öğrenme” süreci gizemli, mistik bir şey değildi. PUE tahminlerini daha doğru hale getirmek için sinir ağlarında sadece ince parametre ayarlamaları yapıldı.
Narin Luangrath
Comments