Makine Öğrenmesi ve Buna Dair 8 Mit
Makine Öğrenmesi (Machine Learning), matematiksel ve istatistiksel yöntemler kullanarak mevcut verilerden çıkarımlar yapan, bu çıkarımlarla bilinmeyene dair tahminlerde bulunan yöntem paradigmasıdır. Makine öğrenmesine güncel hayatımızdan yüz tanıma, belge sınıflandırma, spam tespitini örnek verebiliriz.
Makine öğrenmesi, her duruma uygulanabileceğini ve her problemi çözebileceğini varsayarsak çok yararlı olduğunu kanıtlayabilir. Özellikle her zaman yaşadığınız problemler için asla o işle başa çıkamayacak kadar insanı işe alamayacağınızı ya da net bir hedefle ilgili problemler yaşayabileceğinizi ancak bunu başarmak için açık bir yöntem olmadığını bildiğiniz alanlarda yararlıdır. Ayrıca her organizasyon makine öğrenmesinden bir şekilde faydalanabilir.
Makine öğrenmesi gibi, yanıltıcı reklamlara maruz kaldığımız alanlarda yanlış anlamalarla ve yanlış kavramlarla karşılaşmak sıkça mümkün. Ve hatta makine öğrenmesine dair pek çok mit de var. Şimdi makine öğrenmesi neleri yapabilir neleri yapamaz birlikte görelim.
Mit 1: Makine Öğrenmesi Yapay Zekadır
Makine öğrenmesi ve yapay zeka (artifical intelligence- AI) sıklıkla eşanlamlı olarak kullanılır. Makine öğrenmesi, araştırma laboratuvarlarından gerçek dünyaya en başarılı şekilde taşınabilmiş olan tekniktir. AI ise makine öğrenmesini içeren ve bunun yanı sıra bilgisayarla görme, robotik ve doğal dil işleme gibi yaklaşımları da kapsayan geniş bir alandır. Yani makineyi akıllı yapan şey olarak düşünülebilir.
Dolayısıyla makine öğrenmesi bazı insanların insanlık ile rekabet edebileceğini ve hatta saldırabileceğini düşündüğü genel “yapay zeka” değildir. Kavramlar arasındaki farklara dikkat edin. Makine öğrenmesi, kalıpları öğrenmek ve büyük veri kümelerinden çıkarımları tahmin etmekle ilgilidir. Sonuçlar “zekice” görünebilir, ancak özünde daha önce görülmemiş hız ve ölçekte istatistik uygulamayla alakalıdır. Yani makineler veriyi alır ve kendisi için öğrenir.
Mit 2: Bütün Veriler Faydalıdır
Makine öğrenmesi için veriye ihtiyacınız var, ancak elinizdeki tüm veriler yararlı değil. Sisteminizi eğitmek için, makine öğrenim sisteminizin ele alması gereken kalıpları ve sonuçları kapsayan temsili bilgilere ihtiyacınız vardır. Alakasız kalıplara sahip olmayan verilere ihtiyacınız vardır, çünkü oluşturduğunuz makine öğrenim modeli, bu aşırı spesifik kalıpları yansıtacak ve bunları kullandığınız verilerde arayacaktır.
Eğitim için kullandığınız tüm verilerin iyi bir şekilde etiketlenmiş olması gerekir. Başka bir deyişle verilerin makine öğrenme sistemine sormanız gereken sorulara uyan özelliklerle etiketlenmesi gerekir. Bu da çok fazla iş gerektirir. Halihazırda sahip olduğunuz verilerin temiz, açık, temsili veya etiketlenmesi kolay olduğunu düşünmeyin. Verilerinizi temiz, açık ve temsili hale getirmek için yeniden inceleyin.
Mit 3: Her Zaman Çok Fazla Veriye İhtiyaç Vardır
Transfer öğrenimi sayesinde, belirli bir alanda iyi sonuçlar elde etmek için her zaman büyük bir veri kümesine ihtiyacınız yoktur. Bunun yerine bir makine öğrenim sistemini bir büyük veri kümesini kullanarak nasıl öğreneceğinizi öğretebilir ve daha sonra kendi küçük, çok daha küçük eğitim veri kümenizden öğrenebilme yeteneğini aktarırsınız. Salesforce ve Microsoft Azure’dan gelen özel görüş API’leri bu şekilde çalışır. İyi sonuçlar elde etmek için sınıflandırmak istediğiniz şeyi göstermek için yalnızca 30-50 resim gerekir. Transfer öğrenme, önceden eğitilmiş bir sistemi kendi probleminize nispeten az miktarda veriyle özelleştirmenizi sağlar.
Mit 4: Herkes Bir Makine Öğrenme Sistemi Kurabilir
Makine öğrenimi için birçok açık kaynak araç, sistem ve bunları nasıl kullanacağınızı gösteren sayısız kurs vardır. Ancak makine öğrenimi hala özel bir tekniktir. Verileri nasıl hazırlayacağınızı, eğitim ve test için nasıl bölümlendireceğinizi bilmeniz gerekir. En iyi algoritmanın nasıl seçileceğini ve bununla birlikte nasıl kullanılacağını bilmeniz gerekir. Bunun yanı sıra bunu üretimde güvenilir bir sisteme nasıl dönüştürebileceğinizi de bilmelisiniz. Ayrıca, sonuçların zaman içinde alakalı kaldığından emin olmak için sistemi izlemeniz gerekir.
Diyelim ki yukarıdaki adımlar tamamlandı sonrasında da pazarınızın değişip değişmediği veya makine öğrenim sisteminizin farklı bir müşteri kitlesi ile sonuçlanabilecek kadar iyi olup olmadığını, modelin hala sorununuza uyduğunu kontrol etmeniz gerekecek. Dolayısıyla makine öğrenmesi sitemi kurmak çok da kolay sayılmaz.
Mit 5: Verilerdeki Tüm Kalıplar Faydalıdır
Astım hastaları veya kalp hastalığı olan kişiler ve 100 yaşında olan herkes, beklediğinizden daha daha iyi bir sağkalım oranına sahiptir. Aslında, hastaneye kabulü otomatikleştirmek için tasarlanmış basit bir makine öğrenmesi sistemi onları eve gönderebilir. Ne yazık ki, böyle yüksek hayatta kalma oranlarına sahip olmalarının sebebi her zaman hemen kabul edilmeleridir çünkü zatürre onlar için çok tehlikelidir. Sistem verilerde geçerli bir model görüyor ve buna göre seçim yapıyor ama belki de bu kimi kabul edeceğini seçmek için kullanışlı bir model değil.
Daha da tehlikeli olanı ise zaten bilmediğiniz sürece yardımcı olmayan anti-modellerin veri kümenizde olduğunu bilmemeninizdir. Diğer durumlarda, bir sistem, açık ve bariz bir açıklamaya sahip olmadığı için yararlı olmayan geçerli bir örüntü öğrenebilir.
Kara kutu modelleri etkilidir ancak hangi kalıbın öğrenildiğini açıklığa kavuşturmaz. Genelleştirilmiş Katkı Modelleri gibi daha şeffaf, anlaşılır algoritmalar, modelin ne öğrendiğini daha net bir şekilde ortaya koyar, böylece dağıtımın yararlı olup olmadığına karar verebilirsiniz.
Mit 6: Makine Öğrenmesi Tarafsızdır
Makine öğrenmesi bir veriden öğrendiği için, veri kümesindeki tüm önyargıları da çoğaltacaktır. CEO’ların görüntülerinin aranması, beyaz ve erkek CEO’ların fotoğraflarını gösterecektir, çünkü daha fazla CEO’nun beyaz ve erkek olduğu görülmektedir. Ancak, makine öğrenmesinin de bu önyargıyı güçlendirdiği ortaya çıkıyor.
Görüntü tanıma sistemlerini eğitmek için sıklıkla kullanılan COCO veri seti, erkek ve kadınların fotoğraflarına sahiptir. Ama daha çok kadın mutfak ekipmanının yanında gösteriliyor ve daha çok erkek bilgisayar klavyesi, fare ya da tenis raketi ve snowboard ile gösteriliyor. Sistemi COCO’da eğitin ve erkekleri bilgisayar donanımına orijinal fotoğraflardaki istatistiklerden daha güçlü şekilde ilişkilendirin.
Bir makine öğrenim sistemi, bir diğerine önyargı ekleyebilir. Bunun önüne geçmek için aralarındaki ilişkileri gösteren vektörler olarak sözcükleri temsil etmek için popüler çerçeveler içeren bir makine öğrenme sistemini eğitin.
Bir alışveriş sitesinde benzer öneriler almak yararlıdır, ancak hassas alanlar söz konusu olduğunda sorunludur ve bir geri bildirim döngüsü oluşturabilir. Aşılamaya karşı bir Facebook grubuna katılırsanız, Facebook’un öneri motoru, komplo teorilerine veya dünyanın düz olduğu inancına odaklanan diğer grupları da önerecektir.
Makine öğrenmesinde yanlılık konularının farkında olmak önemlidir. Eğitim veri kümenizde önyargıyı kaldıramazsanız, “filtre balonunu” önlemek için önyargıları azaltmak veya alakasız ögeleri önerilere eklemek için kelime çiftleri arasındaki cinsiyet ilişkilerini düzenlemek gibi teknikler kullanın.
Mit 7: Makine Öğrenmesi Sadece İyiye Kullanılır
Makine öğrenmesi anti-virüs araçlarını güçlendirir. Başlatılan saldırıların davranışlarına baktıktan hemen sonra onları bulmaya çalışır. Fakat hackerlar da büyük miktarda kamuya açık veriyi analiz edebilir.
Önceki kimlik avı girişimlerinin ne kadar başarılı olduğunu analiz edebilir. Yani makine öğrenmesi hackerlara karşı kullanıladığı gibi hackerlar da hedeflenen saldırılarını ölçeklendirmek için makine öğrenmesini kullanabilirler.
Mit 8: Makine Öğrenmesi İnsanların Yerini Alacak
Yapay zekanın işlerimizi elimizden alacağı düşüncesi yaygındır ki şüphesiz yapay zeka yaptığımız işleri ve bunları nasıl yaptığımızı kesinlikle değiştirecektir. Ancak makine öğrenim sistemleri verimliliği ve uyumluluğu artırır ve maliyetleri düşürür. Uzun vadede iş dünyasında yeni görevler oluşturacak ve bazı güncel pozisyonları modası geçmiş olacak. Ancak, makine öğrenimi görevlerinin birçoğu, karmaşıklık veya ölçek nedeniyle daha önce mümkün olmadı. Örneğin, markanızın özelliklerinin olup olmadığını görmek için sosyal medyaya gönderilen her fotoğrafa bakmak için yeterince insanı işe alamazsınız.
Makine öğrenmesi sistemi insanların yerini almayacak, tahmini bakım ile müşteri deneyimini iyileştirmek ve iş karar vericilerine öneri ve destek sunmakla yeni iş fırsatları yaratacaktır. Önceki nesil otomasyonlarda olduğu gibi, makine öğrenmesi de çalışanları uzmanlıklarını ve yaratıcılıklarını kullanma özgürlüğüne kavuşturacaktır.