Aşırı Uydurma Nedir?
Aşırı uydurma, makine öğrenimi modeli eğitim verileri için doğru tahminler verdiğinde ancak yeni veriler için doğru tahminler vermediğinde ortaya çıkan istenmeyen bir makine öğrenimi davranışıdır. Veri bilimcileri tahmin yapmak için makine öğrenimi modellerini kullandıklarında, önce modeli bilinen bir veri kümesi üzerinde eğitirler. Sonra, bu bilgilere dayanarak, model yeni veri kümeleri için sonuçları tahmin etmeye çalışır. Aşırı sığan bir model yanlış tahminler verebilir ve her tür yeni veri için iyi performans gösteremez.
Aşırı uyum neden oluşur?
Yalnızca makine öğrenimi modeli kendi etki alanındaki tüm veri türlerine genellenirse doğru tahmin alırsınız. Aşırı uyum, model genelleme yapamadığında ve bunun yerine eğitim veri kümesine çok yakından uyduğunda gerçekleşir. Aşırı uyum, aşağıdaki gibi çeşitli nedenlerden dolayı gerçekleşir:
• Eğitim veri boyutu çok küçüktür ve olası tüm giriş verisi değerlerini doğru bir şekilde temsil etmek için yeterli veri örneği içermez.
• Eğitim verileri, gürültülü veri adı verilen büyük miktarlarda alakasız bilgi içerir.
• Model, tek bir örnek veri kümesi üzerinde çok uzun süre eğitilir.
• Model karmaşıklığı yüksek olduğu için eğitim verilerindeki gürültüyü öğrenir.
Aşırı uyum örnekleri
Bir makine öğrenimi modelinin fotoğrafları analiz etmesi ve içinde köpek bulunanları tanımlaması gereken bir kullanım örneği düşünün. Makine öğrenimi modeli, çoğunlukla parklardaki köpekleri gösteren fotoğrafları içeren bir veri kümesi üzerinde eğitilmişse sınıflandırma özelliği olarak çim kullanmayı öğrenebilir ve bir odanın içindeki bir köpeği tanımayabilir.
Bir başka aşırı uyum örneği ise aile geliri, geçmiş akademik performans ve ebeveynlerin akademik nitelikleri gibi çeşitli faktörleri analiz ederek bir üniversite öğrencisinin akademik performansını ve mezuniyet sonucunu tahmin eden bir makine öğrenimi algoritmasıdır. Ancak, test verileri yalnızca belirli bir cinsiyet veya etnik gruptan adayları içerir. Bu durumda, aşırı uyum, test veri kümesi dışındaki cinsiyet veya etnik kökene sahip adaylar için algoritmanın tahmin doğruluğunun düşmesine neden olur.
Aşırı uyumu nasıl tespit edebilirsiniz?
Aşırı uyum modellerini tespit etmenin en iyi yöntemi, olası giriş veri değerlerinin ve türlerinin kapsamlı temsiliyle makine öğrenimi modellerini daha fazla veri üzerinde test etmektir. Tipik olarak, eğitim verilerinin bir kısmı aşırı uyumu kontrol etmek için test verileri olarak kullanılır. Test verilerindeki yüksek hata oranı aşırı uyumu gösterir. Aşırı uyumu test etmeye yönelik bir yöntem aşağıda verilmiştir.
K katmanlı çapraz doğrulama
Çapraz doğrulama, uygulamada kullanılan test yöntemlerinden biridir. Bu yöntemde veri bilimcileri, eğitim setini K adet eşit büyüklükte alt kümeye veya katman adı verilen örnek kümeye böler. Eğitim süreci, çeşitli tekrarlardan oluşur. Her tekrar sırasında şu adımlar uygulanmalıdır:
1. Bir alt kümeyi doğrulama verileri olarak tutun ve kalan K-1 alt kümede makine öğrenimi modelini eğitin.
2. Modelin doğrulama örneğinde nasıl bir performans gösterdiğini gözlemleyin.
3. Çıktı veri kalitesine göre modelin performansına puan verin.
Tekrarlar, model her örnek kümede test edilene kadar yinelenir. Ardından tahmine dayalı modelin nihai değerlendirmesini almak için tüm tekrarlardaki puanların ortalamasını alırsınız.
Aşırı uyumu nasıl önleyebilirsiniz?
Eğitim verileri kümenizi çeşitlendirerek ve ölçeklendirerek veya aşağıda belirtilenler gibi diğer veri bilimi stratejilerini kullanarak aşırı uyumu önleyebilirsiniz.
Erken durdurma
Erken durdurma, makine öğrenimi modeli verilerdeki gürültüyü öğrenmeden önce eğitim aşamasını duraklatır. Ancak zamanlamayı doğru ayarlamak çok önemlidir; aksi takdirde model yine de doğru sonuçlar vermez.
Eleme
Bir model oluştururken nihai tahmini etkileyen birkaç özellik veya parametre belirleyebilirsiniz. Özellik seçimi veya elemesi, eğitim kümesi dâhilindeki en önemli özellikleri belirler ve alakasız olanları çıkarır. Örneğin, bir görüntünün hayvan mı yoksa insan mı olduğunu tahmin etmek için yüz şekli, kulağın pozisyonu, vücut yapısı gibi çeşitli giriş parametrelerine bakabilirsiniz. Yüz şekline öncelik verip gözlerin şeklini göz ardı edebilirsiniz.
Düzenleme
Düzenleme, aşırı uyumu azaltmaya çalışan eğitim/optimizasyon teknikleri koleksiyonudur. Bu yöntemler, özellikleri önemlerine göre derecelendirerek tahmin sonuçlarını etkilemeyen ilgili faktörleri ortadan kaldırmaya çalışır. Örneğin matematiksel hesaplamalar, özelliklere minimum etkiyle bir ceza değeri uygular. Bir şehrin 20 yıl içindeki konut fiyatlarını tahmin etmeye çalışan istatistiksel bir model düşünün. Düzenleme, nüfus artışı ve ortalama yıllık gelir gibi özelliklere daha düşük bir ceza değeri verirken şehrin ortalama yıllık sıcaklığına daha yüksek bir ceza değeri verecektir.
Toplama
Toplama, birkaç farklı makine öğrenimi algoritmasından elde edilen tahminleri birleştirir. Bazı modellerin sonuçları genellikle yanlış olduğundan bunlara zayıf öğreniciler denmektedir. Toplama yöntemleri, daha doğru sonuçlar elde etmek için tüm zayıf öğrenicileri birleştirir. Örnek verileri analiz etmek ve en doğru sonuçları seçmek için birden fazla model kullanırlar. Torbalama ve yükseltme, iki temel toplama yöntemidir. Yükseltme, nihai sonucu elde etmek için farklı makine öğrenimi modellerini arka arkaya eğitirken torbalama, bu modelleri paralel olarak eğitir.
Veri büyütme
Veri büyütme, model örnek verileri her işlediğinde bu verileri biraz değiştiren bir makine öğrenimi tekniğidir. Giriş verilerini küçük şekillerde değiştirerek bunu yapabilirsiniz. Veri büyütme, ölçülü olarak yapıldığında eğitim kümelerinin modele özgü görünmesini sağlar ve modelin özelliklerini öğrenmesini engeller. Örneğin, giriş görüntülerine çeviri, değiştirme ve döndürme gibi dönüşümler uygulamak.
Yetersiz uyum nedir?
Yetersiz uyum, model girdi ve çıktı verileri arasında anlamlı bir ilişki belirleyemediğinde ortaya çıkan başka bir hata türüdür. Çok sayıda veri noktasında uygun sürede eğitim almadıkları takdirde yetersiz uyumlu modeller elde edersiniz.
Yetersiz uyum ve aşırı uyum
Yetersiz uyumlu modeller yüksek sapma ile karşılaşır; hem eğitim verileri hem de test kümesi için yanlış sonuçlar verirler. Öte yandan aşırı uyumlu modeller yüksek değişiklik ile karşılaşır; eğitim kümesi için doğru sonuçlar verirler ancak test kümesi için vermezler. Daha fazla model eğitimi, daha az sapmaya sebep olur ancak değişiklik artabilir. Veri bilimcileri, bir modelin uyumunu sağlarken yetersiz uyum ve aşırı uyum arasındaki can alıcı noktayı bulmayı hedeflerler. İyi uyumlu bir model, görülen ve görünmeyen veri kümeleri için baskın trendi hızla oluşturabilir.
AWS, makine öğrenimi modellerinizdeki aşırı uyum hatalarını nasıl en aza indirebilir?
Tam olarak yönetilen altyapı, araçlar ve iş akışlarıyla her türlü kullanım örneği için makine öğrenimi modelleri oluşturmak, eğitmek ve dağıtmak amacıyla Amazon SageMaker'ı kullanabilirsiniz. Amazon SageMaker, girdi, çıktı ve dönüşümler gibi eğitim sırasında oluşturulan verileri otomatik olarak analiz eden Amazon SageMaker Hata Ayıklayıcı adlı yerleşik bir özelliğe sahiptir. Sonuç olarak, manuel müdahale olmaksızın aşırı uyumu ve diğer hataları tespit edebilir ve bildirebilir.
Örneğin, şunları yapabilirsiniz:
- İstenilen doğruluk elde edildiğinde eğitim sürecini otomatik olarak durdurun.
- Eğitim metriklerini gerçek zamanlı olarak yakalayın.
- Aşırı uyum tespit edildiğinde uyarılar alın.
Makine öğrenimi modellerini eğitmenin süresini ve maliyetini azaltın. Hemen ücretsiz bir hesap oluşturarak AWS'de makine öğrenimine başlayın!