Aktarım öğrenimi nedir?

Aktarım öğrenimi (TL), bir görev üzerinde önceden eğitilmiş modelde, ilgili yeni bir görev için ince ayarın yapıldığı bir makine öğrenimi (ML) tekniğidir. Yeni bir ML modelini eğitmek, üretime hazır hâle gelmeden önce büyük miktarda veri, bilgi işlem gücü ve birkaç yineleme gerektiren zaman alıcı ve yoğun bir süreçtir. Bunun yerine kuruluşlar, mevcut modelleri ilgili görevler üzerinde yeni verilerle yeniden eğitmek için TL'den yararlanır. Örneğin bir makine öğrenimi modeli köpeklerin görüntülerini tanımlayabiliyorsa köpekler ve kediler arasındaki özellik farklılıklarını vurgulayan daha küçük bir görüntü kümesi kullanılarak kedileri tanımlayacak şekilde eğitilebilir.

Aktarım öğreniminin avantajları nelerdir?

TL, ML uygulamaları oluşturan araştırmacılara aşağıdaki avantajlardan birkaçını sunar.

Geliştirilmiş verimlilik

Bilgi oluşturdukları ve desenleri tanımladıkları için ML modellerini eğitmek zaman alır. Bu işlem ayrıca büyük bir veri kümesi gerektirir ve hesaplama açısından pahalıdır. TL'de, önceden eğitilmiş bir model görevler, özellikler, ağırlıklar ve işlevler hakkındaki temel bilgileri saklayarak yeni görevlere daha hızlı uyum sağlamasına olanak verir. Daha iyi sonuçlar elde ederken çok daha küçük bir veri kümesi ve daha az kaynak kullanabilirsiniz. 

Artan erişilebilirlik

Derin öğrenme sinir ağları oluşturmak için büyük veri hacimleri, kaynaklar, bilgi işlem gücü ve zaman gerekir. TL, oluşturma işleminin önündeki bu engelleri aşarak kuruluşların özel kullanım örnekleri için ML'yi benimsemelerine olanak tanır. Mevcut modelleri çok daha düşük bir maliyetle gereksinimlerinize uyarlayabilirsiniz. Örneğin önceden eğitilmiş bir görüntü tanıma modeli kullanarak minimum düzeyde ayarlamalarla tıbbi görüntüleme analizi, çevresel izleme veya yüz tanıma için modeller oluşturabilirsiniz.

Geliştirilmiş performans

TL aracılığıyla geliştirilen modeller, çeşitli ve zorlu ortamlarda genellikle daha fazla sağlamlık sergiler. Bu modeller, ilk eğitimlerinde çok çeşitli senaryolara maruz kaldıkları için gerçek dünyadaki değişkenliği ve gürültüyü daha iyi idare eder. Söz konusu modeller daha iyi sonuçlar verir ve öngörülemeyen koşullara daha esnek bir şekilde uyum sağlar.

Farklı aktarım öğrenimi stratejileri nelerdir?

TL'yi kolaylaştırmak için kullandığınız strateji; oluşturduğunuz modelin etki alanına, tamamlaması gereken göreve ve eğitim verilerinin kullanılabilirliğine bağlı olacaktır.

Transdüktif aktarım öğrenimi

Transdüktif aktarım öğrenimi, belirli bir kaynak etki alanından farklı ancak ilgili bir hedef etki alanına bilgi aktarılmasını içerir ve birincil odak hedef etki alanı üzerindedir. Bu öğrenim, hedef etki alanından gelen etiketlenmiş veri az olduğunda veya hiç olmadığında özellikle kullanışlıdır.

Transdüktif aktarım öğrenimi, modelden, daha önce edinilen bilgileri kullanarak hedef veriler üzerinde tahminlerde bulunmasını ister. Hedef veriler matematiksel olarak kaynak verilere benzer olduğundan model desenleri bulur ve daha hızlı performans gösterir. 

Örneğin film incelemelerini analiz etmek için ürün incelemeleri konusunda eğitilmiş bir duygu analizi modelini uyarlamayı düşünün. Kaynak etki alanı (ürün incelemeleri) ve hedef etki alanı (film incelemeleri) bağlam ve detaylar bakımından farklılık gösterir ancak yapı ve dil kullanımında benzerlikleri paylaşır. Model, duygu anlayışını ürün etki alanından film etki alanına uygulamayı hızla öğrenir.

Endüktif aktarım öğrenimi

Endüktif aktarım öğrenimi, kaynak ve hedef etki alanlarının aynı olduğu yerdir ancak modelin tamamlaması gereken görevler farklılık gösterir. Önceden eğitilmiş model kaynak verilere zaten aşinadır ve yeni işlevler için daha hızlı eğitim verir.

Endüktif aktarım öğreniminin bir örneği doğal dil işlemede (NLP) bulunur. Modeller büyük bir metin kümesi üzerinde önceden eğitilir ve daha sonra bunlar için duygu analizi gibi belirli işlevlerde endüktif aktarım öğrenimi kullanılarak ince ayar yapılır. Benzer şekilde, VGG gibi bilgisayarlı görü modelleri büyük görüntü veri kümeleri üzerinde önceden eğitilir ve daha sonra bunlar için nesne algılamayı geliştirecek şekilde ince ayar yapılır.

Denetimsiz aktarım öğrenimi

Denetimsiz aktarım öğrenimi kapsamında, yeni yetenekler geliştirmek için endüktif aktarım öğrenimine benzer bir strateji kullanılır. Bununla birlikte, bu aktarım öğrenimi biçimini hem kaynak hem de hedef etki alanlarında yalnızca etiketlenmemiş verileriniz olduğunda kullanırsınız. 

Model, bir hedef görevi gerçekleştirmesi istendiğinde daha doğru şekilde genelleştirme yapmak için etiketlenmemiş verilerin ortak özelliklerini öğrenir. Bu yöntem, etiketlenmiş kaynak veri elde etmek zorlayıcı veya pahalıysa yararlıdır.

Örneğin trafik görüntülerinde farklı motosiklet türlerini tanımlama görevini düşünün. Başlangıçta, model büyük bir etiketlenmemiş araç görüntüleri kümesi üzerinde eğitilir. Bu bulut sunucusunda model; otomobil, otobüs ve motosiklet gibi farklı araç türleri arasındaki benzerlikleri ve ayırt edici özellikleri bağımsız olarak belirler. Daha sonra, model küçük ve özel bir motosiklet görüntüleri kümesine tanıtılır. Model performansı öncekine kıyasla önemli ölçüde artar.

Aktarım öğrenimindeki adımlar nelerdir?

Yeni bir görev için bir makine öğrenimi modeline ince ayar yapılırken üç ana adım mevcuttur.

Önceden eğitilmiş bir model seçin

İlk olarak ilgili bir görev için ön bilgilere veya becerilere sahip önceden eğitilmiş bir model seçin. Uygun bir model seçmek için yararlı bağlamlardan biri de her modelin kaynak görevini belirlemektir. Modelin gerçekleştirdiği orijinal görevleri anlarsanız yeni bir göreve daha etkili bir şekilde geçiş yapan bir model bulabilirsiniz.

Önceden eğitilmiş modellerinizi yapılandırın

Kaynak modelinizi seçtikten sonra, bu modeli ilgili görevi tamamlamak için bir modele bilgi iletecek şekilde yapılandırın. Bunu yapmanın iki ana yöntemi vardır.

Önceden eğitilmiş katmanları dondurun

Katmanlar sinir ağlarının yapı taşlarıdır. Her katman bir dizi nörondan oluşur ve giriş verileri üzerinde belirli dönüşümler gerçekleştirir. Ağırlıklar, ağın karar verme için kullandığı parametrelerdir. Başlangıçta rastgele değerlere ayarlanan ağırlıklar, model verilerden öğrenim gerçekleştirdikçe eğitim sürecinde ayarlanır.

Önceden eğitilmiş katmanların ağırlıklarını dondurarak, derin öğrenme modelinin kaynak görevden elde ettiği bilgiyi koruyarak onları sabit tutarsınız.

Son katmanı kaldırın

Bazı kullanım örneklerinde, önceden eğitilmiş modelin son katmanlarını da kaldırabilirsiniz. Çoğu ML mimarisinde, son katmanlar göreve özgüdür. Bu son katmanların kaldırılması, modeli yeni görev gereksinimleri için yeniden yapılandırmanıza yardımcı olur.

Yeni katmanlar tanıtın

Önceden eğitilmiş modelinize ek olarak yeni katmanlar tanıtmak, yeni görevin özel yapısına uyum sağlamanıza yardımcı olur. Yeni katmanlar, modeli yeni gereksinimin nüanslarına ve işlevlerine uyarlar.

Modeli hedef etki alanı için eğitin

Yeni görevle uyumlu hâle getirecek şekilde standart çıktısını geliştirmek için modeli hedef görev verileri üzerinde eğitirsiniz. Önceden eğitilmiş model, muhtemelen istenenlerden farklı çıktılar üretir. Eğitim sırasında modelin performansını izledikten ve değerlendirdikten sonra, çıktıyı daha da iyileştirmek için hiper parametreleri veya temel sinir ağı mimarisini ayarlayabilirsiniz. Ağırlıkların aksine, hiper parametreler verilerden öğrenilmez. Hiper parametreler önceden ayarlanmıştır ve eğitim sürecinin verimliliğini ve etkililiğini belirlemede çok önemli bir rol oynar. Örneğin hedef görev ile ilgili olarak yeteneğini geliştirmek için düzenleme parametrelerini veya modelin öğrenme oranlarını ayarlayabilirsiniz.

Üretici yapay zekadaki aktarım öğrenimi stratejileri nelerdir?

Aktarım öğrenimi stratejileri, çeşitli sektörlerde üretici yapay zekanın benimsenmesinde kritik öneme sahiptir. Kuruluşlar, uygun ölçekte milyarlarca veri parametresi üzerinde yenilerini eğitmek zorunda kalmadan mevcut altyapı modellerini özelleştirebilir. Aşağıdakiler üretici yapay zekada kullanılan aktarım öğrenimi stratejilerinin bazılarıdır.

Çekişmeli etki alanı eğitimi

Çekişmeli etki alanı eğitimi, hedef etki alanındaki gerçek verilerden ayırt edilemeyen veriler üretmek için bir altyapı modelini eğitmeyi içerir. Bu teknikte, genellikle çekişmeli üretici ağlarda görüldüğü gibi gerçek veriler ile üretilen verileri birbirinden ayırmaya çalışan ayırıcı bir ağ kullanılır. Üretici, giderek daha gerçekçi olan veriler oluşturmayı öğrenir.

Örneğin görüntü oluşturmada, fotoğraflar konusunda eğitilmiş bir model, resim üretecek şekilde uyarlanabilir. Ayırıcı, üretilen resmin hedef etki alanıyla stilistik açıdan tutarlı olmasını sağlamaya yardımcı olur.

Öğretmen-öğrenci öğrenimi

Öğretmen-öğrenci öğrenimi, daha küçük ve daha basit bir "öğrenci" modelini öğreten daha büyük ve daha karmaşık bir "öğretmen" modelini içerir. Öğrenci modeli, bilgiyi etkili bir şekilde aktararak öğretmen modelinin davranışını taklit etmeyi öğrenir. Bu model, kaynağın kısıtlı olduğu ortamlarda büyük üretici modelleri dağıtma açısından kullanışlıdır.

Örneğin bir büyük dil modeli (LLM), dil üretme yeteneklerini aktararak daha küçük bir modele öğretmen olarak hizmet edebilir. Bu da daha küçük modelin, hesaplamayla ilgili daha az işletim yükü ile yüksek kalitede metin üretmesine olanak verir.

Özellik ayırma

Üretici modellerde özellik ayırma, verilerin içerik ve tarz gibi farklı yönlerini belirgin temsillere ayırmayı içerir. Bu da modelin aktarım öğrenimi sürecinde bu yönleri bağımsız olarak işlemesini sağlar.

Örneğin bir yüz oluşturma görevinde, model yüz özelliklerini sanatsal tarzdan ayırmayı öğrenebilir. Bu da modelin, deneğin benzerliğini korurken çeşitli sanatsal tarzlarda portreler oluşturmasına olanak verir.

Modaliteler arası aktarım öğrenimi

Modaliteler arası aktarım öğrenimi, metin ve görüntüler gibi farklı modaliteler arasında bilgi aktarımını içerir. Üretici modeller, bu modaliteler arasında uygulanabilir temsilleri öğrenebilir. Metinsel açıklamalar ve ilgili görüntüler konusunda eğitilmiş bir model, anlayışını metinden görüntüye etkili bir şekilde aktararak yeni metin açıklamalarından alakalı görüntüler oluşturmayı öğrenebilir.

Sıfır atışlı ve az atışlı öğrenme

Sıfır atışlı ve az atışlı öğrenme kapsamında, üretici modeller görevleri yerine getirmek veya eğitim sırasında az örneğini gördükleri ya da hiç örneğini görmedikleri veriler oluşturmak için eğitilir. Bu da iyi genelleştirme yapan zengin temsiller öğrenilerek sağlanır. Örneğin bir üretici model, hayvan görüntüleri oluşturacak şekilde eğitilebilir. Bu model, az atışlı öğrenme yoluyla diğer hayvanların özelliklerini anlayarak ve birleştirerek nadir görülen bir hayvanın görüntülerini oluşturabilir.

AWS, aktarım öğrenimi gereksinimleriniz konusunda nasıl yardım sağlayabilir?

Amazon SageMaker JumpStart, makale özetleme ve görüntü oluşturma gibi görevleri gerçekleştirmek için altyapı modelleri de dahil olmak üzere önceden eğitilmiş modellere erişebileceğiniz bir ML merkezidir. Daha küçük veri kümelerinizde doğru modeller üretmek için orijinal modelin eğitimi kapsamındaki maliyetlerden daha düşük eğitim maliyetleri ile aktarım öğrenimi kullanabilirsiniz. Örneğin SageMaker JumpStart ile şunları yapabilirsiniz:

  • Üretime daha hızlı dağıtım için önceden eğitilmiş modelleri kullanım örneğinize göre ve verilerinizle tamamen özelleştirebilirsiniz.
  • Yaygın kullanım örneklerini çözmek için önceden oluşturulmuş çözümlere erişebilirsiniz.
  • ML modelleri ve not defterleri dahil olmak üzere ML yapıtlarını kuruluşunuz içinde paylaşabilirsiniz.

Modaliteler arası aktarım öğrenimi yaklaşımını kullanırken ciddi nitelikteki gizli sorunları tespit etmek için Amazon SageMaker Hata Ayıklayıcı'yı da kullanabilirsiniz. Örneğin hataları bulmak için model tahminlerini inceleyebilir, modelinizin sağlamlığını doğrulayabilir ve bu sağlamlığın ne kadarının kalıtsal yeteneklerden geldiğini düşünebilirsiniz. Gerçekçi beklentiler için modeldeki girdileri ve ön işlemleri de doğrulayabilirsiniz.

Hemen ücretsiz bir hesap oluşturarak AWS'de aktarım öğrenimini kullanmaya başlayın.

AWS'de Sonraki Adımlar

Ücretsiz hesap için kaydolun

AWS Ücretsiz Kullanım için anında erişim elde edin.

Kaydolun 
Konsolda oluşturmaya başlayın

AWS Yönetim Konsolu'nda oluşturmaya başlayın.

Oturum açın