Bu modülde konu modelini eğitmek üzere yerleşik Amazon SageMaker Sinirsel Konu Modeli (NTM)’ni kullanacaksınız.
Amazon SageMaker NTM istatistiksel dağılımlarına göre kelime grupları içeren konulara belgelerden oluşan bir kitaplığı düzenlemek amacıyla kullanılan, denetlenmeyen bir öğrenme algoritmasıdır. Örneğin “bisiklet”, “araba”, “tren”, “mesafe” ve”hız” gibi kelimelerin sık geçtiği belgelerin “ulaşım” ile ilgili bir konuda olması daha muhtemeldir. Konu modelleme, belgeleri tespit edilen konulara göre sınıflandırmak veya özetlemek ya da konu benzerliklerine göre bilgi veya önerilen içerik almak amacıyla kullanılabilir. NTM’nin öğrendiği belgelerden konular örtük temsil olarak karakterize olur çünkü konular kitaplıkta gözlenen kelime dağılımlarından çıkarılır. Konuların semantiği genel olarak en üste sıralanan kelimelerin incelenmesinden çıkarılır. Bu yöntem denetlenmediği için konuların kendisi değil yalnızca birkaç tanesi önceden belirlenir. Ek olarak, konuların bir insanın belgeleri doğal olarak nasıl kategorize edeceği ile uyumlu hale getirileceği garanti edilmez.
Aşağıdaki adımlarda eğitim işi için NTM algoritmanızı belirtecek, model altyapısını belirleyecek, modeli ayarlamak için hiper parametre değerlerini ayarlayacak ve modeli çalıştıracaksınız. Daha sonra, tahmin yürütmesi için modeli Amazon SageMaker tarafından yönetilen uç noktaya dağıtacaksınız.
Modülü Tamamlama Süresi: 20 Dakika
Bu modülde Amazon ECR’den Amazon SageMaker Sinirsel Konu Modeli (NTM) Algoritmasını geri aldınız. Sonra, algoritmaya özgü hiperparametreleri belirlediniz ve yapıt depolama için Amazon S3 klasörünü sağladınız. Daha sonra, modeli Amazon SageMaker barındırma hizmetleri veya toplu dönüşüm ile bir uç noktasına dağıttınız. Son olarak, konu sayısı için farklı değerler kullanarak modeli keşfettiniz.
Bir sonraki modülde içerik öneri modelinizi eğiteceksiniz.