Dans ce module, vous utilisez l'algorithme Amazon SageMaker NTM (Neural Topic Model) pour entraîner le modèle de rubrique.
Amazon SageMaker NTM est un algorithme d'entraînement non supervisé qui est utilisé pour organiser un corpus de documents en rubriques qui contiennent des groupes de mots en fonction de leur distribution statistique. Les documents qui contiennent des occurrences fréquentes de mots tels que « bike », « car », « train », « mileage » et « speed » sont susceptibles de partager une rubrique sur « transportation », par exemple. La modélisation de rubriques peut être utilisée pour classer ou résumer des documents en fonction des rubriques détectées ou pour récupérer des informations ou recommander du contenu en fonction des similitudes de rubriques. Les rubriques des documents que NTM apprend sont caractérisées comme une représentation latente parce que les rubriques sont déduites des distributions de mots observées dans le corpus. La sémantique des rubriques est généralement déduite en examinant les mots les mieux classés qu'ils contiennent. Étant donné que la méthode n'est pas supervisée, le nombre de rubriques – et non pas les rubriques elles-mêmes – est prédéfini. Il n'est en outre pas garanti que les rubriques s'alignent sur la façon dont un être humain pourrait naturellement classer les documents.
Dans les étapes suivantes, spécifiez votre algorithme NTM pour la tâche d'entraînement, définissez l'infrastructure du modèle, spécifiez les valeurs des hyperparamètres pour optimiser le modèle et exécutez le modèle. Déployez ensuite le modèle sur un point de terminaison géré par Amazon SageMaker pour effectuer des prédictions.
Durée du module : 20 minutes
Dans ce module, vous avez récupéré l'algorithme Amazon SageMaker NTM (Neural Topic Model) d'Amazon ECR. Ensuite, vous avez spécifié des hyperparamètres spécifiques à l'algorithme et fourni le compartiment Amazon S3 pour le stockage des artefacts. Vous avez ensuite déployé le modèle sur un point de terminaison en utilisant les services d'hébergement Amazon SageMaker ou la transformation par lots. Enfin, vous avez exploré le modèle en utilisant différentes valeurs pour le nombre de rubriques.
Dans le module suivant, vous entraînez et déployez votre modèle de recommandation de contenu.