En este módulo, utilice un algoritmo de modelo de tema neuronal (NTM) de Amazon SageMaker a fin de entrenar el modelo de tema.
El NTM de Amazon SageMaker es un algoritmo de aprendizaje no supervisado que se utiliza para organizar un conjunto de documentos en temas que contengan grupos de palabras en función de la distribución estadística. Los documentos que contienen palabras que se repiten con frecuencia, como “bicicleta”, “vehículo”, “tren”, “kilometraje” y “velocidad” es probable que compartan un tema sobre “transporte”. El modelado de temas se puede utilizar para clasificar o resumir documentos en función de los temas detectados o a fin de recuperar información o contenido recomendado sobre la base de las similitudes del tema. Los temas de los documentos que el NTM aprende se caracterizan como una representación latente porque se infieren de la distribución de palabras observadas en el conjunto. La semántica de los temas generalmente se infiere al examinar las palabras más destacadas. Debido a que el método no es supervisado, solo el número de temas, no los temas en sí, se especifican previamente. Además, no se puede garantizar la correspondencia entre los temas y la forma en que un humano podría categorizar documentos de manera natural.
En los pasos siguientes, especificará el algoritmo NTM para el trabajo de entrenamiento, especificará la infraestructura del modelo y determinará los valores de los hiperparámetros a fin de ajustar y ejecutar el modelo. Luego, implemente el modelo en un punto de enlace administrado por Amazon SageMaker para hacer predicciones.
Tiempo para completar el módulo: 20 minutos
En este módulo, obtuvo de Amazon ECR el algoritmo del modelo de tema neuronal (NTM) de Amazon SageMaker. Luego, determinó los hiperparámetros específicos del algoritmo y proporcionó el bucket de Amazon S3 para almacenar artefactos. Luego, implementó el modelo en un punto de enlace con los servicios de alojamiento de Amazon SageMaker o la transformación en lotes. Finalmente, exploró el modelo con diferentes valores para el número de temas.
En el próximo módulo, entrene e implemente el modelo de recomendación de contenido.