Imagine que es un desarrollador de aprendizaje automático que trabaja en un banco. Se le pidió que desarrolle un modelo de aprendizaje automático para ayudar a los analistas de su empresa con la cantidad de noticias que necesitan leer para tomar decisiones de inversión. El modelo se entrenará en el conjunto de datos de 20newsgroups que contiene información sobre 20 temas en aproximadamente 20 000 documentos.
Como parte de su modelo, necesita extraer información semántica de los datos de las noticias, identificar artículos con noticias similares en el corpus y luego realizar recomendaciones de contenido a los analistas de artículos de noticias similares en función de las que leen.
En este laboratorio, aprenderá a crear una instancia de bloc de notas de Amazon SageMaker, descargar, preparar y organizar un conjunto de datos con un bloc de notas de Jupyter, entrenar e implementar un modelo de tema y finalmente entrenar e implementar el modelo de recomendación de contenido.
En el Módulo 1, configurará el entorno que utilizará durante el laboratorio.
Tiempo para completar el módulo: 20 minutos
En este módulo, aprendió acerca del modelo de ML de ejemplo que entrena en este laboratorio. También configuró una cuenta de AWS y su entorno de laboratorio con un bucket de Amazon S3, una instancia de bloc de notas de Amazon SageMaker y un bloc de notas de Jupyter.
Ahora está listo para iniciar el laboratorio. En el siguiente módulo, descargará, preparará y organizará un conjunto de datos.