Supposez que vous êtes développeur spécialisé en machine learning pour une banque. Vous avez reçu pour mission de développer un modèle de machine learning pour aider les analystes de votre entreprise à exploiter au mieux la grande masse de données d'actualités qu'ils doivent lire pour prendre des décisions d'investissement. Le modèle sera entraîné sur l'ensemble de données 20newsgroups qui contient des informations sur 20 sujets dans environ 20 000 documents.
Dans le cadre de votre modèle, vous devez extraire des informations sémantiques des données d'actualités, puis identifier des articles d'actualité similaires dans le corpus et fournir aux analystes des recommandations de contenu pour des actualités similaires en fonction de celles qu'ils lisent.
Dans cet exercice, vous allez apprendre à créer une instance de bloc-notes Amazon SageMaker, à télécharger, préparer et organiser un ensemble de données à l'aide d'un bloc-notes Jupyter, à entraîner et déployer votre modèle de rubrique et à former et déployer le modèle de recommandation de contenu.
Dans le module 1, vous configurez l'environnement que vous allez utiliser dans cet exercice pratique.
Durée du module : 20 minutes
Dans ce module, vous vous êtes familiarisé avec l'exemple de modèle de ML que vous avez entraîné dans cet exercice pratique. Vous avez également configuré un compte AWS et votre environnement d'exercice avec un compartiment Amazon S3, une instance de bloc-notes Amazon SageMaker et un bloc-notes Jupyter.
Vous êtes à présent prêt pour démarrer l'exercice pratique. Dans le module suivant, vous téléchargez, préparez et organisez votre ensemble de données.