Imagine que você é um desenvolvedor de machine learning trabalhando em um banco. Você foi solicitado a desenvolver um modelo de machine learning para ajudar os analistas da sua empresa com a quantidade de notícias que eles precisam ler para tomar decisões de investimento. O modelo será treinado no conjunto de dados 20newsgroups que contém informações sobre 20 tópicos em aproximadamente 20.000 documentos.
Como parte do modelo, você precisa extrair informações semânticas dos dados de notícias, identificar artigos de notícias semelhantes no corpus e fornecer recomendações de conteúdo aos analistas para itens de notícias semelhantes com base nos que eles estão lendo.
Neste laboratório, você aprenderá como criar uma instância de bloco de anotações do Amazon SageMaker, fazer download, preparar e organizar um conjunto de dados usando um bloco de anotações Jupyter, treinar e implantar o modelo de tópicos e, por fim, treinar e implantar o modelo de recomendações de conteúdo.
No Módulo 1, você configura o ambiente que usará durante o laboratório.
Tempo de conclusão do módulo: 20 minutos
Neste módulo, você aprendeu sobre o exemplo de modelo de ML que criou neste laboratório. Configure também uma conta da AWS e o ambiente de laboratório com um bucket do Amazon S3, uma instância de bloco de anotações do Amazon SageMaker e um bloco de anotações Jupyter.
Agora, você está pronto para começar o laboratório. No próximo módulo, você fará download, preparará e organizará o conjunto de dados.