想象一下,您是在银行工作的机器学习开发人员。公司要求您开发一个机器学习模型,以帮助公司的分析人员阅读他们需要阅读的大量新闻,从而作出投资决策。该模型将在 20newsgroups 数据集中进行训练,其中约有 20000 个文件,包含 20 个主题的相关信息。
作为模型的一部分,您需要从新闻数据中提取语义信息,然后从语料库中识别类似的新闻文章,并根据分析人员正在阅读的新闻为他们提供类似新闻的内容推荐。
在本实验室中,您将了解如何创建 Amazon SageMaker 笔记本实例,使用 Jupyter 笔记本下载、准备和暂存数据集,训练和部署您的主题模型,最后再训练和部署内容推荐模型。
在模块 1 中,您将配置在实验室中使用的环境。
完成模块所需时间:20 分钟
在此模块中,您了解了在此实验中训练的示例 ML 模型。您还可以使用 Amazon S3 存储桶、Amazon SageMaker 笔记本实例和 Jupyter 笔记本设置 AWS 账户和您的实验环境。
现在可以开始实验了。在下一个模块中,您将下载、准备和暂存您的数据集。