ご自身が銀行で働いている機械学習開発者であることを想像してみてください。投資判断を行うために読む必要があるニュースを社内のアナリストに提供するための機械学習モデルを開発するように依頼されました。モデルは、約 20,000 の文書の 20 のトピックに関する情報を含む 20newsgroups データセットでトレーニングされます。
モデルの一部として、ニュースデータからセマンティックな情報を抽出し、コーパスから類似のニュース記事を特定し、アナリストが読んでいるニュース記事に基づいて類似のニュース記事のコンテンツレコメンデーションを提供する必要があります。
このラボでは、Amazon SageMaker Notebook インスタンスを作成し、Jupyter ノートブックを使用してデータセットをダウンロード、準備、およびステージングし、トピックモデルをトレーニングしてデプロイし、最後にコンテンツレコメンドモデルをトレーニングしてデプロイする方法を学びます。
モジュール 1 では、ラボで使用する環境を構成します。
モジュールの所要時間: 20 分
このモジュールでは、このラボでトレーニングするサンプル ML モデルについて学びました。また、Amazon S3 バケット、Amazon SageMaker Notebook インスタンス、Jupyter ノートブックを使用して、AWS アカウントとラボ環境をセットアップしました。
これで、ラボを開始する準備が整いました。次のモジュールでは、データセットをダウンロード、準備、およびステージングします。