假設您是位在銀行工作的機器學習開發人員。您需要開發一種機器學習模型,以協助公司的分析師處理他們需要閱讀的大量新聞,以便做出投資決策。該模型將在 20newsgroups 資料集中訓練,包含約 20,000 個文件中的 20 個主題的資訊。
作為模型的一部分,您需要從新聞資料中擷取語義資訊,然後從語料庫中識別相似的新聞文章,並根據正在閱讀的相似新聞為分析師提供內容推薦。
在本實驗室中,您將了解如何建立 Amazon SageMaker 筆記本執行個體,使用 Jupyter 筆記本下載、準備和暫存資料集,訓練和部署主題模型,最後訓練和部署內容推薦模型。
在單元 1 中,您將設定在實驗室期間使用的環境。
完成單元的時間:20 分鐘
在此單元中,您已了解在本實驗室中訓練的範例 ML 模型。您還可以使用 Amazon S3 儲存貯體、Amazon SageMaker 筆記本執行個體和 Jupyter 筆記本,設定一個 AWS 帳戶和您的實驗室環境。
您現在已準備好開始使用實驗室。在下一個單元中,您將下載、準備和暫存資料集。