Stellen Sie sich vor, dass sie ein Machine Learning-Entwickler sind und bei einer Bank arbeiten. Sie wurden gebeten, ein Machine Learning-Modell zu entwickeln, das Analysten in Ihrem Unternehmen bei der Menge an Nachrichten hilft, die sie lesen müssen, um eine Anlageentscheidung zu treffen. Das Modell wird für den 20newsgroups-Datensatz geschult, der Informationen zu 20 Themen in ca. 20.000 Dokumenten enthält.
Als Teil Ihres Modells müssen Sie semantische Informationen aus den Nachrichtendaten extrahieren, dann ähnliche Nachrichtenartikel aus dem Korpus identifizieren und den Analysten Inhaltsempfehlungen für ähnliche Nachrichten bereitstellen, die auf den Nachrichten basieren, die sie lesen.
In dieser Übung erfahren Sie, wie Sie eine Amazon SageMaker-Notebook-Instance erstellen, einen Datensatz mithilfe eines Jupyter-Notebooks herunterladen, vorbereiten und inszenieren, Ihr Themenmodell schulen und bereitstellen und schließlich das Inhaltsempfehlungsmodell schulen und bereitstellen.
In Modul 1 konfigurieren Sie Ihre Umgebung, die Sie während der Übung verwenden.
Veranschlagte Zeit für das Modul: 20 Minuten
In diesem Modul lernten Sie das Beispiel-ML-Modell kennen, die Sie in dieser Übung schulen. Außerdem richten Sie ein AWS-Konto und Ihre Übungsumgebung mit einem Amazon S3-Bucket, einer Amazon SageMaker-Notebook-Instance und einem Jupyter-Notebook ein.
Sie sind nun bereit, mit der Übung zu beginnen. Im nächsten Modul laden Sie ihren Datensatz herunter, bereiten ihn vor und inszenieren ihn.