Stellen Sie sich vor, dass sie ein Machine Learning-Entwickler sind und bei einer Bank arbeiten. Sie wurden gebeten, ein Machine Learning-Modell zu entwickeln, das Analysten in Ihrem Unternehmen bei der Menge an Nachrichten hilft, die sie lesen müssen, um eine Anlageentscheidung zu treffen. Das Modell wird für den 20newsgroups-Datensatz geschult, der Informationen zu 20 Themen in ca. 20.000 Dokumenten enthält.

Als Teil Ihres Modells müssen Sie semantische Informationen aus den Nachrichtendaten extrahieren, dann ähnliche Nachrichtenartikel aus dem Korpus identifizieren und den Analysten Inhaltsempfehlungen für ähnliche Nachrichten bereitstellen, die auf den Nachrichten basieren, die sie lesen.

In dieser Übung erfahren Sie, wie Sie eine Amazon SageMaker-Notebook-Instance erstellen, einen Datensatz mithilfe eines Jupyter-Notebooks herunterladen, vorbereiten und inszenieren, Ihr Themenmodell schulen und bereitstellen und schließlich das Inhaltsempfehlungsmodell schulen und bereitstellen.

In Modul 1 konfigurieren Sie Ihre Umgebung, die Sie während der Übung verwenden.

Veranschlagte Zeit für das Modul: 20 Minuten

 


  • Schritt 1: AWS-Konto erstellen

    Verwenden Sie ein persönliches AWS-Konto oder erstellen Sie ein neues AWS-Konto für diese Übung. Verwenden Sie kein Organisationskonto, damit Sie vollen Zugang zu den erforderlichen Dienstleistungen haben und keine Ressourcen aus der Übung zurücklassen. Wenn Sie die in dieser Übung verwendeten Ressourcen nicht löschen, wenn Sie fertig sind, können Ihnen AWS-Gebühren entstehen.

  • Schritt 2: Amazon S3-Bucket erstellen

    Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.

    Durch das Training eines Modells werden Modelltrainingsdaten und Modellartefakte erstellt. In dieser Übung verwenden Sie einen Amazon S3-Bucket, um die Trainings- und Validierungsdatensätze zu inszenieren und die von Amazon SageMaker während der Modelltraining generierten Modellartefakte zu speichern.

    So erstellen Sie einen Amazon S3-Bucket:

    1. Melden Sie sich in der AWS-Managementkonsole an und starten Sie Amazon S3-Konsole.
    2. Klicken Sie auf Bucket erstellen.
    3. Geben Sie unter Bucket-Name sagemaker-xx ein, wobei xx Ihr Kurzzeichen sind, um den Bucket-Namen eindeutig zu machen.
    4. Wählen Sie in Region die AWS-Region aus, in der sich der Bucket befinden soll.
    5. Lassen Sie in den Bucket-Einstellungen für Öffentlicher Zugriff blockieren die Einstellungen aktiviert.
    6. Klicken Sie auf Bucket erstellen.
  • Schritt 3: Eine Amazon SageMaker-Notebook-Instance erstellen

    Eine Amazon SageMaker-Notebook-Instance ist eine vollständig verwaltete Machine Learning (ML) Amazon Elastic Compute Cloud (Amazon EC2)-Compute-Instance, in der die Jupyter-Notebook-App ausgeführt wird.

    In dieser Übung verwenden Sie die Notebook-Instance, um Ihr Jupyter-Notebook zu erstellen und zu verwalten, mit dem Sie Daten vorbereiten und verarbeiten sowie das Machine Learning-Modell für die Inhaltsempfehlung schulen und bereitstellen können.   

    So erstellen Sie eine Amazon SageMaker-Notebook-Instance:

    1. Öffnen Sie die Amazon SageMaker-Konsole.
    2. Wählen Sie Notebook-Instances und dann Notebook-Instances erstellen aus.
    3. Geben Sie auf der Seite Notebook-Instance erstellen einen Namen für die Notebook-Instance in das Textfeld Name der Notebook-Instance ein.
    4. Wählen Sie unter Instance-Typ ml.t2.medium. Dies ist der kostengünstigste Instance-Typ, den die Notebook-Instances unterstützen, und es reicht für diese Übung aus.
    5. Wählen Sie unter IAM-Rolle die Option Neue Rolle erstellen und dann Rolle erstellen aus.
    6. Wählen Sie Notebook-Instance erstellen.

    In wenigen Minuten startet Amazon SageMaker eine ML-Compute-Instance – in diesem Fall eine Notebook-Instance – und fügt ein ML-Speichervolume an. Die Notebook-Instance verfügt über einen vorkonfigurierten Jupyter-Notebookserver und eine Reihe von Anaconda-Bibliotheken.

  • Schritt 4: Erstellen eines Jupyter-Notebooks

    Sie erstellen ein Jupyter-Notebook in Ihrer Amazon SageMaker Notebook-Instance. Sie erstellen auch eine Zelle, die die IAM-Rolle erhält. Ihr Notebook benötigt diese IAM-Rolle zum Ausführen von Amazon SageMaker-APIs. Die IAM-Rolle gibt den Namen des Amazon S3-Buckets an, den Sie zum Speichern der Datensätze verwenden, die Sie schon für Ihre Trainingsdaten und die Modellartefakte verwenden, die ein Amazon SageMaker-Trainingsauftrag ausgibt.

    So erstellen Sie ein Jupyter-Notebook:

    1. Öffnen Sie die Amazon SageMaker-Konsole.
    2. Wählen Sie Notebook-Instances aus, und dann öffnen Sie die Notebook-Instance, die Sie durch entweder Jupyter öffnen für die klassische Juypter-Ansicht oder JupyterLab öffnen für die JupyterLab-Ansicht erstellt haben.
      Hinweis: Wenn rechts neben der Notebook-Instance in der Spalte Status Ausstehend angezeigt wird, wird Ihr Notebook immer noch erstellt. Der Status ändert sich auf InService, wenn das Notebook einsatzbereit ist.
    3. Erstellen Sie das Notebook.
      • Falls Sie das Notebook in Jupyter geöffnet haben, wählen Sie auf der Registerkarte Dateien die Option Neu aus, und conda_python3. Diese vorinstallierte Umgebung enthält die standardmäßige Anaconda-Installation und Python
      • Falls Sie das Notebook im JupyterLab geöffnet haben, wählen Sie im Menü Datei die Option Neu und dann Notebook aus. Wählen Sie unter Kernel auswählen conda_python3 aus. Diese vorinstallierte Umgebung enthält die standardmäßige Anaconda-Installation und Python 3.
    4. Wählen Sie im Jupyter-Notebook Datei und Speichern unter aus und benennen Sie das Notebook.

In diesem Modul lernten Sie das Beispiel-ML-Modell kennen, die Sie in dieser Übung schulen. Außerdem richten Sie ein AWS-Konto und Ihre Übungsumgebung mit einem Amazon S3-Bucket, einer Amazon SageMaker-Notebook-Instance und einem Jupyter-Notebook ein.

Sie sind nun bereit, mit der Übung zu beginnen. Im nächsten Modul laden Sie ihren Datensatz herunter, bereiten ihn vor und inszenieren ihn.