Veröffentlicht am: Jul 19, 2019
Amazon SageMaker Batch Transform ermöglicht es Ihnen, Prognosen für Datensätze auszuführen, die in Amazon S3 gespeichert sind. Es ist ideal für Szenarien, in denen Sie mit großen Datenmengen arbeiten und Latenzzeiten von unter einer Sekunde nicht wichtig sind. Sie können nun Ihre Batch Transform-Aufgaben so konfigurieren, dass bestimmte Datenattribute von Prognoseanfragen ausgeschlossen und einige oder alle Eingabedatenattribute mit Prognoseergebnissen verbunden werden. Dadurch entfällt die zusätzliche Vor- oder Nachbearbeitung bei der Ausführung von Batch-Prognosen auf Daten im CSV- oder JSON-Format.
Nehmen wir beispielsweise einen Datensatz, der drei Attribute enthält: ID, Alter und Größe. Das ID-Attribut ist eine zufällig generierte oder fortlaufende Nummer, die kein Signal für das ML-Problem trägt und nicht beim Training des ML-Modells verwendet wurde. Sie können nun Ihre Batch Transform-Aufgaben so konfigurieren, dass das ID-Attribut von jedem Datensatz ausgeschlossen wird und nur die Alter- und Größe-Attribute in die an das Modell gesendeten Prognoseanfragen übergeben werden. Sie können Ihre Batch Transform-Aufgaben auch so konfigurieren, dass das ID-Attribut den Prognoseergebnissen in der endgültigen S3-Ausgabe des Jobs zugeordnet wird. Die Beibehaltung dieser Attribute auf Datensatzebene kann für die Analyse der Prognoseergebnisse nützlich sein.
Diese neue Funktion steht nun in allen Regionen zur Verfügung, in denen Amazon SageMaker aktuell verfügbar ist. Weitere Informationen zu diesem Feature finden Sie im Amazon SageMaker-Entwicklerhandbuch.