Veröffentlicht am: Nov 12, 2021
Amazon SageMaker Autopilot erstellt, trainiert und optimiert automatisch die besten Modelle für Machine Learning basierend auf Ihren Daten und ermöglicht Ihnen gleichzeitig die vollständige Kontrolle und Sichtbarkeit. Im Rahmen der Modellerstellung führt SageMaker Autopilot eine automatische Bereinigung, Vorbereitung und Vorverarbeitung von Daten durch, um die Leistung von Machine-Learning-Modellen zu optimieren. Ab sofort generiert Autopilot viele zusätzliche Datenerkenntnisse, die Ihnen erlauben, die Datenqualität zu verbessern und dadurch hochwertigere Modelle zu erstellen, die Ihre Geschäftsanforderungen besser erfüllen.
Zu den wichtigsten ab sofort generierten Datenerkenntnissen gehören Vorhersageleistung, Korrelation zwischen Features, Zielspaltenverteilung, doppelt vorhandene Zeilen, anomale Zeilen, unausgewogene Klassenverteiung und Kardinalität für Mehrklassenklassifizierungs-Zielantwort. Diese Erkenntnisse werden im Datenexplorations-Notebook präsentiert, das von Autopilot generiert wird, und stehen Ihnen frühzeitig (vor Beginn des Trainingsprozesses) zur Verfügung. Wann immer möglich enthalten diese Erkenntnisse auch Empfehlungen zur Behebung von erkannten Datenqualitätsproblemen, bevor eine automatische Vorverarbeitung und Kuratierung der Daten gestartet wird.
Die Datenerkenntnisse und Empfehlungen werden jetzt in allen AWS-Regionen generiert, in denen SageMaker Autopilot derzeit unterstützt wird. Mehr erfahren Sie unter Datenerkenntnisse. Um mit der Arbeit mit SageMaker Autopilot zu beginnen, lesen Sie den Abschnitt Erste Schritte oder greifen Sie in SageMaker Studio auf Autopilot zu.