Veröffentlicht am: Dec 4, 2023
Amazon SageMaker Canvas unterstützt jetzt umfassende Datenaufbereitungsfunktionen, die von Amazon SageMaker Data Wrangler unterstützt werden. Sie können jetzt Tabellen-, Zeitreihen-, Bild- und Textdaten aus über 50 Datenquellen importieren, Berichte zu Datenqualität und Erkenntnissen erstellen und Daten mithilfe von über 300 integrierten Operatoren transformieren, um Machine Learning (ML)-Modelle zu erstellen und zu verwenden, ohne Code schreiben zu müssen. Durch diese Integration können Sie die Datenaufbereitung für ML mithilfe von SageMaker Canvas von Wochen auf Minuten verkürzen.
Das Aggregieren, Analysieren und Transformieren großer Datenmengen ist ein wichtiger, aber oft auch der zeitaufwändigste Teil des ML-Workflows. Kunden können nun mithilfe des Berichts „Data Quality and Insights“ (Datenqualität und Einblicke) schnell Daten analysieren und visualisieren, um Datenprobleme zu identifizieren, die sich auf die Modellqualität auswirken könnten, sowie Daten bereinigen und mithilfe von über 300 Transformationen, die von Spark unterstützt werden, Features für ML erstellen. Jetzt können Kunden in SageMaker Canvas einen visuellen Datenaufbereitungsablauf erstellen und Daten aus Amazon S3, Amazon Athena, Amazon Redshift, Salesforce Data Cloud, Snowflake und über 50 Datenquellen importieren. Sobald die Daten aufbereitet sind, können Kunden die Datenaufbereitungsschritte so skalieren, dass sie auf verteilten Spark-Verarbeitungsaufträgen ausgeführt werden, den Datensatz exportieren, um Modelle zu trainieren, oder Ergebnisse mit gebrauchsfertigen Machine-Learning-Modellen Basismodellen vorhersagen. Alternativ können sie ihren Datenworkflow als Schritt in einer SageMaker-Pipeline exportieren, um in SageMaker Studio Features zu entwickeln, Modelle zu trainieren oder Daten nahezu in Echtzeit für Inferenz zu transformieren.
Die neuen Datenaufbereitungsfunktionen sind in allen AWS-Regionen verfügbar, in denen SageMaker Canvas unterstützt wird. Weitere Informationen finden Sie im Blog und in der technischen Dokumentation von AWS.