Veröffentlicht am: Mar 31, 2023
AWS Glue Studio bietet jetzt 10 neue visuelle Transformationen: „Konkatenieren“, „Zeichenkette trennen“, „Array zu Spalten“, „Aktuellen Zeitstempel hinzufügen“, „Zeilen zu Spalten pivotieren“, „Pivotieren von Spalten zu Zeilen aufheben“, „Suche“, „Auflösen“, „Abgeleitete Spalte“ und „Autobalance-Verarbeitung“. AWS Glue Studio bietet eine visuelle Schnittstelle zum Extrahieren, Transformieren und Laden (ETL), um Aufträge von AWS Glue ETL zu erstellen, auszuführen und zu überwachen. Mit diesen neuen Komponenten können ETL-Entwickler schnell anspruchsvollere Datenpipelines erstellen, ohne selbst Code schreiben zu müssen.
Mit diesen 10 neuen Transformationen wird eine Vielzahl von Datenverarbeitungsanforderungen erfüllt: Führen Sie Spalten mit „Konkatenieren“ zusammen oder trennen Sie eine Zeichenkette mithilfe eines Begrenzers mit „Zeichenkette trennen“. Mit „Aktuellen Zeitstempel hinzufügen“ können Sie erfassen, wann Ihre Daten verarbeitet wurden. Mit „Zeilen zu Spalten pivotieren“ und „Pivotieren von Spalten zu Zeilen aufheben“ können Sie Daten für die Aggregation umstrukturieren. Mit „Suche“ können Spalten aus einer anderen Tabelle leicht in den Datensatz eingefügt werden. Mit „Abgeleitete Spalte“ können Sie anhand von mathematischen oder SQL-Ausdrücken eine neue Spalte basierend auf anderen Spalten definieren. „Auflösen“ entpackt verschachtelte Datenstrukturen und das letzte, erweiterte Feature „Autobalance-Verarbeitung“ verbessert die Arbeitsleistung, wenn die Daten nicht gut auf die Mitarbeiter verteilt sind. All diese neuen Transformationen sind sowohl in visuellen als auch in codebasierten Aufträgen verfügbar.
Diese neuen Komponenten sind in denselben AWS-Regionen wie AWS Glue verfügbar.
Weitere Informationen finden Sie in der AWS Glue-Dokumentation.