게시된 날짜: Mar 31, 2023
이제 AWS Glue Studio에서는 Concatenate, Split string, Array to columns, Add current timestamp, Pivot rows to columns, Unpivot columns to rows, Lookup, Explode, Derived column 및 Autobalance processing 등 10가지의 새로운 시각적 변환을 제공합니다. AWS Glue Studio는 AWS Glue ETL 작업을 작성, 실행 및 모니터링하기 위해 추출, 전환, 적재(ETL) 인터페이스를 제공합니다. ETL 개발자는 이러한 새로운 구성 요소를 통해 코드를 작성하지 않고도 보다 정교한 데이터 파이프라인을 신속하게 구축할 수 있습니다.
이 10가지의 새로운 변환은 다양한 데이터 처리 요구 사항을 해결합니다. Concatenate 변환을 사용하여 열을 병합하거나 Split string 변환으로 구분 기호를 사용하여 문자열을 구분합니다. Add current timestamp 변환은 데이터가 처리된 시간을 기록할 수 있습니다. Pivot rows to columns 변환 및 Unpivot columns to rows 변환은 집계를 위한 데이터를 재구성하는 데 도움이 됩니다. Lookup 변환은 다른 테이블의 열을 데이터 세트에 추가하는 간단한 방법입니다. Derived column 변환은 수학적 또는 SQL 표현식을 사용하여 다른 열을 기반으로 새 열을 정의할 수 있습니다. Explode 변환은 중첩된 데이터 구조의 압축을 풉니다. 마지막으로 Autobalance processing 변환은 데이터가 작업자 사이에서 잘 분산되지 않을 때 작업 성능을 향상시키는 고급 기능입니다. 이러한 모든 새로운 변환은 시각적 작업과 코드 기반 작업 모두에서 사용 가능합니다.
이러한 새 구성 요소는 AWS Glue와 동일한 AWS 리전에서 사용할 수 있습니다.
자세한 내용은 AWS Glue 설명서를 참조하세요.