게시된 날짜: Mar 30, 2021
AWS Glue DataBrew에서 Amazon S3 데이터 레이크로부터 데이터 집합을 생성하는 경우 이제 동적 데이터 집합을 생성하여 새로운 수신 Amazon S3 파일에서 데이터 준비를 예약하거나 S3에서 필터링되거나 조건부로 선택된 파일 또는 폴더에서 변환을 적용할 수 있습니다. 동적 S3 경로를 생성하여 마지막 파일 업데이트 시간 또는 기간에 따라 파일을 생성하고, 필터 조건(예: 다음으로 시작, 다음으로 종료, 포함, 포함하지 않음, 보다 작음, 보다 큼, 다음 이전 등)을 사용하여 S3 파일 경로에서 문자열, 숫자 또는 날짜 기반 값을 대체하도록 사용자 지정 파라미터를 정의할 수 있습니다. 사용자 지정 파라미터 이름은 데이터 집합의 열로 포함되며, 수정된 스키마는 동적 데이터 집합에서 실행 중인 작업에 사용됩니다. 파라미터로 구성된 S3 경로 및/또는 파일을 통해 사용자는 선택한 동적 데이터 집합에서 실행할 기존 레시피를 적용하도록 예약할 수 있습니다.
DataBrew는 코드를 작성할 필요 없이 데이터 준비를 위해 사전 구축된 250개가 넘는 변환을 사용하여 데이터를 손쉽게 정리하고 정규화할 수 있는 시각적 데이터 준비 도구입니다.
자세한 내용은 이 시작하기 동영상을 시청하거나 샘플 데이터 집합을 사용하여 DataBrew를 탐색하세요. 시작하려면 AWS 관리 콘솔로 이동하거나 노트북 환경에 DataBrew 플러그인을 설치하고 DataBrew 설명서를 참조하세요.