게시된 날짜: Dec 4, 2023
이제 Amazon SageMaker Canvas는 Amazon SageMaker Data Wrangler가 제공하는 포괄적인 데이터 준비 기능을 지원합니다. 50개 이상의 데이터 소스에서 테이블 형식, 시계열, 이미지, 텍스트 데이터를 가져오고, 데이터 품질 및 인사이트 보고서를 생성하고, 300개 이상의 기본 제공 연산자를 사용해 데이터를 변환하여 코드를 작성하지 않고도 기계 학습(ML) 모델을 구축하고 사용할 수 있습니다. 이번 통합을 통해 SageMaker Canvas를 사용하여 ML을 위한 데이터 준비를 몇 주에서 몇 분으로 가속화할 수 있습니다.
대량의 데이터를 집계, 분석 및 변환하는 과정은 ML 워크플로의 중요한 부분이자 가장 시간 소모적인 작업입니다. 고객은 이제 데이터 품질 및 인사이트 보고서를 사용하여 데이터를 신속하게 분석 및 시각화하고 모델 품질에 영향을 미칠 수 있는 데이터 문제를 식별할 수 있으며, Spark가 지원하는 300개 이상의 변환을 사용하여 ML을 위해 데이터를 정리하고 기능을 생성할 수 있습니다. 아울러 SageMaker Canvas에서 시각적 데이터 준비 흐름을 생성하고, Amazon S3, Amazon Athena, Amazon Redshift, Salesforce Data Cloud, Snowflake 및 50개 이상의 데이터 소스에서 데이터를 가져올 수 있습니다. 데이터가 준비되면 고객은 데이터 준비 단계를 확장하여 분산된 Spark 처리 작업에서 실행하거나, 데이터 세트를 내보내 모델을 훈련하거나, 즉시 사용할 수 있는 기계 학습 및 파운데이션 모델을 통해 결과를 예측할 수 있습니다. 또는 SageMaker 파이프라인의 한 단계로 데이터 워크플로를 내보내 SageMaker Studio에서 추론을 위해 거의 실시간으로 기능을 엔지니어링하거나, 모델을 훈련하거나, 데이터를 변환할 수 있습니다.
새로운 데이터 준비 기능은 SageMaker Canvas가 지원되는 모든 AWS 리전에서 사용할 수 있습니다. 자세한 내용은 블로그와 AWS 기술 설명서에서 확인하세요.