게시된 날짜: Nov 12, 2021
Amazon SageMaker Autopilot은 데이터에 기반해 최상의 기계 학습 모델을 자동으로 구축, 훈련 및 튜닝하는 동시에 완전한 제어와 가시성을 유지 관리할 수 있도록 합니다. 모델 구축의 일부로 SageMaker Autopilot은 자동으로 데이터를 정리, 준비 및 사전 처리하여 기계 학습 모델의 성능을 최적화합니다. 오늘부터 Autopilot은 몇 가지 추가 데이터 인사이트를 생성해 데이터 품질 개선을 통해 비즈니스 요구 사항에 보다 잘 부합하는 고품질 모델을 구축하는 데 도움을 줄 것입니다.
현재 생성된 가장 중요한 데이터 인사이트에는 예측 능력, 기능 간 상관 관계, 대상 열 배포, 중복 행, 비정상 행, 불균형한 클래스 배포, 다중 클래스 분류 대상 응답에 대한 카디널리티가 포함됩니다. 이러한 인사이트는 Autopilot에서 생성된 데이터 탐색 노트북에 표시되며 교육 프로세스가 진행되기 전에 조기에 사용할 수 있습니다. 가능한 경우 이러한 인사이트에는 데이터를 자동으로 사전 처리하고 큐레이팅하기 전에 감지된 모든 데이터 품질 문제를 해결하기 위한 권장 사항도 포함됩니다.