게시된 날짜: Nov 18, 2022
오늘 AWS는 SageMaker JumpStart의 Amazon의 최첨단 Alexa Teacher Model 200억 매개변수 모델(AlexaTM 20B)이 정식 출시되었음을 발표했습니다. 고객은 프로그래밍 방식으로 AlexaTM 20B 모델에 액세스하여 SageMaker Python SDK에서 사용 가능한 API를 사용하여 추론을 실행할 수 있습니다.
Amazon Alexa AI의 Alexa Teacher Model(AlexaTM) 프로그램은 다운스트림 태스크에서 많은 양의 데이터를 요구하지 않고 일반화를 개선하는 것을 목표로 하는 대규모, 다중 태스크, 다국어 딥 러닝(주로 Transformer 기반) 모델을 구축하도록 설계되었습니다. 대규모 사전 훈련을 활용하는 교사 모델은 저밀도 데이터에서 새로운 태스크를 학습하도록 적절히 일반화할 수 있으며 개발자가 다운스트림 태스크의 정확도를 개선하는 데 도움이 됩니다. AlexaTM 20B는 크기 면에서 Alexa AI의 가장 큰 모델이며 일반적인 NLP 태스크 및 벤치마크(SuperGLUE 및 XNLI)에서 경쟁력 있는 성능을 보여주었습니다.
Amazon SageMaker JumpStart는 SageMaker의 기계 학습(ML) 허브로, 350개 이상의 기본 제공 알고리즘, 사전 훈련된 모델 및 사전 구축된 솔루션 템플릿을 제공하여 고객이 ML을 빠르게 시작하는 데 도움이 됩니다. JumpStart에서 호스팅되는 사전 훈련된 모델에는 TensorFlow, PyTorch, Hugging Face 및 MXNet 같은 인기 모델 허브의 State-of-the-Art(SOTA) 모델이 포함되며 객체 탐지, 텍스트 분류 및 텍스트 생성 같은 인기 ML 태스크를 지원합니다. 데이터 사이언티스트 및 ML 전문가가 빠르고 안전하게 시작할 수 있도록 콘텐츠가 AWS 리포지토리에 저장되며 SageMaker 기능과 호환 가능한 훈련 및 추론 스크립트가 포함됩니다. 고객은 자체 데이터를 사용하여 모델을 미세 조정하거나 추론을 위해 있는 그대로 배포할 수 있습니다.
AlexaMT 20B는 Amazon SageMaker가 제공되는 모든 리전에서 사용할 수 있습니다.
모델에 대해 자세히 알아보려면 Alexa Science 블로그를 참조하고 JumpStart를 사용하여 모델에 액세스하는 방법을 자세히 알아보려면 JumpStart 출시 블로그의 Alexa TM을 참조하세요. SageMaker JumpStart에서 사용할 수 있는 모든 모델을 찾아보려면 SageMaker JumpStart ML 허브를 방문하세요.