은행에서 일하는 기계 학습 개발자가 되었다고 상상해보십시오. 회사의 분석가들이 투자 결정을 내리기 위해 읽어야 할 방대한 양의 뉴스를 쉽게 참조할 수 있도록 해주는 기계 학습 모델을 개발해 달라는 요청을 받았습니다. 이 모델은 약 20,000개 문서에 20가지 주제에 대한 정보가 수록된 20newsgroups 데이터 세트를 훈련하게 됩니다.
모델의 일부로서, 뉴스 데이터에서 시멘틱 정보를 추출한 후 코퍼스에서 유사한 뉴스 아티팩트를 식별하여 분석가가 읽고 있는 뉴스를 기준으로 유사한 뉴스에 대한 콘텐츠 추천을 제공해야 합니다.
이 실습에서는 Amazon SageMaker 노트북 인스턴스를 생성하고, Jupyter 노트북을 사용하여 데이터 세트를 다운로드, 준비 및 스테이징하며, 주제 모델을 훈련 및 배포하고, 마지막으로 콘텐츠 추천 모델을 훈련 및 배포하는 방법을 알아봅니다.
모듈 1에서는 실습 중에 사용할 환경을 구성합니다.
모듈 완료 시간: 20분
이 모듈에서는 이 실습에서 훈련시킨 기계 학습 모델 예제에 대해 학습했습니다. 또한 AWS 계정을 설정하고 Amazon S3 버킷, Amazon SageMaker 노트북 인스턴스, Jupyter 노트북을 사용하여 실습 환경을 설정했습니다.
이제 실습을 시작할 준비를 마쳤습니다. 다음 모듈에서는 데이터 세트를 다운로드하고 준비하고 스테이징합니다.