은행에서 일하는 기계 학습 개발자가 되었다고 상상해보십시오. 회사의 분석가들이 투자 결정을 내리기 위해 읽어야 할 방대한 양의 뉴스를 쉽게 참조할 수 있도록 해주는 기계 학습 모델을 개발해 달라는 요청을 받았습니다. 이 모델은 약 20,000개 문서에 20가지 주제에 대한 정보가 수록된 20newsgroups 데이터 세트를 훈련하게 됩니다.

모델의 일부로서, 뉴스 데이터에서 시멘틱 정보를 추출한 후 코퍼스에서 유사한 뉴스 아티팩트를 식별하여 분석가가 읽고 있는 뉴스를 기준으로 유사한 뉴스에 대한 콘텐츠 추천을 제공해야 합니다.

이 실습에서는 Amazon SageMaker 노트북 인스턴스를 생성하고, Jupyter 노트북을 사용하여 데이터 세트를 다운로드, 준비 및 스테이징하며, 주제 모델을 훈련 및 배포하고, 마지막으로 콘텐츠 추천 모델을 훈련 및 배포하는 방법을 알아봅니다.

모듈 1에서는 실습 중에 사용할 환경을 구성합니다.

모듈 완료 시간: 20분

 


  • 1단계: AWS 계정 생성

    개인 AWS 계정을 사용하거나 이 실습을 위해 새 AWS 계정을 생성합니다. 필요한 서비스에 대한 전체 액세스를 이용하고 실습에서 사용한 리소스를 남겨 두지 않도록 조직 계정은 사용하지 마십시오. 작업을 마친 후 이 실습에서 사용한 리소스를 삭제하지 않는 경우 AWS 요금이 청구될 수 있습니다.

  • 2단계: Amazon S3 버킷 생성

    Amazon Simple Storage Service(Amazon S3)는 업계 최고의 확장성과 데이터 가용성 및 보안과 성능을 제공하는 객체 스토리지 서비스입니다.

    모델을 훈련시키면 모델 훈련 데이터와 모델 아티팩트가 생성됩니다. 이 실습에서는 Amazon S3 버킷을 사용하여 훈련 및 검증 데이터 세트를 스테이징하고 모델을 훈련하는 동안 Amazon SageMaker에 의해 생성된 모델 아티팩트를 저장합니다.

    Amazon S3 버킷을 생성하려면 다음과 같이 합니다.

    1. AWS Management Console에 로그인하고 Amazon S3 콘솔을 엽니다.
    2. [버킷 생성]을 선택합니다.
    3. [버킷 이름]에 sagemaker-xx를 입력합니다. 여기서 xx는 버킷 이름의 고유한 이니셜입니다.
    4. [리전]에서 버킷이 상주할 AWS 리전을 선택합니다.
    5. [버킷 설정]의 [퍼블릭 액세스 차단] 설정을 활성화된 상태로 둡니다.
    6. [버킷 생성]을 선택합니다.
  • 3단계: Amazon SageMaker 노트북 인스턴스 생성

    Amazon SageMaker 노트북 인스턴스는 Jupyter 노트북 앱을 실행하는 완전관리형 기계 학습 Amazon Elastic Compute Cloud(Amazon EC2) 컴퓨팅 인스턴스입니다.

    이 실습에서는 노트북 인스턴스를 사용하여 데이터를 준비 및 처리하고 콘텐츠 추천 기계 학습 모델을 훈련 및 배포하는 데 사용할 수 있는 Jupyter 노트북을 생성하고 관리합니다.   

    Amazon SageMaker 노트북 인스턴스를 생성하려면 다음과 같이 합니다.

    1. Amazon SageMaker 콘솔을 엽니다.
    2. [노트북 인스턴스], [노트북 인스턴스 생성]을 차례로 선택합니다.
    3. [노트북 인스턴스 생성] 페이지의 [노트북 인스턴스 이름]에 노트북 인스턴스의 이름을 입력합니다.
    4. [인스턴스 유형]에서 ml.t2.medium을 선택합니다. 이 유형은 노트북 인스턴스가 지원하는 가장 저렴한 인스턴스 유형이지만 이 실습을 진행하기에는 충분합니다.
    5. [IAM 역할]에서 [새 역할 생성]을 선택한 후 [역할 생성]을 선택합니다.
    6. [노트북 인스턴스 생성]을 선택합니다.

    몇 분 안에 Amazon SageMaker가 기계 학습 컴퓨팅 인스턴스(이 예의 경우 노트북 인스턴스)를 시작하고 기계 학습 스토리지 볼륨을 해당 인스턴스에 연결합니다. 이 노트북 인스턴스에는 Jupyter 노트북 서버와 일련의 Anaconda 라이브러리가 사전 구성되어 있습니다.

  • 4단계: Jupyter 노트북 생성

    Amazon SageMaker 노트북 인스턴스에 Jupyter 노트북을 생성합니다. 또한 노트북에서 Amazon SageMaker API를 실행하는 데 필요한 IAM 역할을 가져오고 훈련 데이터에 사용하는 데이터 세트와 Amazon SageMaker 훈련 작업에서 출력되는 모델 아티팩트를 저장하는 데 사용할 Amazon S3 버킷의 이름을 지정하는 셀도 생성합니다.

    Jupyter 노트북을 생성하려면 다음과 같이 합니다.

    1. Amazon SageMaker 콘솔을 엽니다.
    2. [노트북 인스턴스]를 선택한 후 클래식 Juypter 보기에서는 [Jupyter 열기]를 선택하고 JupyterLab 보기에서는 [JupyterLab 열기]를 선택하여, 생성한 노트북 인스턴스를 엽니다.
      참고: 노트북 인스턴스 오른쪽의 [상태] 열에 [Pending]으로 표시되는 경우 노트북이 아직 생성되는 중입니다. 노트북을 사용할 준비가 되면 상태가 InService로 바뀝니다.
    3. 노트북을 생성합니다.
      • Jupyter에서 노트북을 연 경우 [파일] 탭에서 [신규]를 선택하고 [conda_python3]를 선택합니다. 사전 설치된 이 환경에는 기본 Anaconda 설치 파일과 Python이 포함되어 있습니다.
      • JupyterLab에서 노트북을 연 경우 [파일] 메뉴에서 [신규]를 선택하고 [노트북]을 선택합니다. [커널 선택]에서 [conda_python3]를 선택합니다. 사전 설치된 이 환경에는 기본 Anaconda 설치 파일과 Python 3가 포함되어 있습니다.
    4. Jupyter 노트북에서 [파일], [다른 이름으로 저장]을 차례로 선택한 다음 노트북 이름을 지정합니다.

이 모듈에서는 이 실습에서 훈련시킨 기계 학습 모델 예제에 대해 학습했습니다. 또한 AWS 계정을 설정하고 Amazon S3 버킷, Amazon SageMaker 노트북 인스턴스, Jupyter 노트북을 사용하여 실습 환경을 설정했습니다.

이제 실습을 시작할 준비를 마쳤습니다. 다음 모듈에서는 데이터 세트를 다운로드하고 준비하고 스테이징합니다.