Представьте, что вы – разработчик в сфере машинного обучения и работаете в банке. Вам была поручена разработка модели машинного обучения, которая поможет аналитикам вашей компании обработать определенный объем новостей для принятия инвестиционных решений. Модель будет обучена по набору 20newsgroups, который содержит информацию по 20 темам примерно в 20 000 документах.

Нужно научить модель извлекать из новостных данных семантическую информацию, а затем идентифицировать аналогичные новостные статьи из корпуса и предоставлять аналитикам рекомендации по содержанию похожих статей на основе тех, которые они читают.

В этом курсе вы узнаете, как создать инстанс блокнота Amazon SageMaker, загрузить и разместить набор данных с помощью блокнота Jupyter, обучить и развернуть модель темы и, наконец, модель рекомендаций по контенту.

В модуле 1 вы настроите среду, которую будете использовать в этом курсе.

Время, необходимое для прохождения модуля: 20 минут

 


  • Шаг 1. Создание аккаунта AWS

    Для этого курса можно использовать личный аккаунт AWS или создать новый. Не используйте аккаунт организации, чтобы у вас был полный доступ к необходимым сервисам, и удалите все ресурсы, использованные в рамках курса. Если по прохождении курса не удалить используемые здесь ресурсы, на счет AWS будет начисляться плата.

  • Шаг 2. Создание корзины Amazon S3

    Amazon Simple Storage Service (Amazon S3) – это сервис хранения объектов, предлагающий лучшие в отрасли показатели производительности, масштабируемости, доступности и безопасности данных.

    В результате обучения модели вы получаете учебные данные и артефакты моделей. В этом курсе вы будете использовать корзину Amazon S3 для размещения учебных и проверочных наборов данных и сохраните артефакты модели, сгенерированные Amazon SageMaker во время обучения модели.

    Чтобы создать корзину Amazon S3, выполните следующие действия.

    1. Войдите в Консоль управления AWS и откройте консоль Amazon S3.
    2. Нажмите кнопку Создать корзину.
    3. Чтобы задать Имя корзины, введите sagemaker-xx и подставьте вместо xx свои инициалы, чтобы имя корзины было уникальным.
    4. В списке Регион выберите Регион AWS, в котором хотите разместить корзину.
    5. В Настройках корзины оставьте значения Блокирования публичного доступа включенными.
    6. Нажмите кнопку Создать корзину.
  • Шаг 3. Создание инстанса блокнота Amazon SageMaker

    Инстанс блокнота Amazon SageMaker – это полностью управляемый вычислительный инстанс Amazon Elastic Compute Cloud (Amazon EC2) с машинным обучением, который запускает приложение Jupyter Notebook.

    В этом курсе вы используете инстанс блокнота, чтобы создать блокнот Jupyter, который можно использовать для подготовки и обработки данных, и управлять им, а также чтобы обучать и развертывать модели рекомендаций по контенту с машинным обучением.   

    Чтобы создать инстанс блокнота Amazon SageMaker, выполните следующие действия.

    1. Откройте консоль Amazon SageMaker.
    2. Выберите Инстансы блокнота, затем – Создать инстанс блокнота.
    3. В разделе Создать инстанс блокнота введите имя инстанса в поле Имя инстанса блокнота.
    4. В поле Тип инстанса выберите ml.t2.medium. Это наименее дорогой тип, который поддерживают инстансы блокнотов, и он вполне отвечает требованиям.
    5. В поле Роль IAM выберите Создание новой роли, а затем – Создать роль.
    6. Нажмите Создать инстанс блокнота.

    Через несколько минут Amazon SageMaker запускает вычислительный инстанс машинного обучения, в данном случае – блокнот, и подключает к нему том хранилища машинного обучения. Инстанс блокнота включает в себя предварительно настроенный сервер блокнота Jupyter и набор библиотек Anaconda.

  • Шаг 4. Создание блокнота Jupyter

    Вы создаете блокнот Jupyter в инстансе блокнота Amazon SageMaker. Вы также создаете ячейку, которая получает роль IAM, что необходимо для запуска интерфейсов Amazon SageMaker API, и указывает имя корзины Amazon S3, которую вы будете использовать для хранения наборов данных, используемых для обучения, и артефактов модели, получаемых из Amazon SageMaker в результате выполнения задания.

    Чтобы создать блокнота Jupyter, выполните следующие действия.

    1. Откройте консоль Amazon SageMaker.
    2. Выберите Инстансы блокнота, а затем откройте созданный инстанс блокнота, выбрав Открыть Jupyter для просмотра Jupyter в классическом виде или Открыть JupyterLab для просмотра в виде JupyterLab.
      Примечание. Если справа от инстанса блокнота в столбце «Состояние» вы видите статус «Ожидание», блокнот все еще создается. Когда блокнот будет готов к использованию, статус изменится на «Работает».
    3. Создайте блокнот.
      • Если вы открыли блокнот в Jupyter, на вкладке Файлы выберите Новый и conda_python3. Эта предустановленная среда включает в себя установку Anaconda по умолчанию и Python
      • Если вы открыли блокнот в JupyterLab, в меню Файл выберите Новый, а затем – Блокнот. В поле Выберите ядро найдите conda_python3. Эта предустановленная среда включает в себя установку Anaconda по умолчанию и Python 3.
    4. В блокноте Jupyter выберите Файл и Сохранить как, а затем присвойте блокноту имя.

В этом модуле вы ознакомились с примером модели машинного обучения, которую обучали в рамках этого курса. Вы также настроили учетную запись AWS и среду своего курса с помощью корзины Amazon S3, инстанса блокнота Amazon SageMaker и блокнота Jupyter.

Теперь можно приступать к заданиям курса. В следующем модуле вы загрузите, подготовите и разместите свой набор данных.