Bayangkan Anda adalah pengembang machine learning yang bekerja di bank. Anda telah diminta mengembangkan model machine learning untuk membantu analis di perusahaan dengan sejumlah berita yang perlu mereka baca untuk membuat keputusan investasi. Model ini akan dilatih di dataset 20newsgroups yang berisi informasi tentang 20 topik yang berjumlah sekitar 20.000 dokumen.

Sebagai bagian dari model, Anda perlu mengekstrak informasi semantik dari data berita, kemudian mengidentifikasi artikel berita dari korpus, dan memberikan rekomendasi konten kepada analis untuk item berita yang serupa berdasarkan yang sedang Anda baca.

Di lab ini, Anda belajar tentang cara membuat instans Notebook Amazon SageMaker, mengunduh, menyiapkan, dan mengeksekusi dataset menggunakan Jupyter notebook, melatih dan menerapkan model topik, serta terakhir melatih dan menerapkan model rekomendasi konten.

Dalam Modul 1, Anda mengonfigurasi lingkungan yang digunakan selama di lab.

Waktu untuk Menyelesaikan Modul: 20 Menit

 


  • Langkah 1: Buat Akun AWS

    Gunakan akun AWS atau buat akun AWS baru untuk lab ini. Jangan menggunakan akun organisasional sehingga Anda memiliki akses penuh ke layanan yang diperlukan dan tidak meninggalkan sumber daya apa pun dari lab. Jika Anda tidak menghapus sumber daya yang digunakan di lab ini setelah selesai, Anda dapat dikenakan biaya AWS.

  • Langkah 2: Membuat bucket Amazon S3

    Amazon Simple Storage Service (Amazon S3) adalah layanan penyimpanan objek yang menawarkan skalabilitas, ketersediaan data, keamanan, dan kinerja yang terdepan di industri.

    Melatih model memproduksi data pelatihan model dan artefak model. Di lab ini, Anda menggunakan bucket Amazon S3 untuk mengeksekusi pelatihan dan memvalidasi dataset, serta menyimpan artefak model yang dihasilkan oleh Amazon SageMaker selama pelatihan model.

    Untuk membuat bucket Amazon S3:

    1. Masuk ke AWS Management Console dan buka konsol Amazon S3.
    2. Pilih Buat Bucket.
    3. Untuk Nama bucket, ketik sagemaker-xx di mana xx adalah inisial untuk membuat nama bucket unik.
    4. Di Wilayah, pilih AWS Region tempat Anda ingin bucket Anda berada.
    5. Di Pengaturan bucket untuk Akses Publik Blok, biarkan pengaturan diaktifkan.
    6. Pilih Buat Bucket.
  • Langkah 3: Membuat instans Notebook Amazon SageMaker

    Instans nootebook Amazon SageMaker adalah instans komputasi Amazon Elastic Compute Cloud (Amazon EC2) machine learning (ML) yang dikelola sepenuhnya yang menjalankan Aplikasi Jupyter Notebook.

    Di lab ini, Anda menggunakan instans notebook untuk membuat dan mengelola Jupyter notebook yang dapat Anda gunakan untuk menyiapkan dan memproses data, serta untuk melatih dan menerapkan model machine learning rekomendasi konten.   

    Untuk membuat instans Notebook Amazon SageMaker:

    1. Buka konsol Amazon SageMaker.
    2. Pilih Instans notebook, lalu pilih Buat instans notebook.
    3. Di halaman Buat instans notebook, untuk Nama instans notebook, ketik nama untuk instans notebook Anda.
    4. Untuk Jenis instans, pilih ml.t2.medium. Ini merupakan jenis instans yang paling murah yang didukung instans notebook, dan cukup untuk latihan ini.
    5. Untuk peran IAM, pilih Buat peran baru, lalu pilih Buat peran.
    6. Pilih Buat instans notebook.

    Dalam beberapa menit, Amazon SageMaker meluncurkan instans komputasi ML, dalam hal ini instans notebook, dan melampirkan volume penyimpanan ML ke dalamnya. Instans notebook memiliki server Jupyter notebook yang dikonfigurasi sebelumnya, dan serangkaian pustaka Anaconda.

  • Langkah 4: Membuat Jupyter notebook

    Anda membuat Jupyter notebook di instans Notebook Amazon SageMaker Anda. Anda juga membuat sel yang mendapatkan peran IAM di mana notebook Anda perlu menjalankan API Amazon SageMaker dan menentukan nama bucket Amazon S3 yang akan Anda gunakan untuk menyimpan dataset yang Anda gunakan untuk data pelatihan dan artefak model yang dihasilkan tugas pelatihan Amazon SageMaker.

    Untuk membuat Jupyter notebook:

    1. Buka konsol Amazon SageMaker.
    2. Pilih Instans Notebook, lalu buka instans notebook yang Anda buat dengan memilih Buka Jupyter untuk tampilan Jupyter klasik, atau Buka JupyterLab untuk tampilan JupyterLab.
      Catatan: Jika Anda melihat Tertunda di sebelah kanan instans notebook di kolom Status, notebook Anda akan tetap dibuat. Status tersebut akan berubah ke Dalam Layanan ketika notebook siap digunakan.
    3. Buat notebook.
      • Jika Anda membuka notebook di Jupyter, di tab File, pilih Baru, kemudian conda_python3. Lingkungan yang diinstal sebelumnya termasuk penginstalan Anaconda default dan Python
      • Jika Andda membuka notebook di JupyterLab, pada menu File, pilih Baru, kemudian pilih Notebook. Untuk Pilih Kernel, pilih conda_python3. Lingkungan yang diinstal sebelumnya termasuk penginstalan Anaconda default dan Python 3.
    4. Di Jupyter notebook, pilih File dan Simpan sebagai, lalu nama notebook.

Dalam modul ini, Anda mempelajari tentang model ML contoh yang Anda latih di lab ini. Anda juga menyiapkan akun AWS dan lingkungan lab dengan bucket Amazon S3, instans Notebook Amazon SageMaker, dan Jupyter notebook.

Anda kini siap memulai lab. Di modul berikutnya, Anda mengunduh, menyiapkan, dan mengeksekusi dataset Anda.