Bayangkan Anda adalah pengembang machine learning yang bekerja di bank. Anda telah diminta mengembangkan model machine learning untuk membantu analis di perusahaan dengan sejumlah berita yang perlu mereka baca untuk membuat keputusan investasi. Model ini akan dilatih di dataset 20newsgroups yang berisi informasi tentang 20 topik yang berjumlah sekitar 20.000 dokumen.
Sebagai bagian dari model, Anda perlu mengekstrak informasi semantik dari data berita, kemudian mengidentifikasi artikel berita dari korpus, dan memberikan rekomendasi konten kepada analis untuk item berita yang serupa berdasarkan yang sedang Anda baca.
Di lab ini, Anda belajar tentang cara membuat instans Notebook Amazon SageMaker, mengunduh, menyiapkan, dan mengeksekusi dataset menggunakan Jupyter notebook, melatih dan menerapkan model topik, serta terakhir melatih dan menerapkan model rekomendasi konten.
Dalam Modul 1, Anda mengonfigurasi lingkungan yang digunakan selama di lab.
Waktu untuk Menyelesaikan Modul: 20 Menit
Dalam modul ini, Anda mempelajari tentang model ML contoh yang Anda latih di lab ini. Anda juga menyiapkan akun AWS dan lingkungan lab dengan bucket Amazon S3, instans Notebook Amazon SageMaker, dan Jupyter notebook.
Anda kini siap memulai lab. Di modul berikutnya, Anda mengunduh, menyiapkan, dan mengeksekusi dataset Anda.