จินตนาการว่าคุณเป็นนักพัฒนาแมชชีนเลิร์นนิ่งที่ทำงานอยู่ในธนาคารแห่งหนึ่ง คุณได้รับคำขอให้พัฒนาโมเดลแมชชีนเลิร์นนิ่งเพื่อช่วยนักวิเคราะห์ในบริษัทของคุณซึ่งมีข้อมูลข่าวสารจำนวนมากที่จำเป็นต้องอ่านเพื่อตัดสินใจเกี่ยวกับการลงทุน โมเดลดังกล่าวจะได้รับการฝึกฝนด้วยชุดข้อมูลกลุ่มข่าวจำนวน 20 ชุดที่ประกอบไปด้วยข้อมูลใน 20 หัวข้อจากเอกสารประมาณ 20,000 ฉบับ

ในส่วนหนึ่งของโมเดล คุณจำเป็นต้องดึงข้อมูลเชิงความหมายออกมาจากข้อมูลข่าวสาร จากนั้น จะต้องระบุบทความข่าวที่คล้ายกันจากคลังข้อมูล และให้การแนะนำเนื้อหาแก่นักวิเคราะห์สำหรับข่าวที่คล้ายกันโดยอิงจากข่าวที่นักวิเคราะห์กำลังอ่านอยู่

ในแล็บนี้ คุณจะได้เรียนรู้วิธีสร้างอินสแตนซ์โน้ตบุ๊กของ Amazon SageMaker, ดาวน์โหลด, เตรียม และกำหนดระยะให้แก่ชุดข้อมูลโดยใช้โน้ตบุ๊ก Jupyter, ฝึกฝนและปรับใช้โมเดลหัวข้อของคุณ และสุดท้าย คุณจะฝึกฝนและปรับใช้โมเดลการแนะนำเนื้อหา

ในโมดูลที่ 1 คุณจะกำหนดค่าสภาพแวดล้อมที่คุณใช้ในแล็บ

ระยะเวลาที่ใช้ในการศึกษาโมดูล: 20 นาที

 


  • ขั้นตอนที่ 1: สร้างบัญชี AWS

    ใช้บัญชี AWS ส่วนตัวหรือสร้างบัญชี AWS ใหม่สำหรับแล็บนี้ อย่าใช้บัญชีขององค์กรเพื่อที่จะเข้าถึงบริการที่จำเป็นได้อย่างสมบูรณ์ และอย่าทิ้งทรัพยากรใดๆ ไว้ในแล็บ หากคุณไม่ลบทรัพยากรที่ใช้ในแล็บนี้เมื่อดำเนินการเสร็จ คุณอาจต้องเสียค่าใช้จ่าย AWS

  • ขั้นตอนที่ 2: สร้างบัคเก็ต Amazon S3

    Amazon Simple Storage Service (Amazon S3) คือบริการพื้นที่จัดเก็บอ็อบเจกต์ที่มอบการปรับขนาด ความพร้อมใช้งานของข้อมูล ความปลอดภัย และประสิทธิภาพระดับชั้นนำในอุตสาหกรรม

    การฝึกฝนโมเดลจะทำให้ได้ข้อมูลการฝึกฝนโมเดลและอาร์ทิแฟกต์ของโมเดลออกมา ในแล็บนี้ คุณจะใช้บัคเก็ต Amazon S3 เพื่อกำหนดระยะให้กับชุดข้อมูลสำหรับการฝึกฝนและชุดข้อมูลสำหรับการตรวจสอบความถูกต้อง และจัดเก็บอาร์ทิแฟกต์ของโมเดลที่ Amazon SageMaker สร้างขึ้นระหว่างการฝึกฝนโมเดล

    วิธีการสร้างบัคเก็ต Amazon S3:

    1. ลงชื่อเข้าใช้ AWS Management Console และเปิด Amazon S3 Console
    2. เลือก Create bucket (สร้างบัคเก็ต)
    3. ในส่วนของ Bucket name (ชื่อบัคเก็ต) ให้พิมพ์ sagemaker-xx โดยที่ xx คือชื่อย่อของคุณเพื่อทำให้ชื่อบัคเก็ตไม่ซ้ำกัน
    4. ใน Region (เขต) ให้เลือก AWS Region (เขตของ AWS) ที่คุณต้องการให้บัคเก็ตอยู่
    5. ใน Bucket settings (การตั้งค่าบัคเก็ต) สำหรับ Block Public Access (บล็อกการเข้าถึงจากสาธารณะ) ให้ปล่อยการตั้งค่าดังกล่าวเปิดใช้งานไว้
    6. เลือก Create bucket (สร้างบัคเก็ต)
  • ขั้นตอนที่ 3: สร้างอินสแตนซ์โน้ตบุ๊กของ Amazon SageMaker

    อินสแตนซ์โน้ตบุ๊กของ Amazon SageMaker คืออินสแตนซ์การประมวลผล Amazon Elastic Compute Cloud (Amazon EC2) ของแมชชีนเลิร์นนิ่ง (ML) ที่มีการจัดการอย่างเต็มรูปแบบซึ่งเรียกใช้แอป Jupyter Notebook

    ในแล็บนี้ คุณจะใช้อินสแตนซ์โน้ตบุ๊กเพื่อสร้างและจัดการโน้ตบุ๊ก Jupyter ซึ่งคุณสามารถใช้เพื่อเตรียมและประมวลผลข้อมูล และเพื่อฝึกฝนและปรับใช้โมเดลแมชชีนเลิร์นนิ่งการแนะนำเนื้อหาของคุณ   

    วิธีการสร้างอินสแตนซ์โน้ตบุ๊กของ Amazon SageMaker:

    1. เปิด Amazon SageMaker Console
    2. เลือก Notebook instances (อินสแตนซ์โน้ตบุ๊ก) แล้วเลือก Create notebook instance (สร้างอินสแตนซ์โน้ตบุ๊ก)
    3. ในหน้า Create notebook instance (สร้างอินสแตนซ์โน้ตบุ๊ก) ให้พิมพ์ชื่อสำหรับอินสแตนซ์โน้ตบุ๊กสำหรับ Notebook instance name (ชื่ออินสแตนซ์โน้ตบุ๊ก)
    4. สำหรับ Instance type (ประเภทอินสแตนซ์) ให้เลือก ml.t2.medium อินสแตนซ์นี้เป็นประเภทอินสแตนซ์ที่แพงน้อยที่สุดที่อินสแตนซ์โน้ตบุ๊กรองรับ และเพียงพอสำหรับแบบฝึกหัดนี้
    5. สำหรับ IAM role (บทบาท IAM) ให้เลือก Create a new role (สร้างบทบาทใหม่) แล้วเลือก Create role (สร้างบทบาท)
    6. เลือก Create notebook instance (สร้างอินสแตนซ์โน้ตบุ๊ก)

    ในเวลาไม่กี่นาที Amazon SageMaker จะเปิดใช้งานอินสแตนซ์การประมวลผล ML ในกรณีนี้คือ อินสแตนซ์โน้ตบุ๊ก และจะแนบพื้นที่จัดเก็บไดรฟ์ข้อมูล ML ไปกับอินสแตนซ์ อินสแตนซ์โน้ตบุ๊กมีเซิร์ฟเวอร์โน้ตบุ๊ก Jupyter ที่กำหนดค่าไว้ล่วงหน้า และชุดของไลบรารี Anaconda

  • ขั้นตอนที่ 4: สร้างโน้ตบุ๊ก Jupyter

    คุณจะสร้างโน้ตบุ๊ก Jupyter ในอินสแตนซ์โน้ตบุ๊กของ Amazon SageMaker นอกจากนี้ คุณยังจะสร้างเซลล์ที่รับบทบาท IAM ที่โน้ตบุ๊กของคุณจำเป็นต้องใช้เพื่อเรียกใช้ Amazon SageMaker API และระบุชื่อของบัคเก็ต Amazon S3 ที่คุณจะใช้เพื่อจัดเก็บชุดข้อมูลที่คุณใช้เป็นข้อมูลสำหรับการฝึกฝนและอาร์ทิแฟกต์ของโมเดลที่เป็นผลลัพธ์จากงานการฝึกฝนของ Amazon SageMaker

    วิธีการสร้างโน้ตบุ๊ก Jupyter:

    1. เปิด Amazon SageMaker Console
    2. เลือก Notebook Instances (อินสแตนซ์โน้ตบุ๊ก) แล้วเปิดอินสแตนซ์โน้ตบุ๊กที่คุณสร้างขึ้นโดยเลือก Open Jupyter (เปิด Jupyter) สำหรับมุมมองของ Juypter แบบคลาสสิก หรือ Open JupyterLab (เปิด JupyterLab) สำหรับมุมมองแบบ JupyterLab
      หมายเหตุ: หากคุณเห็นสถานะ Pending (รอดำเนินการ) ที่ด้านขวาของอินสแตนซ์โน้ตบุ๊กในคอลัมน์สถานะ แสดงว่าระบบกำลังสร้างโน้ตบุ๊กของคุณอยู่ สถานะจะเปลี่ยนเป็น InService (พร้อมใช้งาน) เมื่อโน้ตบุ๊กพร้อมใช้งาน
    3. สร้างโน้ตบุ๊ก
      • หากคุณเปิดโน้ตบุ๊กใน Jupyter, บนแท็บ Files (ไฟล์) ให้เลือก New (สร้าง) และ conda_python3 สภาพแวดล้อมที่ติดตั้งไว้ล่วงหน้าได้แก่ การติดตั้ง Anaconda ตามค่าเริ่มต้นและ Python
      • หากคุณเปิดโน้ตบุ๊กใน JupyterLab บนเมนู File (ไฟล์) ให้เลือก New (สร้าง) แล้วเลือก Notebook (โน้ตบุ๊ก) สำหรับ Select Kernel ให้เลือก conda_python3 สภาพแวดล้อมที่ติดตั้งไว้ล่วงหน้าได้แก่ การติดตั้ง Anaconda ตามค่าเริ่มต้นและ Python 3
    4. ในโน้ตบุ๊ก Jupyter, ให้เลือก File (ไฟล์) และ Save as (บันทึกเป็น) แล้วตั้งชื่อโน้ตบุ๊ก

ในโมดูลนี้ คุณได้เรียนรู้เกี่ยวกับโมเดล ML ตัวอย่างที่คุณฝึกฝนในแล็บนี้ นอกจากนี้ คุณยังได้ตั้งค่าบัญชี AWS และสภาพแวดล้อมของแล็บด้วยบัคเก็ต Amazon S3, อินสแตนซ์โน้ตบุ๊กของ Amazon SageMaker และโน้ตบุ๊ก Jupyter

ตอนนี้คุณพร้อมที่จะเริ่มต้นใช้แล็บแล้ว ในโมดูลถัดไป คุณจะดาวน์โหลด เตรียม และกำหนดระยะให้แก่ชุดข้อมูลของคุณ