ในโมดูลนี้ คุณจะต้องใช้อัลกอริทึม Neural Topic Model (NTM) ในตัวของ Amazon SageMaker เพื่อฝึกฝนโมเดลหัวข้อ
Amazon SageMaker NTM คือ อัลกอริทึมการเรียนรู้แบบไม่มีผู้สอนที่ใช้ในการจัดระเบียบคลังข้อมูลเอกสารให้เป็นหัวข้อต่างๆ ที่ประกอบด้วยการจัดกลุ่มคำตามการแจกแจงเชิงสถิติ เอกสารที่ประกอบด้วยคำที่ปรากฏบ่อย เช่น "จักรยาน", "รถยนต์", "รถไฟ", "ไมล์" และ "ความเร็ว" มีแนวโน้มที่จะอยู่ในหัวข้อเกี่ยวกับ "การคมนาคม" ร่วมกัน เป็นต้น การสร้างโมเดลหัวข้อสามารถใช้ในการแยกประเภทหรือสรุปเอกสารตามหัวข้อที่ตรวจพบ หรือใช้ในการค้นคืนข้อมูลหรือแนะนำเนื้อหาตามความคล้ายคลึงของหัวข้อได้ หัวข้อจากเอกสารที่ NTM เรียนรู้จะถูกอธิบายลักษณะเป็นกลุ่มคำแฝง เนื่องจากระบบจะอนุมานหัวข้อจากการแจกแจงคำที่สังเกตได้ในคลังข้อมูล โดยปกติ ระบบจะอนุมานความหมายของหัวข้อโดยการพิจารณาคำที่ถูกจัดอันดับสูงสุดในหัวข้อ เนื่องจากวิธีนี้เป็นแบบไม่มีผู้สอน จึงมีเพียงจำนวนของหัวข้อเท่านั้นที่ถูกกำหนดไว้ล่วงหน้า โดยไม่รวมถึงตัวหัวข้อเอง นอกจากนี้ อัลกอริทึมนี้ไม่รับประกันว่าหัวข้อจะตรงกับวิธีที่มนุษย์อาจใช้ในการจัดหมวดหมู่เอกสารตามปกติ
ในขั้นตอนต่อไปนี้ คุณจะต้องกำหนดอัลกอริทึม NTM สำหรับงานฝึกฝน กำหนดโครงสร้างพื้นฐานสำหรับโมเดล ตั้งค่าไฮเปอร์พารามิเตอร์เพื่อปรับจูนโมเดล และเรียกใช้โมเดล จากนั้น คุณจะต้องปรับใช้โมเดลไปยังตำแหน่งข้อมูลที่จัดการโดย Amazon SageMaker เพื่อสร้างการคาดการณ์
ระยะเวลาที่ใช้ในการศึกษาโมดูล: 20 นาที
ในโมดูลนี้ คุณได้เรียกใช้อัลกอริทึม Amazon SageMaker Neural Topic Model (NTM) จาก Amazon ECR จากนั้นคุณได้กำหนดไฮเปอร์พารามิเตอร์เฉพาะอัลกอริทึม และจัดเตรียมบัคเก็ต Amazon S3 สำหรับจัดเก็บอาร์ทิแฟกต์ ถัดไป คุณได้ปรับใช้โมเดลไปยังตำแหน่งข้อมูลโดยใช้บริการโฮสต์ Amazon SageMaker หรือการแปลงเป็นชุด สุดท้าย คุณได้สำรวจโมเดลโดยใช้ค่าที่แตกต่างกันไปสำหรับจำนวนหัวข้อ
ในโมดูลถัดไป คุณจะได้ฝึกฝนและปรับใช้โมเดลการแนะนำเนื้อหา
