في هذه الوحدة، يمكنك استخدام لوغاريتم نموذج الموضوع العصبي (NTM) في Amazon SageMaker لتدريب نموذج الموضوع.
إن نموذج الموضوع العصبي Amazon SageMaker NTM هو لوغاريتم تعلّم بدون إشراف يُستخدم لتنظيم مجموعة كبيرة من المستندات داخل موضوعات تحتوي على مجموعات من الكلمات بناءً على التوزيع الإحصائي الخاص بها. من المحتمل أن تتشارك المستندات التي تحتوي على تكرارات كلمات مثل "دراجة" و "سيارة" و "قطار" و "المسافة المقطوعة" و "السرعة" في موضوع حول "وسائل النقل" على سبيل المثال. يمكن استخدام نموذج الموضوع لتصنيف أو تلخيص المستندات بناءً على الموضوعات المكتشفة أو لاسترداد المعلومات أو التوصية بالمحتوى بناءً على أوجه التشابه بين الموضوعات. يتم تمييز الموضوعات من المستندات التي يتعلمها لوغاريتم NTM على أنها تمثيل كامن لأنه يتم استنتاج الموضوعات من توزيعات الكلمات الملحوظة في المجموعة. عادة ما يتم استنتاج دلالات المواضيع من خلال فحص الكلمات ذات التصنيف الأعلى التي تحتوي عليها. ونظرًا لأن الطريقة غير خاضعة للرقابة، فإن عدد المواضيع فقط، وليس الموضوعات نفسها، يكون محددًا مسبقًا. بالإضافة إلى ذلك، لا يتم ضمان محاذاة الموضوعات مع كيفية تصنيف البشر بشكل طبيعي للمستندات.
في الخطوات التالية، حدد لوغاريتم NTM لمهمة التدريب، مع تحديد البنية التحتية للنموذج وتعيين قيم المعلمات الفائقة لضبط النموذج وتشغيله. بعد ذلك، قم بنشر النموذج إلى نقطة نهاية يديرها Amazon SageMaker لوضع تنبؤات.
الوقت اللازم لاستكمال الوحدة: 20 دقيقة
في هذه الوحدة، قم باستعادة لوغاريتم نموذج الموضوع العصبي (NTM) في Amazon SageMaker من Amazon ECR. بعد ذلك، قم بتحديد معلمات فائقة خاصة باللوغاريتمات وقدمت حاوية Amazon S3 لتخزين الأدوات. بعد ذلك، قمت بنشر النموذج إلى نقطة نهاية باستخدام خدمات استضافة Amazon SageMaker أو تحويل الحزمة. وأخيرًا، قمت باستكشاف النموذج باستخدام قيم مختلفة لعدد الموضوعات.
في الوحدة التالية، ستقوم بتدريب نموذج توصية المحتوى الخاص بك ونشره.