في هذه الوحدة، سوف تستخدم لوغاريتم أقرب مجاور-K (k-NN) المدمج في Amazon SageMaker لتدريب نموذج توصيات المحتوى.
إن تقنية أقرب مجاور-K (k-NN) في Amazon SageMaker عبارة عن لوغاريتم تعلّم لا بارامتري قائم على الفهرس الخاضع للإشراف ويمكن استخدامه لمهام التصنيف والتراجع. للتصنيف، يستفسر اللوغاريتم عن أقرب نقاط k من الهدف ويعرض التسمية الأكثر استخدامًا في فئتها في شكل تسمية متوقعة. وبسبب مشاكل التراجع، يعرض اللوغاريتم متوسط القيم المتوقعة التي تعرضها أقرب مجاورات k.
التدريب على لوغاريتم k-NN له ثلاث خطوات: إنشاء النماذج وتقليل الأبعاد وإنشاء الفهرس. يقلل إنشاء النماذج حجم مجموعة البيانات الأولية بحيث تتناسب مع الذاكرة. وبالنسبة إلى تقليل الأبعاد، يقلل اللوغاريتم بُعد الميزة الخاص بالبيانات للحد من تأثير نموذج k-NN في الذاكرة وزمن الانتقال إلى الاستدلال. نقدم طريقتين لتقليل الأبعاد، هما: التنبؤ العشوائي وتحويل Johnson-Lindenstrauss السريع. عادة ما نستخدم تقليل الأبعاد لمجموعات البيانات ذات الأبعاد الكبيرة (d >1000) لتجنب «لعنة الأبعاد» التي تسبب مشاكل في التحليلات الإحصائية للبيانات التي تتفرق مع تزايد الأبعاد. الهدف الأساسي من تدريب k-NN هو إنشاء الفهرس. يتيح الفهرس عمليات البحث الفعالة عن المسافات بين النقاط التي لم يتم تحديد قيمها أو تسميات فئتها وأقرب نقاط k لاستخدامها من أجل الاستدلال.
في الخطوات التالية، حدد لوغاريتم k-NN من أجل مهمة تدريب واضبط قيم المعلمة الفائقة لضبط النموذج وقم بتشغيله. ثم انشر النموذج على نقطة النهاية التي يديرها Amazon SageMaker لوضع التنبؤات.
الوقت اللازم لاستكمال الوحدة: 20دقيقة
تهانينا! في هذه الوحدة، تدربت على نموذج توصية المحتوى وقمت بنشره واستكشافه.
في الوحدة التالية، ستقوم بتنظيف الموارد التي استخدمتها في هذا التمرين المعملي.