تخيّل أنك مطور تعلم آلة يعمل في بنك. طُلب منك أن تطور نموذجًا لتعلم الآلة لمساعدة المحللين في شركتك بكمية الأخبار التي يحتاجون قراءتها لاتخاذ قرارات استثمارية. سيتم تدريب النموذج على مجموعة بيانات 20newsgroups التي تحتوي على معلومات حول 20 موضوعًا في 20000 وثيقة تقريبًا.
كجزء من النموذج الخاص بك، تحتاج إلى استخراج المعلومات الدلالية من بيانات الأخبار، ثم تحدد المقالات الإخبارية المماثلة من المدونة وتقديم توصيات المحتوى لمحللي عناصر الأخبار المماثلة على أساس تلك التي يقرؤونها.
في هذا التمرين المعملي، سوف تتعلم كيفية إنشاء مثيل دفتر الملاحظات Amazon SageMaker، وتنزيل مجموعة بيانات وإعدادها وتنظيمها باستخدام دفتر الملاحظات Jupyter، وتدريب ونشر نموذج الموضوع الخاص بك، وأخيرًا تدريب ونشر نموذج توصية المحتوى.
في الوحدة 1، ستقوم بتكوين بيئتك التي ستستخدمها أثناء التمرين المعملي.
الوقت اللازم لاستكمال الوحدة: 20 دقيقة
في هذه الوحدة، تعرفت على مثال نموذج تعلم الآلة الذي تدربت عليه في هذا التمرين المعملي. يمكنك أيضًا إعداد حساب AWS وبيئة التمرين المعملي الخاصة بك مع حاوية Amazon S3 ومثيل Amazon SageMaker Notebook ودفتر ملاحظات Jupyter.
أنت الآن جاهز لبدء التمرين المعملي. في الوحدة التالية، يمكنك تنزيل مجموعة البيانات وإعدادها وتنظيمها.