ما الفرق بين تعلّم الآلة الخاضع للإشراف وغير الخاضع للإشراف؟
تعلّم الآلة (ML) الخاضع للإشراف وغير الخاضع للإشراف هما فئتان من خوارزميات تعلّم الآلة. تعالج خوارزميات تعلُّم الآلة كميات كبيرة من البيانات السابقة لتحديد أنماط البيانات من خلال الاستدلال.
تتدرب خوارزميات التعلم الخاضع للإشراف على عينة البيانات التي تحدد كلاً من مدخلات الخوارزمية ومخرجاتها. على سبيل المثال، يمكن أن تكون البيانات عبارة عن صور لأرقام مكتوبة بخط اليد مشروحة للإشارة إلى الأرقام التي تمثلها. في حال توفر ما يكفي من البيانات المصنفة، سيتعرف نظام التعلم الخاضع للإشراف في النهاية على مجموعات وحدات البكسل والأشكال المرتبطة بكل رقم مكتوب بخط اليد.
في المقابل، تتدرب خوارزميات التعلم غير الخاضع للإشراف على البيانات غير المصنفة. ويمكنها فحص البيانات الجديدة وتأسيس روابط ذات مغزى بين المدخلات غير المعروفة والمخرجات المحددة مسبقًا. على سبيل المثال، يمكن لخوارزميات التعلم غير الخاضع للإشراف تجميع المقالات الإخبارية من مواقع إخبارية مختلفة في فئات شائعة مثل الرياضة والجريمة.
التقنيات: التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف
تتيح لك تقنية تعلّم الآلة (ML) تعليم جهاز كمبيوتر إنشاء توقعات أو استدلالات. أولاً، تستخدم خوارزمية وبيانات نموذجية لتدريب نموذج. بعد ذلك، تدمج نموذجك في تطبيقك لإنشاء الاستدلالات في الوقت الفعلي وعلى نطاق واسع. التعلم الخاضع للإشراف وغير الخاضع للإشراف هما فئتان فريدتان من الخوارزميات.
التعلم تحت الإشراف
في التعلم الخاضع للإشراف، تدرِّب النموذج بمجموعة من بيانات الإدخال ومجموعة مقابلة من بيانات الإخراج المصنفة المرتبطة. عادةً ما يتم التصنيف يدويًا. فيما يلي بعض أنواع تقنيات تعلّم الآلة الخاضع للإشراف.
التراجع اللوجستي
يتنبأ التراجع اللوجستي بمخرجات مصنفة حسب فئات معينة بناءً على مدخل واحد أو أكثر. التصنيف الثنائي هو عندما يتناسب الإخراج مع واحدة من فئتين، مثل "نعم" أو "لا"، و"نجاح" أو "فشل". تصنيف الفئات المتعددة هو عندما يتناسب الإخراج مع أكثر من فئتين، مثل "قط" أو "كلب" أو "أرنب". أحد الأمثلة على التراجع اللوجستي هو توقع إذا كان الطالب سينجح أو يفشل في وحدة ما بناءً على عدد عمليات تسجيل الدخول إلى المنهج التعليمي.
التراجع الخطي
يشير التراجع الخطي إلى نماذج التعلم الخاضع للإشراف التي تتنبأ بقيمة من مقياس مستمر بناءً على مدخل واحد أو أكثر. مثال على التراجع الخطي هو التنبؤ بسعر المنزل. يمكنك التنبؤ بسعر المنزل بناءً على موقعه وعمره وعدد الغرف فيه بعد تدريب نموذج على مجموعة من بيانات التدريب حول المبيعات السابقة باستخدام هذه المتغيرات.
شجرة القرار
تأخذ تقنية تعلّم الآلة الخاضع للإشراف المسماة بشجرة القرار بعض المدخلات المعطاة وتطبق بنية if-else (إذا-وإلا) للتنبؤ بالنتيجة. أحد الأمثلة على مشكلة شجرة القرار هو التنبؤ بانسحاب العملاء. على سبيل المثال، إذا لم يزر أحد العملاء أحد التطبيقات بعد الاشتراك، فقد يتنبأ النموذج بانسحاب العميل. أو إذا كان العميل يصل إلى التطبيق على أجهزة متعددة وكان متوسط وقت الجلسة أعلى من حد معين، فقد يتنبأ النموذج بالاستبقاء.
الشبكة العصبونية
يُعد حل الشبكة العصبونية تقنية أكثر تعقيدًا للتعلم الخاضع للإشراف. لاستخلاص نتيجة معينة، يأخذ الحل بعض المدخلات المعطاة ويؤدي طبقة واحدة أو أكثر من التحويل الرياضي بناءً على ضبط عوامل اتزان البيانات. مثال على تقنية الشبكة العصبونية هو التنبؤ برقم من صورة مكتوبة بخط اليد.
التعلم غير الخاضع للإشراف
تعلّم الآلة غير الخاضع للإشراف هو عندما تعطي الخوارزمية بيانات إدخال بدون أي بيانات إخراج مصنفة. ثم تتعرف الخوارزمية من تلقاء نفسها على الأنماط والعلاقات داخل البيانات وفيما بينها. فيما يلي بعض أنواع تقنيات التعلم غير الخاضع للإشراف.
التجميع
تجمِّع تقنية التعلم غير الخاضع للإشراف المسماة بالتجميع مدخلات بيانات معينة معًا، بحيث يمكن تصنيفها ككل. هناك أنواع مختلفة من خوارزميات التجميع اعتمادًا على بيانات الإدخال. ومن أمثلة التجميع تحديد أنواع مختلفة من حركة مرور الشبكة للتنبؤ بالحوادث الأمنية المحتملة.
تعلم قواعد الارتباط
تكشف تقنيات تعلم قواعد الارتباط عن العلاقات القائمة على القواعد بين المدخلات في مجموعة البيانات. على سبيل المثال، تُجري خوارزمية Apriori تحليل سلة السوق لتحديد قواعد مثل عادة شراء القهوة والحليب معًا.
الكثافة الاحتمالية
تتنبأ تقنيات الكثافة الاحتمالية في التعلم غير الخاضع للإشراف بالاحتمالية أو الإمكانية لوقوع قيمة أحد المخرجات ضمن نطاق ما وإذا كان ذلك يُعد طبيعيًا للإدخال. على سبيل المثال، عادةً ما يسجل مقياس درجة الحرارة في غرفة الخادم بين نطاق درجات معين. إلا أنه إذا قاس فجأة رقمًا منخفضًا بناءً على توزيع الاحتمالات، فقد يشير ذلك إلى عطل في المعدات.
تقليل تعدد الأبعاد
تقليل تعدد الأبعاد هو من تقنيات التعلم غير الخاضع للإشراف ويقلل من عدد الميزات في مجموعة البيانات. غالبًا ما يُستخدم لإجراء معالجة مسبقة للبيانات لوظائف تعلّم الآلة الأخرى وتقليل التعقيد والنفقات العامة. على سبيل المثال، قد يؤدي ذلك إلى تعتيم ميزات الخلفية أو قصها في تطبيق التعرف على الصور.
حالات الاستخدام: التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف
يمكنك استخدام تقنيات التعلم الخاضع للإشراف لحل المشكلات ذات النتائج المعلومة التي تحتوي على بيانات مصنفة متاحة. تتضمن الأمثلة تصنيف البريد الإلكتروني العشوائي، والتعرف على الصور، وتوقعات أسعار الأسهم بناءً على البيانات السابقة المعلومة.
يمكنك استخدام التعلم غير الخاضع للإشراف للسيناريوهات التي فيها تكون البيانات غير مصنفة ويكون الهدف هو اكتشاف الأنماط أو تجميع الحالات المتشابهة أو اكتشاف الحالات الشاذة. يمكنك أيضًا استخدامه للمهام الاستكشافية حيث لا توجد بيانات مصنفة. تشمل الأمثلة تنظيم أرشيفات البيانات الكبيرة، وبناء أنظمة التوصية، وتجميع العملاء بناءً على سلوكياتهم الشرائية.
هل يمكنك استخدام التعلم الخاضع للإشراف وغير الخاضع للإشراف معًا؟
التعلم الخاضع للإشراف الجزئي هو عندما تطبِّق تقنيات التعلم الخاضع للإشراف وغير الخاضع للإشراف على مشكلة شائعة. إنها فئة أخرى في حد ذاتها من تعلّم الآلة.
يمكنك تطبيق التعلم الخاضع للإشراف الجزئي عندما يكون من الصعب الحصول على تصنيفات لمجموعة بيانات. قد تكون لديك بيانات مصنفة حجمها صغير وفي المقابل تكون لديك كمية كبيرة من البيانات غير المصنفة. بالمقارنة مع استخدام مجموعة البيانات المصنفة وحدها، ستحصل على دقة وكفاءة أكبر إن دمجت تقنيات التعلم الخاضع للإشراف وغير الخاضع للإشراف.
فيما يلي بعض الأمثلة على تطبيقات التعلم الخاضع للإشراف الجزئي.
التعرف على حالات الاحتيال
ضمن مجموعة كبيرة من بيانات المعاملات، هناك مجموعة فرعية من البيانات المصنفة أكد الخبراء أنها معاملات احتيالية. للحصول على نتيجة أكثر دقة، سيتدرب حل تعلّم الآلة أولاً على البيانات غير المصنفة ثم على البيانات المصنفة.
تحليل المشاعر
عند النظر في اتساع تفاعلات العملاء النصية للمؤسسة، قد لا يكون تصنيف المشاعر أو فرزها عبر جميع القنوات فعالاً من حيث التكلفة. يمكن للمؤسسة تدريب نموذج على الجزء الأكبر غير المصنف من البيانات أولاً، ثم على عينة من البيانات التي خضعت للتصنيف. وهذا من شأنه أن يوفر للمؤسسة درجة أكبر من الثقة بمشاعر العملاء عبر الأعمال.
تصنيف المستندات
عند تطبيق الفئات على قاعدة مستندات كبيرة، قد يكون هناك عدد كبير جدًا من المستندات على نحو يحول دون تصنيفها فعليًا. على سبيل المثال، قد تكون هذه البيانات عبارة عن تقارير أو نصوص أو مواصفات لا تُعد ولا تُحصى. يساعد التدريب على البيانات غير المصنفة في البداية على تحديد المستندات المماثلة لتصنيفها.
ملخص الاختلافات: التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف
التعلم تحت الإشراف |
التعلم بدون إشراف |
|
ما التعريف؟ |
إنك تدرِّب النموذج بمجموعة من بيانات الإدخال ومجموعة مقابلة من بيانات الإخراج المصنفة المرتبطة. |
إنك تدرِّب النموذج لاكتشاف الأنماط المخفية في البيانات غير المصنفة. |
التقنيات |
التراجع اللوجستي، والتراجع الخطي، وشجرة القرار، والشبكة العصبونية. |
التجميع، وتعلم قواعد الارتباط، وكثافة الاحتمالات، وتقليل تعدد الأبعاد. |
الهدف |
توقع المخرجات بناءً على المدخلات المعلومة. |
تحديد معلومات العلاقة القيِّمة بين نقاط بيانات الإدخال. يمكن بعد ذلك تطبيق ذلك على المدخلات الجديدة لاستخلاص رؤى مماثلة. |
النهج |
تقليل الأخطاء بين المخرجات المتوقعة والتصنيفات الحقيقية. |
البحث عن الأنماط أو أوجه التشابه أو الحالات الشاذة داخل البيانات. |
كيف يمكن لـ AWS المساعدة في التعلم الخاضع للإشراف وغير الخاضع للإشراف؟
تقدم Amazon Web Services (AWS) مجموعة كبيرة من العروض لمساعدتك في مجال تعلُّم الآلة (ML) الخاضع للإشراف وغير الخاضع للإشراف والخاضع للإشراف الجزئي. يمكنك إنشاء حلول بأي حجم أو تعقيد أو حالة استخدام وتشغيلها وتحقيق التكامل معها.
تُعد Amazon SageMaker منصة كاملة لإنشاء حلول تعلّم الآلة من الألف إلى الياء. توفر SageMaker مجموعة كاملة من نماذج منشأة مسبقًا للتعلُّم الخاضع للإشراف وغير الخاضع للإشراف وإمكانات التخزين والحوسبة وبيئة مُدارة بالكامل.
على سبيل المثال، إليك ميزات SageMaker التي يمكنك استخدامها في عملك:
- استخدم Amazon SageMaker Autopilot لاستكشاف الحلول المختلفة تلقائيًا وإيجاد أفضل نموذج لمجموعة بيانات محددة.
- استخدم Amazon SageMaker Data Wrangler لتحديد البيانات وفهم رؤى البيانات وتحويل البيانات لإعدادها لتعلُّم الآلة.
- استخدم اختبارات Amazon SageMaker لتحليل تكرارات تدريبات تعلُّم الآلة (ML) ومقارنتها لاختيار النموذج الأفضل أداءً.
- استخدم Amazon SageMaker Clarify لاكتشاف التحيز المحتمل وقياسه. بهذه الطريقة، يمكن لمطوري تعلُّم الآلة معالجة التحيز المحتمل وشرح تنبؤات النماذج.
ابدأ استخدام تعلُّم الآلة الخاضع للإشراف وغير الخاضع للإشراف على AWS من خلال إنشاء حساب اليوم.
الخطوات التالية على AWS
تعرَّف على كيفية بدء استخدام تعلُّم الآلة الخاضع للإشراف على AWS
تعرَّف على كيفية بدء استخدام تعلُّم الآلة غير الخاضع للإشراف على AWS