ما المقصود بالمحول المولّد المُدرَّب مُسبقًا (GPT)؟
المحولات المولّدة المدرَّبة مسبقًا، والمعروفة بشكل شائع باسم GPT، هي مجموعة من نماذج الشبكات العصبونية التي تستخدم بنية المحولات وتُعد تقدمًا رئيسًا في الذكاء الاصطناعي (AI) الذي يدعم تطبيقات الذكاء الاصطناعي المولّد، مثل ChatGPT. تمنح نماذج GPT التطبيقات القدرة على إنشاء نص ومحتوى (صور، وموسيقى وغير ذلك) على نحو شبيه بصنع البشر والإجابة عن الأسئلة عن طريق محادثات. تستخدم المؤسسات من مختلف القطاعات نماذج GPT والذكاء الاصطناعي المولّد في روبوتات الأسئلة والأجوبة وتلخيص النص وإنشاء المحتوى والبحث.
لماذا يُعد المحوِّل التوليدي مسبق التدريب (GPT) مهمًا؟
تمثل نماذج GPT، لا سيما بنية المحولات التي تستخدمها، إنجازًا بحثيًا كبيرًا في مجال الذكاء الاصطناعي. يُعد ظهور نماذج GPT نقطة تحول في اعتماد تعلُّم الآلة على نطاق واسع؛ نظرًا إلى أنه يمكن استخدام التكنولوجيا الآن لأتمتة وتحسين مجموعة كبيرة من المهام التي تتدرج من الترجمة اللغوية وتلخيص المستندات إلى كتابة منشورات المدونة وإنشاء مواقع ويب وتصميم المؤثرات البصرية وتصميم الرسوم المتحركة وكتابة التعليمات البرمجية والبحث في الموضوعات المعقدة وحتى تأليف القصائد. تكمن قيمة هذه النماذج في سرعتها والنطاق الذي يمكن استخدامها فيه. على سبيل المثال، عندما تحتاج إلى عدة ساعات للبحث عن مقال حول الفيزياء النووية وكتابته وتحريره، يمكن لنموذج المحوِّل التوليدي مسبق التدريب (GPT) إنتاج مقال في ثوانٍ. أطلقت نماذج GPT الأبحاث في مجال الذكاء الاصطناعي (AI) نحو تحقيق الذكاء العام الاصطناعي، ما يعني أن الآلات يمكن أن تساعد المؤسسات في الوصول إلى مستويات جديدة من الإنتاجية وتجارب العملاء وتقديم تطبيقاتها بشكل جديد.
ما حالات استخدام GPT؟
نماذج GPT هي نماذج لغوية مصممة للأغراض العامة يمكنها تنفيذ مجموعة كبيرة من المهام بدءًا من إنشاء المحتوى الأصلي إلى كتابة التعليمات البرمجية وتلخيص النص واستخراج البيانات من المستندات.
فيما يلي بعض طرق استخدام نماذج GPT:
إنشاء محتوى وسائل التواصل الاجتماعي
يمكن للمسوقين الرقميين، بمساعدة الذكاء الاصطناعي (AI)، إنشاء محتوى لحملاتهم على وسائل التواصل الاجتماعي. على سبيل المثال، يمكن للمسوقين مطالبة نموذج GPT بإنتاج نص فيديو توضيحي. يمكن لبرنامج معالجة الصور المدعوم بـ GPT إنشاء أشكال إيمائية ومقاطع فيديو ونسخ تسويقية ومحتويات أخرى من التعليمات النصية.
تحويل النص إلى أنماط مختلفة
تنشئ نماذج GPT نصًا بأنماط غير رسمية ومضحكة واحترافية وأنماط أخرى. تسمح النماذج لمحترفي الأعمال بإعادة كتابة نص معين بشكل مختلف. على سبيل المثال، يمكن للمحامين استخدام نموذج GPT لتحويل النسخ القانونية إلى ملاحظات إيضاحية بسيطة.
كتابة التعليمة البرمجية وتعليمها
كنماذج لغوية، يمكن لنماذج GPT فهم التعليمة البرمجية للكمبيوتر وكتابتها بلغات برمجة مختلفة. يمكن أن تساعد النماذج المتعلمين من خلال شرح برامج الكمبيوتر لهم بلغة الحياة اليومية. يمكن للمطورين ذوي الخبرة أيضًا استخدام أدوات GPT للاقتراح التلقائي للمقتطفات البرمجية ذات الصلة.
تحليل البيانات
يمكن أن يساعد نموذج GPT محللي الأعمال في تجميع كميات كبيرة من البيانات بكفاءة. تبحث النماذج اللغوية عن البيانات المطلوبة وتحسب النتائج وتعرضها في جدول بيانات. يمكن لبعض التطبيقات رسم النتائج على مخطط أو إنشاء تقارير شاملة.
إنتاج مواد تعليمية
يمكن للمعلمين استخدام البرامج المستندة إلى GPT لإنشاء مواد تعليمية، مثل الاختبارات والبرامج التعليمية. وبالمثل، يمكنها استخدام نماذج GPT لتقييم الإجابات.
إنشاء مساعدين صوتيين تفاعليين
تسمح لك نماذج GPT بإنشاء مساعدين صوتيين تفاعليين أذكياء. بينما لا يستجيب العديد من روبوتات الدردشة إلا للمطالبات اللفظية الأساسية، يمكن لنماذج GPT إنتاج روبوتات دردشة بقدرات الذكاء الاصطناعي التحادثي. بالإضافة إلى ذلك، يمكن لروبوتات الدردشة هذه التحدث شفهيًا، مثل البشر عند إقرانها بتقنيات الذكاء الاصطناعي الأخرى.
كيف يعمل GPT؟
على الرغم من أنه من الدقيق وصف نماذج GPT بالذكاء الاصطناعي (AI)، فإنه وصف عام. وبشكل أكثر تحديدًا، تُعد نماذج GPT نماذج للتنبؤ باللغة قائمة على الشبكة العصبونية مصممة في بنية المحول (Transformer). فهي تحلل استعلامات اللغة الطبيعية، المعروفة باسم المطالبات، وتتنبأ بأفضل استجابة ممكنة بناءً على فهمها للغة.
لفعل ذلك، تعتمد نماذج GPT على المعارف التي تكتسبها بعد تدريبها باستخدام مئات المليارات من المعلمات على مجموعات بيانات لغوية ضخمة. يمكنها مراعاة سياق الإدخال والانتباه ديناميكيًا بأجزاء مختلفة من الإدخال؛ ما يجعلها قادرة على إنشاء استجابات طويلة، وليس مجرد الكلمة التالية في التسلسل. على سبيل المثال، عندما يُطلب منك إنشاء جزء من محتوى مستوحى من أسلوب شكسبير، ينفذ نموذج GPT ذلك عن طريق تذكر وإعادة بناء عبارات جديدة وجمل كاملة بأسلوب أدبي مماثل.
هناك أنواع مختلفة من الشبكات العصبونية، مثل الشبكات المتكررة والالتفافية. نماذج GPT عبارة عن شبكات المحولات العصبونية. تستخدم بنية شبكة المحولات العصبونية آليات الانتباه الذاتي للتركيز على أجزاء مختلفة من نص الإدخال أثناء كل خطوة معالجة. يسجل نموذج المحول مزيدًا من السياق ويحسن الأداء في مهام معالجة اللغة الطبيعية (NLP). وهو يحتوي على وحدتين رئيستين سنوضحهما فيما بعد.
القراءة عن معالجة اللغة الطبيعية (NLP) »
أداة الترميز
تعالج المحولات إدخالات النصوص مسبقًا كتضمينات، وهي تمثيلات رياضية لإحدى الكلمات. عند ترميزها في مساحة متجهة، من المتوقع أن تكون الكلمات الأقرب من بعضها البعض أقرب من حيث المعنى. تُعالج التضمينات هذه من خلال عنصر أداة ترميز يسجل المعلومات السياقية الواردة من تسلسل الإدخالات. عندما يتلقى الإدخال، تفصل مجموعة أدوات الترميز لشبكة المحولات الكلمات عن التضمينات وتعين وزنًا لكل منها. الأوزان هي معلمات للإشارة إلى أهمية الكلمات في الجملة.
بالإضافة إلى ذلك، تسمح أدوات ترميز المواضع لنماذج GPT بتفادي المعاني الغامضة عند استخدام كلمة في أجزاء أخرى من الجملة. على سبيل المثال، يسمح ترميز المواضع لنموذج المحول بالتمييز بين الاختلافات الدلالية بين هذه الجمل:
- كلب يطارد قطة
- قطة تطارد كلبًا
لذلك، تعالج أداة الترميز جملة الإدخال وتنشئ تمثيلاً بالمتجهات بطول ثابت، يُعرف باسم التضمين. يُستخدم هذا التمثيل بواسطة وحدة فك الترميز.
أداة فك الترميز
تستخدم أداة فك الترميز التمثيل بالمتجهات للتنبؤ بالمخرج المطلوب. تحتوي على آليات انتباه ذاتي مدمجة بها للتركيز على أجزاء مختلفة من الإدخال وتخمين المخرج المطابق. تساعد التقنيات الرياضية المعقدة أداة فك الترميز في تقدير العديد من المخرجات المختلفة والتنبؤ بأكثر المخرجات دقة.
بالمقارنة مع سابقاتها، مثل الشبكات العصبونية المتكررة، تُعد المحولات أكثر قابلية للموازاة؛ لأنها لا تعالج الكلمات بشكل تسلسلي كل كلمة على حدة، ولكنها بدلاً من ذلك، تعالج الإدخالات بأكملها مرة واحدة أثناء دورة التعلَّم. نظرًا إلى هذا وآلاف الساعات التي قضاها المهندسون في الضبط الدقيق لنماذج GPT وتدريبها، يمكنها تقديم إجابات فصيحة لأي إدخالات تقدمها تقريبًا.
كيف دُرِّب GPT-3؟
في ورقة بحثية منشورة، وصف الباحثون التدريب المسبق المولِّد بأنه القدرة على تدريب النماذج اللغوية باستخدام بيانات غير مصنفة وتحقيق تنبؤ دقيق. طُوَّر أول نموذج من GPT، وهو GPT-1، في عام 2018. طُرح GPT-4 في مارس 2023 كإصدار لاحق لـ GPT-3.
دُرِّب GPT-3 باستخدام أكثر من 175 مليار معلمة أو وزن. درَّبه المهندسون على أكثر من 45 تيرابايت من البيانات الواردة من مصادر، مثل نصوص الويب و Common Crawl والكتب وWikipedia. قبل التدريب، جرى تحسين متوسط جودة مجموعات البيانات مع تطور النموذج من الإصدار 1 إلى الإصدار 3.
دُرِّب GPT-3 في وضع خاضع للإشراف الجزئي. أولاً، زود مهندسو تعلّم الآلة نموذج التعليم العميق ببيانات التدريب غير المصنفة. يفهم GPT-3 الجمل ويحللها ويعيد بناؤها في جمل جديدة. في التدريب غير الخاضع للإشراف، حاول GPT-3 إنتاج نتائج دقيقة وواقعية بذاته. بعد ذلك، يضبط مهندسو تعلّم الآلة النتائج ضبطًا دقيقًا في التدريب الخاضع للإشراف، وهي عملية تُعرف باسم التعلُّم المعزَّز بالملاحظات البشرية (RLHF).
يمكنك استخدام نماذج GPT بدون أي تدريب إضافي، أو يمكنك تخصيصها باستخدام بعض الأمثلة لمهمة معينة.
ما أمثلة بعض التطبيقات التي تستخدم GPT؟
منذ إطلاق نماذج GPT، جلبت الذكاء الاصطناعي (AI) إلى العديد من التطبيقات في مختلف القطاعات. إليك بعض الأمثلة:
- يمكن استخدام نماذج GPT لتحليل ملاحظات العملاء وتلخيصها في نص يسهل فهمه. أولاً، يمكنك جمع بيانات عن مشاعر العملاء من مصادر مثل الاستطلاعات والمراجعات والمحادثات الحية، ثم يمكنك أن تطلب من نموذج GPT تلخيص البيانات.
- يمكن استخدام نماذج GPT لتمكين الشخصيات الافتراضية من التحدث بشكل طبيعي مع اللاعبين البشريين في الواقع الافتراضي.
- يمكن استخدام نماذج GPT لتوفير تجربة بحث أفضل لموظفي مكتب المساعدة. ويمكنها الاستعلام عن قاعدة معارف المنتج بلغة تحادثية لاستعراض معلومات المنتج ذات الصلة.
كيف يمكن لـ AWS مساعدتك في تشغيل نماذج لغوية كبيرة، مثل GPT-3؟
تُعد Amazon Bedrock أسهل طريقة لإنشاء تطبيقات الذكاء الاصطناعي المولّد وتوسيع نطاقها باستخدام نماذج اللغة كبيرة (LLMs)، تُعرف أيضًا باسم نماذج التأسيس (FMs)، المشابهة لنماذج GPT-3. تتيح لك Amazon Bedrock الوصول عبر واجهة برمجة التطبيقات (API) إلى نماذج التأسيس من الشركات الناشئة الرائدة في مجال الذكاء الاصطناعي، ومنها AI21 Labs وAnthropic وStability AI، جنبًا إلى جنب مع أحدث مجموعة لنماذج التأسيس من Amazon، وهي نماذج التأسيس لـ Amazon Titan. من خلال التجربة بلا خادم لـ Bedrock، يمكنك البدء بتخصيص نماذج التأسيس (FM) بشكل سريع وخاص باستخدام بياناتك الخاصة ودمجها ونشرها بسهولة في تطبيقاتك باستخدام أدوات AWS وإمكانياتها التي تعرفها (منها عمليات التكامل مع ميزات تعلّم الآلة لـ Amazon SageMaker، مثل Experiments لاختبار نماذج ومسارات مختلفة لإدارة نماذج التأسيس (FM) على نطاق واسع) بدون الحاجة إلى إدارة أي بنية تحتية. تعرَّف على المزيد عن الإنشاء باستخدام نماذج التأسيس على Amazon Bedrock.