توفر Amazon Comprehend معالجة اللغة الطبيعية، واكتشاف معلومات التعريف الشخصية (PII) وتنقيحها، والتصنيف المخصص واكتشاف الكيانات، ونمذجة الموضوعات، وهذا يتيح مجموعةً كبيرةً من التطبيقات التي تحلل النص الخام، وباستخدام بعض واجهات برمجة التطبيقات تحلل المستندات بتنسيقات مثل PDF وWord.
- معالجة اللغات الطبيعية : يُمكن استخدام واجهات برمجة التطبيقات المتاحة في خدمة Amazon Comprehend الخاصة بإجراء عمليات التعرف على الكيانات، وتحليل المشاعر، وتحليل بناء الجملة، واستخراج العبارات الأساسية، واكتشاف اللغة في استخلاص الرؤى من نص اللغات الطبيعية. تُقاس هذه الطلبات بوحدات تبلغ 100 حرف (الوحدة الواحدة = 100 حرف)، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.
- معلومات تعريف الشخصية (PII): تبحث الواجهة detect PII API (واجهة برمجة التطبيقات الخاصة باكتشاف معلومات تعريف الشخصية) عن مواقع كيانات معلومات تعريف الشخصية ("PII") المختارة داخل مستند ويمكن استخدامها في إنشاء نسخ منقّحة من المستندات. تُخبرك الواجهة contains PII API (واجهة برمجة التطبيقات الخاصة باحتواء معلومات تعريف الشخصية) ما إذا كان المستند يحتوي على معلومات تعريف الشخصية (PII) المختارة أم لا. تُقاس هذه الطلبات أيضًا بوحدات تبلغ 100 حرف (الوحدة الواحدة = 100 حرف)، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.
- خدمة Comprehend المخصصة: يمكن لواجهة برمجة التطبيقات الخاصة بميزة التصنيف المخصص وواجهة برمجة التطبيقات الخاصة بميزة الكيانات أن تقوما بتدريب نموذج معالجة لغة طبيعية (NLP) مخصص لتصنيف النص واستخراج الكيانات المخصصة. تُقاس طلبات الاستدلال غير المتزامنة بوحدات تبلغ 100 حرف، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب. تتحمل تكلفة تُقدَّر بـ 3 USD في الساعة مقابل التدريب الخاص بالنموذج (يتم إعداد الفاتورة بالثواني) و0.50 USD شهريًا لإدارة النموذج المخصص. بالنسبة إلى طلبات الاستدلال المتزامنة الخاصة بالتصنيف المخصص والكيانات، يمكنك توفير نقطة نهاية ذات معدل نقل مناسب. يتم احتساب التكلفة التي تتحملها من وقت بدء نقطة النهاية حتى يتم حذفها.
- بناء نماذج الموضوعات: تقوم ميزة بناء نماذج الموضوعات (Topic Modeling) بتحديد المصطلحات أو الموضوعات ذات الصلة من بين مجموعة من المستندات المخزَّنة في Amazon S3. وتحدد هذه الميزة الموضوعات الأكثر شيوعًا في المجموعة، وتقوم بتنظيمها في مجموعات ثم تقوم بتعيين المستندات إلى الموضوعات التي تنتمي إليها. يتم احتساب التكلفة عليك بناءً على إجمالي حجم المستندات التي تتم معالجتها في كل مهمة. ويتم احتساب تكلفة ثابتة على أول 100 ميجابايت. بعد تخطي 100 ميجابايت، تُحتسب التكلفة نظير كل ميجابايت.
- الثقة والأمان (جديد): يمكن استخدام واجهة برمجة تطبيقات اكتشاف المحتوى السيئ في Comprehend للكشف عن المحتوى السيئ من النص. وبالمثل، يمكن استخدام ميزة تصنيف سلامة المطالبات لـ Comprehend لاكتشاف مطالبات الإدخال غير الآمنة في التطبيقات ونماذج اللغة الكبيرة. تُقاس هذه الطلبات بوحدات تبلغ 100 حرف (الوحدة الواحدة = 100 حرف)، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.
- للاطلاع على تسعير Amazon Comprehend Medical، تعرَّف على المزيد هنا.
- يمكنك تقدير قيمة تكاليفك باستخدام حاسبة التسعير في AWS.
- حدد منطقة شرق الولايات المتحدة (فرجينيا الشمالية) في أداة تحديد المنطقة أدناه لعرض التسعير لجميع واجهات برمجة التطبيقات (API)
مع واجهات برمجة تطبيقات Amazon Comprehend، يمكنك معالجة النص الأولي غير المهيكل باستخدام بعض واجهات برمجة التطبيقات، وكذلك معالجة ملفات نصية مثل مستندات PDF وWord.
يتم قياس طلبات الاستنباط بوحدات تبلغ 100 حرف، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.
يتم قياس طلبات الاستنباط بوحدات تبلغ 100 حرف، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.
يتم إعداد فواتير تكلفة نقاط النهاية بزيادات تبلغ ثانية واحدة، وبحدٍّ أدنى 60 ثانية. سيستمر احتساب التكاليف من وقت بدء نقطة النهاية إلى أن يتم حذفها حتى وإن لم يتم تحليل أي مستندات.
توفر وحدة استدلال (IU) واحدة معدل نقل يبلغ 100 حرف في الثانية على نقطة النهاية المُدارة. يمكنك توفير وحدات استدلال إضافية لزيادة معدل النقل. ستتحمل كل وحدة استدلال تكلفة قدرها 0.0005 USD في الثانية.
*لاستخراج نص من مستندات PDF ممسوحة ضوئيًا، يجري استدعاء واجهة برمجة التطبيقات الخاصة باكتشاف نصوص المستندات في Amazon Textract.
لأول 100 ميجابايت
لكل ميجابايت تتعدى أول 100 ميجابايت
يتم احتساب التكلفة عليك بناءً على إجمالي حجم المستندات التي تتم معالجتها لبناء نماذج للموضوعات في كل مهمة. ويتم احتساب تكلفة ثابتة على أول 100 ميجابايت. بعد تخطي 100 ميجابايت، يتم احتساب التكلفة نظير كل ميجابايت.
تقدم Amazon Comprehend طبقة مجانية تتضمن 50 ألف وحدة نص (5 ملايين حرف) لكل واجهة برمجة تطبيقات في الشهر.
تتضمن واجهات برمجة التطبيقات (API) المؤهلة استخراج العبارات الأساسية، وتحليل المشاعر، والمشاعر الموجّهة، والتعرُّف على الكيانات، واكتشاف اللغة، واكتشاف الأحداث، وتحليل بناء الجملة، وواجهة برمجة التطبيقات الخاصة باكتشاف معلومات تعريف الشخصية (Detect PII)، وواجهة برمجة التطبيقات الخاصة باكتشاف احتواء المستندات على معلومات تعريف الشخصية (Contains PII) وتصنيف سلامة المطالبات.
ملاحظة: لا تقدم Custom Comprehend (الكيانات المخصصة والتصنيف المخصص) طبقةً مجانيةً. وهذا يشمل تدريب النماذج، والاستدلال، وإدارة النماذج.
تتوفر الطبقة المجانية من خدمة Amazon Comprehend لكلٍّ من عملاء AWS الجدد والحاليين لمدة 12 شهرًا، بدءًا من تاريخ أول طلب لخدمة Amazon Comprehend.
أمثلة على تسعير Amazon Comprehend
مثال 1 - تحليل تعليقات العملاء
لنفترض أنك قمت بتطوير أحد التطبيقات باستخدام Amazon Comprehend لتحليل تعليقات العملاء على متجرك المتاح عبر الإنترنت. وقد تلقيت 10,000 تعليق من العملاء يصل طول كل منها إلى 550 حرفًا، كما أنك تستخدم الخدمة للعام الثاني.
حساب التكلفة الإجمالية:
حجم كل طلب = 550 حرفًا
عدد الوحدات للطلب = 6
إجمالي الوحدات: 10,000 (طلب) × 6 (وحدات لكل طلب) = 60,000
السعر لكل وحدة = 0.0001 USD
إجمالي التكلفة = [عدد الوحدات] × [تكلفة الوحدة] = 60,000 × 0.0001 USD = 6.00 USD
مثال 2 - تصنيف المستندات حسب الموضوعات
لنقل إن لديك مجموعة من المستندات البحثية يبلغ إجمالي حجمها 240 ميجابايت والتي ترغب في تصنيفها حسب الموضوع والتوصية بالمستندات لعملائك بناءً على مجال اهتمامهم. ودعنا نفترض أيضًا أنك في العام الثاني لاستخدام الخدمة وأنك لست مؤهلاً للحصول على عرض الطبقة المجانية.
حساب التكلفة الإجمالية:
إجمالي وحدات الميجابايت المُعالَجة = 240
وحدات الميجابايت التي تمت المحاسبة عليها بسعر ثابت يبلغ 1 USD = 100
وحدات الميجابايت التي تمت المحاسبة عليها بسعر 0.004 USD/ميجابايت = 140 [240-100]
إجمالي تكلفة المهمة = 1.00 USD + [140 × 0.004 USD] = 1.00 USD + 0.56 USD = 1.56 USD
مثال 3 - تصنيف تعليقات العملاء باستخدام API للتصنيف المخصص
دعنا نقل إنك ترغب في تدريب أحد المُصنِّفين من أجل تنظيم ملاحظات العملاء الجدد تلقائيًا والتي تَرِد من موقعك الإلكتروني. يُدخِل 10 عملاء الملاحظات كل دقيقة، ويبلغ كل جزء من الملاحظات 300 حرف. ويستغرق الأمر ساعةً واحدةً لتدريب النموذج المخصص، كما أنك تخطط للاحتفاظ بهذا النموذج لمدة شهر. ولذلك، ستبلغ تكاليف التدريب الخاص بالنموذج 3 USD وستكون تكاليف تخزين النموذج 0.5 USD في الشهر. ودعنا نفترض أيضًا أنك في العام الثاني لاستخدام الخدمة وأنك لست مؤهلاً للحصول على عرض الطبقة المجانية.
لتصنيف الملاحظات بشكل غير متزامن، تقوم بالدفع حسب عدد الأحرف الوارد في مستنداتك. وللتصنيف في الوقت الفعلي، يمكنك توفير نقطة نهاية ذات معدل نقل كافٍ للتعامل مع حالة الاستخدام الخاصة بك والدفع مقابل وقت انتهاء نقطة النهاية.
حساب تكلفة الاستدلال للتصنيف غير المتزامن:
حجم كل طلب في اليوم = 4,320,000 حرف [300 حرف × 10 مستندات × 1,440 دقيقة]
عدد الوحدات لكل الطلب = 43,200 وحدة [432,000 حرف ÷ 100 حرف لكل وحدة]
السعر لكل وحدة = 0.0005 USD
إجمالي تكلفة الاستدلال للوحدات = 21.60 USD [43,200 وحدة × 0.0005 USD]
التكلفة الإجمالية = 25.10 USD [21.60 USD للاستدلال + 3 USD للتدريب الخاص بالنموذج + 0.50 USD لتخزين النموذج]
حساب التكلفة الإجمالية للتصنيف المتزامن:
أولاً، لنحسب معدل النقل المطلوب. نحن نصنِّف 10 مستندات يحتوي كل منها على 300 حرف كل دقيقة. ومن ثمَّ، يرِد الحساب كما يلي:
50 حرفًا في الثانية [300 حرف × 10 مستندات ÷ 60 ثانية]
لذلك، سيتعيَّن عليك توفير نقطة نهاية ذات وحدة استدلال (IU) واحدة، والتي تقدّم معدل نقل يبلغ 100 حرف في الثانية.
السعر لوحدة استدلال واحدة = 0.0005 USD في الثانية
ستتحمل التكاليف اعتمادًا على المدة التي استخدمت فيها نقطة نهاية التصنيف في الوقت الفعلي، بغض النظر عن عدد طلبات استدعاء الاستدلال التي تم إجراؤها.
إذا كنت تُشغِّل نقطة نهاية التصنيف في الوقت الفعلي لمدة 12 ساعة في اليوم:
إجمالي تكلفة الاستدلال = 21.60 USD [USD 0.0005 × 3600 ثانية × 12 ساعة]
التكلفة الإجمالية = 25.10 USD [21.60 USD للاستدلال + 3 USD للتدريب الخاص بالنموذج + 0.50 USD لتخزين النموذج]
لاحظ أنك تتحمل تكاليف معدل النقل المتوفِّر ومقدار الوقت الذي تستخدم فيه نقطة النهاية. إذا كنت بحاجة إلى توفير المزيد من معدل النقل، فسيكون السعر كما يلي:
السعر لوحدتَي استدلال = 0.001 USD في الثانية [0.0005 USD × 2]
السعر لعدد 3 وحدات استدلال = 0.0015 USD في الثانية [0.0005 USD × 3]
مثال 4 - تحليل تعليقات العملاء باستخدام واجهة برمجة التطبيقات الخاصة بالكيانات المخصصة
حساب التكلفة الإجمالية:
حجم كل طلب = 5,500,000 حرف
عدد الوحدات للطلب = 55,000 وحدة [5,500,000 حرف ÷ 100 حرف للوحدة]
السعر لكل وحدة = 0.0005 USD
إجمالي تكلفة الوحدات = 27.5 USD [55000 وحدة × 0.0005 USD]
إجمالي عدد الساعات لتدريب النموذج = 1.5 ساعة
السعر لكل ساعة = 3 USD
إجمالي التكلفة لتدريب النموذج = 4.5 USD [1.5 ساعة × 3 USD]
عدد الشهور لإدارة النموذج = شهر واحد
السعر في الشهر = 0.50 USD
إجمالي التكلفة لإدارة النموذج = 0.50 USD [شهر واحد × 0.50 USD]
إجمالي التكلفة = 37 USD [27.5 USD + 4.5 USD + 0.50 USD]
مثال 5 – استخراج الأحداث والمعلومات المرتبطة بها باستخدام ميزة اكتشاف الأحداث
حساب التكلفة الإجمالية:
عدد الأحرف المعالجَة = 1500000 حرف [3000 مقالة × 500 حرف]
عدد الوحدات المعالجَة = 45000 وحدة [1500000 × 3 أنواع أحداث ÷ 100 حرف لكل وحدة]
السعر لكل وحدة = 0.003 USD
إجمالي تكلفة الوحدات = 135 USD [45000 وحدة x 0.003 USD]
مثال 6 – تحديد المستندات المشتملة على معلومات تعريف الشخصية (PII) باستخدام الواجهة Contains PII API (واجهة برمجة التطبيقات الخاصة باحتواء معلومات تعريف الشخصية)
حساب التكلفة الإجمالية:
حجم كل طلب = 550 حرفًا
عدد الوحدات للطلب = 6
إجمالي الوحدات = 60000 [10000 طلب x 6 وحدات وحدة لكل طلب]
السعر لكل وحدة = 0.000002 USD
التكلفة الإجمالية = 0.12 USD [60000 وحدة x 0.000002 USD]
مثال 7 – تنقيح معلومات تعريف الشخصية (PII) من المستندات باستخدام الواجهة Detect PII API (واجهة برمجة التطبيقات الخاصة باكتشاف معلومات تعريف الشخصية)
حساب التكلفة الإجمالية:
حجم كل طلب = 550 حرفًا
عدد الوحدات للطلب = 6
إجمالي الوحدات = 60000 [10000 طلب x 6 وحدات وحدة لكل طلب]
السعر لكل وحدة = 0.0001 USD
التكلفة الإجمالية = 6 USD [60000 وحدة x 0.0001 USD]
مثال 8 - استخراج كيانات طلبات الرهن العقاري باستخدام واجهة برمجة التطبيقات الخاصة بالكيانات المخصصة
حساب تكلفة الاستدلال للتصنيف غير المتزامن:
حجم كل طلب في اليوم = 2500000 حرف [100 تطبيق/يوم * 10 مستندات * 2500 حرف]
عدد الوحدات لكل الطلب = 25000 وحدة [2500000 حرف ÷ 100 حرف لكل وحدة]
السعر لكل وحدة = 0.0005 USD
إجمالي تكلفة الاستدلال للوحدات = 12.50 USD [25000 وحدة × 0.0005 USD]
تكلفة Amazon Textract لواجهة برمجة التطبيقات الخاصة باكتشاف نصوص المستندات = 1.50 USD [100 طلب/يوم * 10 مستندات * 0.0015 السعر لكل صفحة، حتى مليون صفحة]
التكلفة الإجمالية = 17.50 USD [12.50 USD للاستدلال + 1.50 USD لـ Textract + 3 USD لتدريب النموذج + 0.50 USD لتخزين النموذج]
مثال 9 – تحليل الإجابات على استبيانات الموظفين
حساب التكلفة الإجمالية:
حجم كل طلب = 350 حرفًا
عدد الوحدات للطلب = 4
إجمالي الوحدات: 100000 (طلب) × 4 (وحدات وحدة لكل طلب) = 400000
السعر لكل وحدة = 0.0001 USD (من 0 إلى 10 مليون وحدة)
إجمالي التكلفة = [عدد الوحدات] × [تكلفة الوحدة] = 400000 × 0.0001 USD = 40.00 USD
مثال 10 - اكتشاف المحتوى السيئ في التعليقات عبر الإنترنت على الموقع الإلكتروني
حساب التكلفة الإجمالية:
حجم كل طلب = 100 حرف
عدد الوحدات لكل طلب = 1 إجمالاً
الوحدات = 100 وحدة استدلال [100 مليون تعليق × وحدة واحدة لكل طلب]
سعر الوحدة = 0.0001 USD [من 0 - 10 ملايين وحدة استدلال] + 0.00005 USD [من 10 ملايين - 50 مليونًا وحدة استدلال] + 0.000025 USD [من 50 مليونًا - 100 مليون وحدة استدلال]
إجمالي التكلفة = [عدد الوحدات] × [تكلفة الوحدة]
[10 ملايين X USD 0.001] + [40 مليونًا X USD 0.00005] + [50 مليونًا X USD 0.000025]
= USD 1,000 + USD 2,000 + USD 1,250
= USD 4,250
مثال 11 - اكتشاف المطالبات غير الآمنة في تطبيق الذكاء الاصطناعي المولّد
حساب التكلفة الإجمالية:
حجم كل طلب = 500 حرف
عدد الوحدات للطلب = 5
إجمالي الوحدات = 50 مليون وحدة استدلال [10 ملايين تعليق × 5 وحدات لكل طلب]
سعر الوحدة = 0.0001 USD [من 0 - 10 ملايين وحدة استدلال] + 0.00005 USD [من 10 ملايين - 50 مليونًا وحدة استدلال] + 0.000025 USD [من 50 مليونًا - 100 مليون وحدة استدلال]
إجمالي التكلفة = [عدد الوحدات] × [تكلفة الوحدة]
= [10 ملايين × USD 0.001] + [40 مليونًا × USD 0.00005]
= USD 1,000 + USD 2,000
= USD 3,000
التعرُّف على المزيد حول ميزات Amazon Comprehend