Amazon Comprehend ให้บริการประมวลผลภาษาธรรมชาติ ตรวจหาและปกปิดข้อมูลที่สามารถระบุตัวบุคคลได้ (PII) ตรวจหาเอนทิตีและการจัดหมวดหมู่แบบกำหนดเอง และสร้างรูปแบบหัวข้อ ซึ่งช่วยให้สามารถใช้งานหลายๆ แอปพลิเคชันที่สามารถวิเคราะห์รูปแบบเอกสารข้อความดิบที่มี API บางรายการ เช่น PDF และ Word
- การประมวลผลภาษาธรรมชาติ: สามารถใช้ Amazon Comprehend API สำหรับการจดจำเอนทิตี การวิเคราะห์ความรู้สึก การวิเคราะห์ไวยากรณ์ การแยกวลีที่สำคัญ และการตรวจจับภาษาเพื่อแยกข้อมูลเชิงลึกจากข้อความในภาษาธรรมชาติ คำขอเหล่านี้จะได้รับการวัดเป็นหน่วยละ 100 อักขระ (1 หน่วย = 100 อักขระ) โดยมีค่าบริการขั้นต่ำ 3 หน่วย (300 อักขระ) ต่อคำขอ
- ข้อมูลที่สามารถระบุตัวบุคคลได้ (PII): API ตรวจจับ PII จะค้นหาตำแหน่งของเอนทิตีข้อมูลที่ใช้ระบุตัวตนได้ (PII) ที่เลือกไว้ภายในเอกสารและสามารถใช้เพื่อสร้างเอกสารในเวอร์ชันที่ถูกปกปิดได้ API PII ที่เป็นส่วนประกอบจะบอกให้คุณทราบว่าเอกสารประกอบด้วย PII ที่เลือกไว้หรือไม่ คำขอเหล่านี้ยังจะได้รับการวัดเป็นหน่วยละ 100 อักขระ (1 หน่วย = 100 อักขระ) โดยมีค่าบริการขั้นต่ำ 3 หน่วย (300 อักขระ) ต่อคำขอ
- Comprehend แบบกำหนดเอง: การจัดหมวดหมู่แบบกำหนดเองและ API เอนทิตีสามารถฝึกฝนให้โมเดล NLP แบบกำหนดเองจัดหมวดหมู่ข้อความและแยกเอนทิตีแบบกำหนดเองได้ คำขอการอนุมานแบบอะซิงโครนัสจะได้รับการวัดเป็นหน่วย หน่วยละ 100 อักขระ โดยมีค่าบริการขั้นต่ำ 3 หน่วย (300 อักขระ) ต่อคำขอ คุณจะต้องเสียค่าบริการ 3 USD ต่อชั่วโมงสำหรับการฝึกอบรมโมเดล (คิดค่าบริการเป็นวินาที) และ 0.50 USD ต่อเดือนสำหรับการจัดการโมเดลแบบกำหนดเอง สำหรับคำขอการจัดหมวดหมู่แบบกำหนดเองและการอนุมานเอนทิตีแบบซิงโครนัสนั้น คุณจะต้องจัดเตรียมตำแหน่งข้อมูลให้มีปริมาณการประมวลผลที่เหมาะสม ระบบจะเริ่มเก็บค่าบริการนับตั้งแต่ช่วงเวลาที่เริ่มใช้ตำแหน่งข้อมูลไปจนกระทั่งคุณลบตำแหน่งข้อมูล
- การสร้างรูปแบบหัวข้อ: การสร้างรูปแบบหัวข้อระบุคำศัพท์หรือหัวข้อที่เกี่ยวข้องจากชุดเอกสารที่จัดเก็บใน Amazon S3 ซึ่งจะระบุหัวข้อที่พบบ่อยที่สุดในชุดเอกสารและจัดหัวข้อให้เป็นกลุ่ม จากนั้นระบุว่าเอกสารใดมีหัวข้ออะไร คุณจะเสียค่าบริการตามขนาดเอกสารทั้งหมดที่ประมวลผลต่องาน โดยจะคิดค่าบริการในอัตราคงที่สำหรับ 100 MB แรก ระบบจะเรียกเก็บค่าบริการต่อ MB เมื่อใช้เกิน 100 MB
- ความน่าเชื่อถือและความปลอดภัย (ใหม่): API ตรวจจับความไม่เหมาะสม Comprehend สามารถใช้เพื่อตรวจจับเนื้อหาที่ไม่เหมาะสมจากข้อความได้ ในทำนองเดียวกัน คุณสมบัติการจัดหมวดหมู่ความปลอดภัยพร้อมท์ของ Comprehend สามารถใช้ตรวจจับพร้อมท์การป้อนข้อมูลที่ไม่ปลอดภัยสำหรับโมเดลและแอปพลิเคชันภาษาขนาดใหญ่ได้ คำขอเหล่านี้จะได้รับการวัดเป็นหน่วยละ 100 อักขระ (1 หน่วย = 100 อักขระ) โดยมีค่าบริการขั้นต่ำ 3 หน่วย (300 อักขระ) ต่อคำขอ
- ดูเพิ่มเติมเกี่ยวกับราคา Amazon Comprehend Medical ได้ที่นี่
- คุณสามารถประเมินค่าใช้จ่ายของคุณโดยใช้เครื่องมือคำนวณค่าบริการของ AWS
- เลือกรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันออก (นอร์ธเวอร์จิเนีย) ในตัวเลือกรีเจี้ยนด้านล่างเพื่อดูราคาสำหรับ API ทั้งหมด
ด้วย Amazon Comprehend API คุณสามารถประมวลผลทั้งข้อมูลข้อความดิบที่มี API บางรายการและไม่มีโครงสร้างได้นอกเหนือจากไฟล์ข้อความ เช่น เอกสาร PDF และ Word
คำขอการอนุมานจะได้รับการวัดเป็นหน่วย หน่วยละ 100 อักขระโดยมีค่าบริการขั้นต่ำ 3 หน่วย (300 อักขระ) ต่อคำขอ
คำขอการอนุมานจะได้รับการวัดเป็นหน่วย หน่วยละ 100 อักขระโดยมีค่าบริการขั้นต่ำ 3 หน่วย (300 อักขระ) ต่อคำขอ
ตำแหน่งข้อมูลจะมีการคิดค่าบริการเป็นส่วนเพิ่มครั้งละหนึ่งวินาที โดยมีระยะเวลาอย่างน้อย 60 วินาที ระบบจะคิดค่าบริการนับตั้งแต่ช่วงเวลาที่คุณเริ่มใช้ตำแหน่งข้อมูลไปจนกระทั่งคุณลบตำแหน่งข้อมูล ถึงแม้ว่าจะไม่มีการวิเคราะห์เอกสารใดๆ ก็ตาม
หนึ่งหน่วยการอนุมาน (IU) จะมีปริมาณการประมวลผล 100 อักขระ/วินาที บนตำแหน่งข้อมูลที่มีการจัดการของคุณ คุณสามารถจัดเตรียม IU เพิ่มเติมสำหรับปริมาณการประมวลผลที่เพิ่มขึ้น IU แต่ละหน่วยจะมีค่าใช้จ่าย 0.0005 USD ต่อวินาที
*เพื่อแยกข้อความออกจากเอกสาร PDFที่สแกนออกมา จะมีการเรียกใช้API ตรวจจับข้อความในเอกสาร Amazon Textract
สำหรับ 100MB แรก
สำหรับทุก MB ที่เกินจาก 100 MB
คุณจะเสียค่าบริการตามขนาดเอกสารทั้งหมดที่ประมวลผลต่องานการสร้างรูปแบบหัวข้อ โดยจะคิดค่าบริการในอัตราคงที่สำหรับ 100 MB แรก ระบบจะเรียกเก็บค่าบริการต่อ MB เมื่อใช้เกิน 100 MB
Amazon Comprehend นำเสนอบริการระดับ Free Tier ที่ครอบคลุมหน่วยข้อความ 50,000 หน่วย (5 ล้านอักขระ) ต่อ API ต่อเดือน
API ที่มีสิทธิ์ ได้แก่ Key Phrase Extraction, Sentiment, Targeted Sentiment, Entity Recognition, Language Detection, Event Detection, Syntax Analysis, Detect PII, Contains PII แลพ Prompt Safety Classification
หมายเหตุ: Custom Comprehend (เอนทิตีแบบกำหนดเองและการจัดประเภทแบบกำหนดเอง) ไม่มีบริการระดับ Free Tier ซึ่งรวมถึงการฝึกฝนโมเดล การอนุมาน และการจัดการโมเดล
Free Tier ของ Amazon Comprehend มีให้บริการสำหรับทั้งลูกค้าใหม่และลูกค้าเดิมของ AWS เป็นเวลา 12 เดือน โดยเริ่มจากวันที่ลูกค้าส่งคำขอ Amazon Comprehend คำขอแรก
ตัวอย่างราคา Amazon Comprehend
ตัวอย่างที่ 1 - การวิเคราะห์ความคิดเห็นของลูกค้า
สมมติว่าคุณได้สร้างแอปพลิเคชันโดยใช้ Amazon Comprehend เพื่อวิเคราะห์ความคิดเห็นของลูกค้าบนร้านค้าออนไลน์ของคุณ คุณได้รับความคิดเห็นจากลูกค้า 10,000 รายการซึ่งแต่ละรายการมี 550 อักขระ และคุณใช้บริการนี้เป็นปีที่สอง
การคำนวณค่าบริการทั้งหมด:
ขนาดของแต่ละคำขอ = 550 อักขระ
จำนวนหน่วยต่อคำขอ = 6
หน่วยทั้งหมด: 10,000 (คำขอ) x 6 (หน่วยต่อคำขอ) = 60,000
ราคาต่อหน่วย = 0.0001 USD
ค่าใช้จ่ายทั้งหมด = [จำนวนหน่วย] x [ค่าใช้จ่ายต่อหน่วย] = 60,000 x 0.0001 USD = 6.00 USD
ตัวอย่างที่ 2 - การจัดหมวดหมู่เอกสารตามหัวข้อ
สมมติว่าคุณมีชุดเอกสารการวิจัยที่มีขนาดทั้งหมด 240 MB และคุณต้องการจัดหมวดหมู่ตามหัวข้อและแนะนำเอกสารให้กับลูกค้าของคุณตามขอบเขตความสนใจของลูกค้า และสมมติว่าคุณใช้บริการนี้เป็นปีที่สองจึงไม่มีสิทธิ์ใช้ข้อเสนอ Free Tier ได้อีกต่อไป
การคำนวณค่าบริการทั้งหมด:
เมกะไบต์ทั้งหมดที่ประมวลผล = 240
เมกะไบต์ที่คิดค่าบริการในอัตราคงที่ในราคา 1 USD = 100
เมกะไบต์ที่คิดค่าบริการที่ 0.004 USD/MB = 140 [240-100]
ค่าใช้จ่ายทั้งหมดสำหรับงานนี้ = 1.00 USD + [140 x 0.004 USD] = 1.00 USD+ 0.56 USD = 1.56 USD
ตัวอย่างที่ 3 - การจัดหมวดหมู่คำติชมของลูกค้าโดยใช้ API การจัดหมวดหมู่แบบกำหนดเอง
สมมติว่าคุณต้องการฝึกตัวจำแนกหมวดหมู่ให้จัดระเบียบคำติชมของลูกค้าใหม่ที่มาจากเว็บไซต์ของคุณโดยอัตโนมัติ ลูกค้า 10 รายจะป้อนคำติชมทุกๆ นาที และคำติชมแต่ละรายการจะมี 300 อักขระ ซึ่งการฝึกอบรมโมเดลแบบกำหนดเองจะใช้เวลาหนึ่งชั่วโมง และคุณวางแผนที่จะใช้โมเดลนี้เป็นเวลาหนึ่งเดือน ดังนั้น การฝึกอบรมโมเดลจะมีค่าใช้จ่าย 3 USD และค่าที่จัดเก็บโมเดลจะอยู่ที่ 0.5 USD ต่อเดือน และสมมติว่าคุณใช้บริการนี้เป็นปีที่สองจึงไม่มีสิทธิ์ใช้ข้อเสนอ Free Tier ได้อีกต่อไป
หากต้องการจัดหมวดหมู่คำติชมแบบอะซิงโครนัส คุณต้องจ่ายค่าบริการตามจำนวนอักขระในเอกสาร หากต้องการจัดหมวดหมู่ในแบบเรียลไทม์ คุณจะต้องจัดเตรียมตำแหน่งข้อมูลที่มีปริมาณการประมวลผลที่เพียงพอสำหรับจัดการกรณีการใช้งานของคุณ และจ่ายค่าบริการตามระยะเวลาที่คุณใช้งานตำแหน่งข้อมูลจนกระทั่งลบตำแหน่งข้อมูล
การคำนวณค่าใช้จ่ายในการอนุมานสำหรับการจัดหมวดหมู่แบบอะซิงโครนัส:
ขนาดของแต่ละคำขอต่อวัน = 4,320,000 อักขระ [300 อักขระ * เอกสาร 10 รายการ * 1,440 นาที]
จำนวนหน่วยต่อคำขอ = 43,200 หน่วย [432,000 อักขระ ÷ 100 อักขระต่อหน่วย]
ราคาต่อหน่วย = 0.0005 USD
ค่าใช้จ่ายในการอนุมานทั้งหมดสำหรับหน่วย = 21.60 USD [43,200 หน่วย x 0.0005 USD]
ค่าใช้จ่ายทั้งหมด = 25.10 USD [ค่าอนุมาน 21.60 USD + ค่าฝึกอบรมโมเดล 3 USD + ค่าที่จัดเก็บโมเดล 0.50 USD]
การคำนวณค่าบริการทั้งหมดสำหรับการจัดหมวดหมู่แบบซิงโครนัส:
อันดับแรก เริ่มจากการคำนวณปริมาณการประมวลผลที่ต้องใช้ ทุกๆ นาที เราจะจัดหมวดหมู่เอกสาร 10 รายการ รายการละ 300 อักขระ ซึ่งจะเท่ากับ:
50 อักขระต่อวินาที [300 อักขระ x เอกสาร 10 รายการ ÷ 60 วินาที]
ดังนั้น คุณจะต้องจัดเตรียมตำแหน่งข้อมูลที่มีหน่วยการอนุมาน 1 หน่วย (IU) ซึ่งมีปริมาณการประมวลผล 100 อักขระ/วินาที
ราคาสำหรับ 1 IU = 0.0005 USD ต่อวินาที
คุณจะเสียค่าบริการตามระยะเวลาที่คุณใช้งานตำแหน่งข้อมูลการจัดหมวดหมู่แบบเรียลไทม์ ไม่ว่าจะมีการเรียกใช้การอนุมานจำนวนเท่าใดก็ตาม
หากคุณใช้ตำแหน่งข้อมูลการจัดหมวดหมู่แบบเรียลไทม์ 12 ชั่วโมงต่อวัน:
ค่าใช้จ่ายในการอนุมานทั้งหมด = 21.60 USD [0.0005 USD x 3,600 วินาที x 12 ชั่วโมง]
ค่าใช้จ่ายทั้งหมด = 25.10 USD [ค่าอนุมาน 21.60 USD + ค่าฝึกอบรมโมเดล 3 USD + ค่าที่จัดเก็บโมเดล 0.50 USD]
โปรดทราบไว้ว่า ระบบจะคิดค่าใช้จ่ายสำหรับปริมาณการประมวลผลที่จัดเตรียมไว้ และจำนวนระยะเวลาที่ใช้งานตำแหน่งข้อมูล หากคุณจำเป็นต้องจัดเตรียมปริมาณการประมวลผลเพิ่มขึ้น ราคาจะเท่ากับ:
ราคาสำหรับ 2 IU = 0.001 USD ต่อวินาที [0.0005 USD x 2]
ราคาสำหรับ 3 IU = 0.0015 USD ต่อวินาที [0.0005 USD x 3]
ตัวอย่างที่ 4 - การวิเคราะห์ความคิดเห็นของลูกค้าโดยใช้ API เอนทิตีแบบกำหนดเอง
การคำนวณค่าบริการทั้งหมด:
ขนาดของแต่ละคำขอ = 5,500,000 อักขระ
จำนวนหน่วยต่อคำขอ = 55,000 หน่วย [5,500,000 อักขระ ÷ 100 อักขระต่อหน่วย]
ราคาต่อหน่วย = 0.0005 USD
ค่าใช้จ่ายต่อหน่วยทั้งหมด = 27.5 USD [55,000 หน่วย x 0.0005 USD]
ชั่วโมงสำหรับการฝึกโมเดลทั้งหมด = 1.5 ชั่วโมง
ราคาต่อชั่วโมง = 3 USD
ค่าใช้จ่ายสำหรับการฝึกโมเดลทั้งหมด = 4.5 USD [1.5 ชั่วโมง x 3 USD]
จำนวนเดือนสำหรับการจัดการโมเดล = 1 เดือน
ราคาต่อเดือน = 0.50 USD
ค่าใช้จ่ายทั้งหมดสำหรับการจัดการโมเดล = 0.50 USD [1 เดือน x 0.50 USD]
ค่าใช้จ่ายทั้งหมด = 37 USD [27.5 USD + 4.5 USD + 0.50 USD]
ตัวอย่างที่ 5 – การดึงเหตุการณ์และข้อมูลที่เกี่ยวข้องโดยใช้การตรวจจับเหตุการณ์
การคำนวณค่าบริการทั้งหมด:
จำนวนอักขระที่ประมวลผล = 1,500,000 อักขระ [3,000 บทความ x 500 อักขระ]
จำนวนหน่วยที่ประมวลผล = 45,000 หน่วย [1,500,000 x 3 ประเภทเหตุการณ์ ÷ 100 อักขระต่อหน่วย]
ราคาต่อหน่วย = 0.003 USD
ค่าใช้จ่ายต่อหน่วยทั้งหมด = 135 USD [45,000 หน่วย x 0.003 USD]
ตัวอย่างที่ 6 – การระบุเอกสารที่มี PII โดยใช้ API PII ที่เป็นส่วนประกอบ
การคำนวณค่าบริการทั้งหมด:
ขนาดของแต่ละคำขอ = 550 อักขระ
จำนวนหน่วยต่อคำขอ = 6
หน่วยทั้งหมด = 60,000 [10,000 คำขอ x 6 หน่วยต่อคำขอ]
ราคาต่อหน่วย = 0.000002 USD
ค่าใช้จ่ายทั้งหมด = 0.12 USD [60,000 หน่วย x 0.000002 USD]
ตัวอย่างที่ 7 – การปกปิด PII จาก API การตรวจจับ PII
การคำนวณค่าบริการทั้งหมด:
ขนาดของแต่ละคำขอ = 550 อักขระ
จำนวนหน่วยต่อคำขอ = 6
หน่วยทั้งหมด = 60,000 [10,000 คำขอ x 6 หน่วยต่อคำขอ]
ราคาต่อหน่วย = 0.0001 USD
ค่าบริการทั้งหมด = 6 USD [60,000 หน่วย x 0.0001 USD]
ตัวอย่างที่ 8 – การแยกเอนทิตีแอปพลิเคชันการจำนองโดยใช้ API เอนทิตีแบบกำหนดเอง
การคำนวณค่าใช้จ่ายในการอนุมานสำหรับการจัดหมวดหมู่แบบอะซิงโครนัส:
ขนาดของแต่ละคำขอต่อวัน= 2,500,000 อักขระ [ใบสมัคร 100 ใบ/วัน * เอกสาร 10 ฉบับ * 2,500 อักขระ]
จำนวนหน่วยต่อคำขอ = 25,000 หน่วย [2,500,000 อักขระ ÷ 100 อักขระต่อหน่วย]
ราคาต่อหน่วย = 0.0005 USD
ค่าใช้จ่ายในการอนุมานทั้งหมดสำหรับหน่วย = 12.50 USD [25,000 หน่วย x 0.0005 USD]
ค่าบริการ Amazon Textract สำหรับ API ตรวจจับข้อความในเอกสาร = 1.50 USD [ใบสมัคร 100 ใบ/วัน * เอกสาร 10 ฉบับ * ราคา 0.0015 USD ต่อหน้า สูงสุด 1 ล้านหน้า]
ค่าใช้จ่ายทั้งหมด = 17.50 USD [ค่าอนุมาน 12.50 USD + Textract 1.50 USD + ค่าการฝึกโมเดล 3 USD + ค่าที่จัดเก็บโมเดล 0.50 USD]
ตัวอย่างที่ 9 – การวิเคราะห์การตอบแบบสำรวจของพนักงาน
การคำนวณค่าบริการทั้งหมด:
ขนาดของแต่ละคำขอ = 350 อักขระ
จำนวนหน่วยต่อคำขอ = 4
หน่วยทั้งหมด: 100,000 (คำขอ) x 4 (หน่วยต่อคำขอ) = 400,000
ราคาต่อหน่วย = 0.0001 USD (ตั้งแต่ 0-10 ล้านหน่วย)
ค่าใช้จ่ายทั้งหมด = [จำนวนหน่วย] x [ค่าใช้จ่ายต่อหน่วย] = 400,000 x 0.0001 USD = 40.00 USD
ตัวอย่างที่ 10 - การตรวจจับความไม่เหมาะสมในความคิดเห็นออนไลน์บนเว็บไซต์
การคำนวณค่าบริการทั้งหมด:
ขนาดของแต่ละคำขอ = 100 อักขระ
จำนวนหน่วยต่อคำขอ = 1 ทั้งหมด
หน่วย= 100 ล้าน IU [100 ล้านความคิดเห็น x 1 หน่วยต่อคำขอ]
ราคาต่อหน่วย = 0.0001 USD [จาก 0 - 10 ล้าน IU] + 0.00005 USD [จาก 10 ล้าน - 50 ล้าน IU] + 0.000025 USD [จาก 50 ล้าน – 100 ล้าน IU]
ค่าใช้จ่ายทั้งหมด = [หมายเลข จำนวนหน่วย] x [ต้นทุนต่อหน่วย]
= [10 ล้าน X 0.001 USD]+[40 ล้าน X 0.00005 USD]+[50 ล้าน X 0.000025 USD]
= 1,000 USD + 2,000 USD + 1,250 USD
= 4,250 USD
ตัวอย่างที่ 11 - การตรวจจับข้อความแจ้งที่ไม่ปลอดภัยในแอปพลิเคชัน AI ช่วยสร้าง
การคำนวณค่าบริการทั้งหมด:
ขนาดของแต่ละคำขอ = 500 อักขระ
จำนวนหน่วยต่อคำขอ = 5
หน่วยทั้งหมด = 50 ล้าน IUs [10 ล้านความคิดเห็น x 5 หน่วยต่อคําขอ]
ราคาต่อหน่วย = 0.0001 USD [จาก 0 - 10 ล้าน IU] + 0.00005 USD [จาก 10 ล้าน - 50 ล้าน IU] + 0.000025 USD [จาก 50 ล้าน – 100 ล้าน IU]
ค่าใช้จ่ายทั้งหมด = [หมายเลข จำนวนหน่วย] x [ต้นทุนต่อหน่วย]
= [10 ล้าน X 0.001 USD]+[40 ล้าน X 0.00005 USD]
= 1,000 USD + 2,000 USD
= 3,000 USD
เรียนรู้เพิ่มเติมเกี่ยวกับคุณสมบัติของ Amazon Comprehend