Amazon Comprehend cung cấp khả năng xử lý ngôn ngữ tự nhiên, phát hiện và biên tập lại Thông tin nhận dạng cá nhân (PII), phát hiện Phân loại và Thực thể tùy chỉnh cũng như tạo mô hình chủ đề, tạo điều kiện cho một loạt các ứng dụng đa dạng có thể phân tích văn bản thô, đồng thời một số API được sử dụng để phân tích các định dạng văn bản như PDF và Word.

  • Xử lý ngôn ngữ tự nhiên: Các API của Amazon Comprehend để nhận dạng thực thể, phân tích cảm xúc, phân tích cú pháp, trích xuất cụm từ khóa và phát hiện ngôn ngữ có thể được dùng để trích xuất thông tin chuyên sâu từ văn bản ngôn ngữ tự nhiên. Những yêu cầu này được đo bằng đơn vị 100 ký tự (1 đơn vị = 100 ký tự), với mức tính phí tối thiểu là 3 đơn vị (300 ký tự) cho mỗi yêu cầu.
  • Thông tin nhận dạng cá nhân (PII): API detect PII sẽ tìm các vị trí mà các thực thể Thông tin nhận dạng cá nhân (“PII”) đã chọn xuất hiện bên trong văn bản. API này cũng có thể được dùng để tạo các phiên bản tài liệu được biên tập lại. API contains PII cho bạn biết tài liệu có chứa PII đã chọn hay không. Những yêu cầu này cũng được đo bằng đơn vị 100 ký tự (1 đơn vị = 100 ký tự), với mức tính phí tối thiểu là 3 đơn vị (300 ký tự) cho mỗi yêu cầu.
  • Custom Comprehend: Các API về Phân loại và Thực thể tùy chỉnh có thể đào tạo một mô hình NLP tùy chỉnh để phân loại văn bản và trích xuất thực thể tùy chỉnh. Các yêu cầu suy diễn không đồng bộ được đo bằng đơn vị 100 ký tự, với mức phí tối thiểu là 3 đơn vị (300 ký tự) cho mỗi yêu cầu. Bạn bị tính phí 3 USD/giờ cho việc đào tạo mô hình (tính phí theo giây) và 0,50 USD/tháng cho việc quản lý mô hình tùy chỉnh. Đối với yêu cầu suy diễn đồng bộ cho công cụ Phân loại và thực thể tùy chỉnh, bạn cung cấp một điểm cuối với thông lượng phù hợp. Bạn bị tính phí kể từ khi bạn bắt đầu điểm cuối cho đến khi điểm cuối bị xóa.
  • Tạo mô hình chủ đề: Tính năng Tạo mô hình chủ đề xác định các thuật ngữ hoặc chủ đề liên quan từ tập hợp tài liệu được lưu trữ trong Amazon S3. Tính năng này sẽ xác định các chủ đề phổ biến nhất trong bộ sưu tập, sắp xếp chúng theo nhóm và sau đó ánh xạ tài liệu nào thuộc về chủ đề nào. Bạn sẽ bị tính phí dựa trên tổng kích thước tài liệu được xử lý trên mỗi tác vụ. 100 MB đầu tiên sẽ được tính theo mức phí cố định. Trên 100 MB, bạn sẽ bị tính phí theo MB.
  • Tin cậy và an toàn (mới): API phát hiện nội dung độc hại của Comprehend có thể được sử dụng để phát hiện nội dung độc hại từ văn bản. Tương tự, tính năng phân loại an toàn lời nhắc của Comprehend có thể được sử dụng để phát hiện lời nhắc đầu vào không an toàn cho các mô hình và ứng dụng ngôn ngữ quy mô lớn. Những yêu cầu này được đo bằng đơn vị 100 ký tự (1 đơn vị = 100 ký tự), với mức tính phí tối thiểu là 3 đơn vị (300 ký tự) cho mỗi yêu cầu.
  • Để biết mức giá của Amazon Comprehend Medical, tìm hiểu thêm ở đây.
  • Bạn có thể ước tính chi phí bằng cách sử dụng Công cụ tính giá AWS.
  • Chọn khu vực Miền Đông Hoa Kỳ (Bắc Virginia) trong bộ chọn khu vực bên dưới để xem giá cho tất cả các API

 

Đối với khối lượng lớn hơn 100 triệu đơn vị mỗi tháng, vui lòng liên hệ với chúng tôi để biết giá.
Các yêu cầu NLP được đo bằng đơn vị 100 ký tự, với mức tính phí tối thiểu là 3 đơn vị (300 ký tự) cho mỗi yêu cầu.

Với các API của Amazon Comprehend, bạn có thể xử lý cả văn bản thô, không có cấu trúc và một số API được sử dụng để xử lý các tệp văn bản khác như tài liệu PDF và Word. 

Custom Comprehend

Thực thể và phân loại tùy chỉnh
Để nhận dạng thực thể không đồng bộ trên các tài liệu PDF*, Word và văn bản thuần túy

Các yêu cầu suy diễn được đo bằng đơn vị 100 ký tự, với mức phí tối thiểu là 3 đơn vị (300 ký tự) cho mỗi yêu cầu.

Đối với phân loại không đồng bộ

Các yêu cầu suy diễn được đo bằng đơn vị 100 ký tự, với mức phí tối thiểu là 3 đơn vị (300 ký tự) cho mỗi yêu cầu.

Đối với phân loại đồng bộ và nhận dạng thực thể

Điểm cuối được tính phí theo gia số một giây, tối thiểu là 60 giây. Bạn sẽ tiếp tục bị tính phí kể từ khi bạn bắt đầu điểm cuối cho đến khi điểm cuối bị xóa, ngay cả khi không phân tích tài liệu.

Một đơn vị suy diễn (IU) cung cấp thông lượng 100 ký tự/giây trên điểm cuối được quản lý. Bạn có thể cung cấp thêm IU để có thêm thông lượng. Mức phí cho mỗi IU là 0,0005 USD/giây.

3 USD/giờ cho việc đào tạo mô hình

*để trích xuất văn bản từ các tài liệu PDF được quét, phải gọi API Phát hiện văn bản tài liệu của Amazon Textract.

Tạo mô hình chủ đề

Đối với 100MB đầu tiên

Đối với mỗi MB vượt quá 100MB

Bạn sẽ bị tính phí dựa trên tổng kích thước tài liệu được xử lý trên mỗi tác vụ tạo mô hình chủ đề. 100 MB đầu tiên sẽ được tính theo mức phí cố định. Trên 100 MB, bạn sẽ bị tính phí theo MB.

Bậc miễn phí

50 NGHÌN ĐƠN VỊ VĂN BẢN (5 TRIỆU KÝ TỰ)

Amazon Comprehend cung cấp bậc miễn phí gồm 50 nghìn đơn vị văn bản (5 triệu ký tự) cho mỗi API mỗi tháng.

Các API đủ điều kiện gồm có Trích xuất cụm từ khóa, Cảm xúc, Nhắm cảm xúc, Nhận dạng thực thể, Phát hiện ngôn ngữ, Phát hiện sự kiện, Phân tích cú pháp, Phát hiện PII (Thông tin nhận dạng cá nhân), Chứa PII và Phân loại an toàn lời nhắc.

Lưu ý: Custom Comprehend (các thực thể và phân loại tùy chỉnh) không cung cấp bậc miễn phí. Điều này bao gồm đào tạo mô hình, suy luận và quản lý mô hình.

5 TÁC VỤ VỚI TỐI ĐA 1 MB CHO MỖI TÁC VỤ (Mô hình chủ đề)

Bậc miễn phí Amazon Comprehend được cung cấp cho cả khách hàng AWS hiện tại và khách hàng mới trong 12 tháng, bắt đầu từ ngày khách hàng thực hiện yêu cầu đầu tiên với Amazon Comprehend.

Ví dụ về định giá Amazon Comprehend

Ví dụ 1 – Phân tích bình luận của khách hàng

Giả sử bạn đã sử dụng Amazon Comprehend để xây dựng một ứng dụng để phân tích bình luận của khách hàng về cửa hàng trực tuyến của mình. Bạn đã nhận được 10.000 bình luận của khách hàng, mỗi bình luận có 550 ký tự, và bạn đang sử dụng dịch vụ ở năm thứ hai.

Tính tổng phí:

Kích thước mỗi yêu cầu = 550 ký tự

Số đơn vị trên mỗi yêu cầu = 6

Tổng số đơn vị: 10.000 (yêu cầu) x 6 (đơn vị trên mỗi yêu cầu) = 60.000

Giá trên mỗi đơn vị = 0,0001 USD

Tổng chi phí = [Số đơn vị] x [Chi phí trên mỗi đơn vị] = 60.000 x 0,0001 USD = 6,00 USD


Ví dụ 2 – Phân loại tài liệu theo chủ đề

Giả sử bạn có một bộ tài liệu nghiên cứu có tổng kích thước là 240 MB và bạn muốn phân loại theo chủ đề và giới thiệu tài liệu cho khách hàng của bạn dựa trên lĩnh vực họ quan tâm. Chúng tôi cũng giả sử rằng bạn đang sử dụng dịch vụ ở năm thứ hai và không đủ điều kiện để nhận bậc miễn phí.

Tính tổng phí:

Tổng số megabyte đã xử lý = 240

Số megabyte tính phí ở mức phí cố định 1 USD = 100

Số megabyte tính phí ở mức 0.004 USD/MB = 140 [240-100]

Tổng chi phí của tác vụ = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Ví dụ 3 – Phân loại phản hồi của khách hàng bằng cách sử dụng API phân loại tùy chỉnh

Giả sử bạn muốn đào tạo một công cụ phân loại để tự động sắp xếp ý kiến phản hồi của khách hàng mới từ trang web của mình. Mỗi phút có 10 khách hàng nhập ý kiến phản hồi và mỗi ý kiến phản hồi gồm 300 ký tự. Phải mất một giờ để đào tạo mô hình tùy chỉnh và bạn dự kiến sẽ duy trì mô hình này trong một tháng. Do đó, chi phí đào tạo mô hình sẽ là 3 USD và chi phí lưu trữ mô hình sẽ là 0,5 USD cho tháng đó. Chúng tôi cũng giả sử rằng bạn đang sử dụng dịch vụ ở năm thứ hai và không đủ điều kiện để nhận bậc miễn phí. 

Để phân loại ý kiến phản hồi một cách không đồng bộ, bạn thanh toán theo số lượng ký tự trong tài liệu của mình. Để phân loại theo thời gian thực, bạn cung cấp một điểm cuối với đủ thông lượng để xử lý trường hợp sử dụng của mình và thanh toán cho khoảng thời gian mà điểm cuối hoạt động.

Cách tính phí suy diễn cho phân loại không đồng bộ:

Kích thước của từng yêu cầu mỗi ngày = 4.320.000 ký tự [300 ký tự * 10 tài liệu * 1.440 phút]

Số đơn vị trên mỗi yêu cầu = 43.200 đơn vị [432.000 ký tự ÷ 100 ký tự trên mỗi đơn vị]

Giá trên mỗi đơn vị = 0,0005 USD

Tổng chi phí suy diễn cho các đơn vị = 21,60 USD [43.200 đơn vị x 0,0005 USD]

Tổng chi phí = 25,10 USD [21,60 USD suy diễn + 3 USD đào tạo mô hình + 0,50 USD lưu trữ mô hình]

Cách tính tổng chi phí cho phân loại đồng bộ:

Đầu tiên, hãy tính mức thông lượng cần thiết. Mỗi phút chúng ta phân loại 10 tài liệu, mỗi tài liệu có 300 ký tự. Vậy chúng ta có:

50 ký tự mỗi giây [300 ký tự x 10 tài liệu ÷ 60 giây]

Do đó, bạn sẽ cần cung cấp một điểm cuối có 1 Đơn vị suy diễn (IU) với thông lượng 100 ký tự/giây.

Mức giá cho 1 IU = 0,0005 USD/giây

Chi phí của bạn sẽ tùy thuộc vào khoảng thời gian mà điểm cuối phân loại theo thời gian thực của bạn hoạt động và không bị ảnh hưởng bởi số lần thực hiện suy diễn.

Nếu bạn đang chạy điểm cuối phân loại theo thời gian thực trong 12 giờ mỗi ngày:

Tổng chi phí suy diễn = 21,60 USD [0,0005 USD x 3.600 giây x 12 giờ]

Tổng chi phí = 25,10 USD [21,60 USD suy diễn + 3 USD đào tạo mô hình + 0,50 USD lưu trữ mô hình]

Lưu ý rằng bạn phát sinh chi phí cho mức thông lượng được cung cấp và cho khoảng thời gian điểm cuối hoạt động. Nếu bạn cần cung cấp thêm thông lượng, mức giá sẽ là:

Mức giá cho 2 IU = 0,001 USD/giây [0,0005 USD x 2]

Mức giá cho 3 IU = 0,0015 USD/giây [0,0005 USD x 3]


Ví dụ 4 – Phân tích bình luận của khách hàng bằng API thực thể tùy chỉnh

Giả sử bạn muốn đào tạo một mô hình thực thể tùy chỉnh để tự động trích xuất các thuật ngữ tùy chỉnh từ phản hồi của khách hàng trên trang web của mình. Tác vụ huấn luyện kéo dài 1,5 giờ và bạn phân tích 10.000 phản hồi của khách hàng, mỗi phản hồi có 550 ký tự. Bạn dự kiến duy trì mô hình này trong 1 tháng. Chúng tôi cũng giả sử rằng bạn đang sử dụng dịch vụ ở năm thứ hai và không đủ điều kiện để nhận bậc miễn phí.

Tính tổng phí:

Kích thước mỗi yêu cầu = 5.500.000 ký tự

Số đơn vị trên mỗi yêu cầu = 55.000 đơn vị [5.500.000 ký tự ÷ 100 ký tự trên mỗi đơn vị]

Giá trên mỗi đơn vị = 0,0005 USD

Tổng chi phí của các đơn vị = 27,5 USD [55.000 đơn vị x 0,0005 USD]

Tổng số giờ huấn luyện mô hình = 1,5 giờ

Giá mỗi giờ = 3 USD

Tổng chi phí huấn luyện mô hình = 4.5 USD [1,5 giờ x 3 USD]

Số tháng quản lý mô hình = 1 tháng

Giá mỗi tháng = 0,50 USD 

Tổng chi phí quản lý mô hình = 0,50 USD [1 tháng x 0,50 USD]

Tổng chi phí = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]


Ví dụ 5 – Trích xuất sự kiện và thông tin có liên quan bằng tính năng phát hiện sự kiện

Giả sử bạn muốn trích xuất 3 loại sự kiện từ 3.000 bài viết, mỗi bài viết có 500 ký tự và bạn đang sử dụng dịch vụ đến năm thứ hai.

Tính tổng phí:

Số lượng ký tự được xử lý = 1.500.000 ký tự [3.000 bài viết x 500 ký tự]

Số lượng đơn vị được xử lý = 45.000 đơn vị [1.500.000 x 3 loại sự kiện ÷ 100 ký tự mỗi đơn vị]

Giá trên mỗi đơn vị = 0,003 USD

Tổng chi phí của các đơn vị = 135 USD [45.000 đơn vị x 0,003 USD]


Ví dụ 6 – Xác định tài liệu có PII bằng API contains PII

Giả sử bạn đã sử dụng Amazon Comprehend để xây dựng một ứng dụng để phân tích bình luận của khách hàng về cửa hàng trực tuyến của mình. Bạn nhận được 10.000 bình luận của khách hàng, mỗi bình luận có 550 ký tự. Bạn cần xác định tài liệu có chứa PII để lưu trữ các tài liệu đó ở vị trí an toàn. Giả sử bạn đang sử dụng dịch vụ đến năm thứ hai.

Tính tổng phí:

Kích thước mỗi yêu cầu = 550 ký tự

Số đơn vị trên mỗi yêu cầu = 6

Tổng số đơn vị = 60.000 [10.000 yêu cầu x 6 đơn vị mỗi yêu cầu]

Giá trên mỗi đơn vị = 0,000002 USD

Tổng chi phí = 0,12 USD [60.000 đơn vị x 0,000002 USD]


Ví dụ 7 – Biên tập lại PII từ các tài liệu bằng API detect PII

Giả sử bạn đã sử dụng Amazon Comprehend để xây dựng một ứng dụng để phân tích bình luận của khách hàng về cửa hàng trực tuyến của mình. Bạn nhận được 10.000 bình luận của khách hàng, mỗi bình luận có 550 ký tự. Bạn cần tạo phiên bản tài liệu sau khi loại bỏ thông tin trước khi lưu trữ các phiên bản đó. Giả sử bạn đang sử dụng dịch vụ đến năm thứ hai.

Tính tổng phí:

Kích thước mỗi yêu cầu = 550 ký tự

Số đơn vị trên mỗi yêu cầu = 6

Tổng số đơn vị = 60.000 [10.000 yêu cầu x 6 đơn vị mỗi yêu cầu]

Giá trên mỗi đơn vị = 0,0001 USD

Tổng chi phí = 6 USD [60.000 đơn vị x 0,0001 USD]

Ví dụ 8 – Trích xuất các thực thể từ đơn đăng ký thế chấp bằng API thực thể tùy chỉnh

Giả sử bạn muốn đào tạo một mô hình trích xuất thực thể tùy chỉnh để trích xuất 10 thực thể tùy chỉnh từ đơn đăng ký thế chấp. Một trăm khách hàng đăng ký mỗi ngày, mỗi khách hàng cung cấp 10 trang quét tài liệu PDF chứa 2.500 ký tự mỗi trang. Giả sử chúng ta cần dùng Amazon Textract để trích xuất văn bản từ tất cả các trang đã được xử lý trước khi trích xuất các thực thể bằng API Phát hiện văn bản tài liệu. Phải mất một giờ để đào tạo mô hình tùy chỉnh và bạn dự kiến sẽ duy trì mô hình này trong một tháng. Do đó, chi phí đào tạo mô hình sẽ là 3 USD và chi phí lưu trữ mô hình sẽ là 0,50 USD cho tháng đó. Chúng tôi cũng giả sử rằng bạn đang sử dụng dịch vụ ở năm thứ hai và không đủ điều kiện để nhận bậc miễn phí. Để trích xuất các thực thể tùy chỉnh một cách không đồng bộ, bạn cần thanh toán theo số lượng ký tự trong tài liệu của bạn. Để trích xuất các thực thể theo thời gian thực, bạn cung cấp một điểm cuối với đủ thông lượng để xử lý trường hợp sử dụng của mình và thanh toán cho khoảng thời gian mà điểm cuối hoạt động.

Cách tính phí suy diễn cho phân loại không đồng bộ:

Kích thước của từng yêu cầu mỗi ngày = 2.500.000 ký tự [100 đơn đăng ký/ngày * 10 tài liệu * 2.500 ký tự]

Số đơn vị mỗi yêu cầu = 25.000 đơn vị [2.500.000 ký tự ÷ 100 ký tự mỗi đơn vị]

Giá trên mỗi đơn vị = 0,0005 USD

Tổng chi phí suy diễn cho các đơn vị = 12,50 USD [25.000 đơn vị x 0,0005 USD]

Chi phí Amazon Textract cho API Phát hiện văn bản tài liệu = 1,50 USD [100 đơn đăng ký/ngày * 10 tài liệu * mức giá 0,0015 USD mỗi trang, lên đến 1 triệu trang]

Tổng chi phí = 17,50 USD [12,50 USD suy luận + 1,50 USD Textract + 3 USD đào tạo mô hình + 0,50 USD lưu trữ mô hình]

 

Ví dụ 9 – Phân tích các câu trả lời cho bài khảo sát nhân viên

Giả sử bạn đã xây dựng một ứng dụng sử dụng Amazon Comprehend nhắm cảm xúc để phân tích câu trả lời cho bài khảo sát nhân viên của công ty. Bạn đã nhận được 100.000 câu trả lời cho bài khảo sát, mỗi câu trả lời có 350 ký tự và bạn đã sử dụng dịch vụ được hai năm.

Tính tổng phí:

Kích thước mỗi yêu cầu = 350 ký tự

Số đơn vị trên mỗi yêu cầu = 4

Tổng số đơn vị = 100.000 (yêu cầu) x 4 (đơn vị trên mỗi yêu cầu) = 400.000

Giá trên mỗi đơn vị = 0,0001 USD (từ 0-10 triệu đơn vị)

Tổng chi phí = [Số đơn vị] x [Chi phí trên mỗi đơn vị] = 400.000 x 0,0001 USD = 40,00 USD

 

Ví dụ 10 - Phát hiện nội dung độc hại trong các bình luận trực tuyến trên trang web

Giả sử bạn đã xây dựng một ứng dụng sử dụng Amazon Comprehend để phát hiện nội dung độc hại trong các bình luận trên trang web của mình. Bạn đã nhận được 100 triệu bình luận của khách hàng với mỗi bình luận dài 100 ký tự và bạn cần xác định bình luận nào có tính chất độc hại và cần được biên tập lại. Giả sử bạn đang sử dụng dịch vụ đến năm thứ hai.

            Tính tổng phí:

            Kích thước mỗi yêu cầu = 100 ký tự

            Số đơn vị trên mỗi yêu cầu = Tổng 1

            Đơn vị = 100 triệu IU [100 triệu bình luận x 1 đơn vị trên mỗi yêu cầu]

            Đơn giá = 0,0001 USD [từ 0 - 10 triệu IU] + 0,00005 USD [từ 10 triệu - 50 triệu IU] + 0,000025 [từ 50 triệu - 100 triệu IU]

            Tổng chi phí = [Số đơn vị] x [Chi phí trên mỗi đơn vị]

            = [10 triệu X 0,001 USD] + [40 triệu X 0,00005 USD] + [50 triệu X 0,000025 USD]

            = 1.000 USD + 2.000 USD + 1.250 USD

            = 4.250 USD

Ví dụ 11 - Phát hiện lời nhắc không an toàn trong ứng dụng AI tạo sinh

Giả sử bạn đã xây dựng một ứng dụng sử dụng Amazon Comprehend để phát hiện lời nhắc đầu vào không an toàn khi người dùng tương tác với sản phẩm AI tạo sinh của bạn. Bạn đã nhận được 10 triệu lời nhắc đầu vào với mỗi lời nhắc dài 500 ký tự và bạn cần xác định lời nhắc nào không an toàn. Giả sử bạn đang sử dụng dịch vụ đến năm thứ hai.

            Tính tổng phí:

            Kích thước mỗi yêu cầu = 500 ký tự

            Số đơn vị trên mỗi yêu cầu = 5

            Tổng số đơn vị = 50 triệu IU [10 triệu bình luận x 5 đơn vị trên mỗi yêu cầu]

            Đơn giá = 0,0001 USD [từ 0 - 10 triệu IU] + 0,00005 USD [từ 10 triệu - 50 triệu IU] + 0,000025 [từ 50 triệu - 100 triệu IU]

            Tổng chi phí = [Số đơn vị] x [Chi phí trên mỗi đơn vị]

            = [10 triệu X 0,001 USD] + [40 triệu X 0,00005 USD]

            = 1.000 USD + 2.000 USD

            = 3.000 USD

Tìm hiểu thêm về các tính năng của Amazon Comprehend

Truy cập trang tính năng
Bạn đã sẵn sàng để bắt đầu chưa?
Đăng ký
Bạn có câu hỏi khác ư?
Liên hệ với chúng tôi