Amazon Textract 宣布文本提取功能有所更新

发布于: Sep 23, 2022

Amazon Textract 是一种机器学习服务，可从任意文档或图像中自动提取文本、手写内容和数据。我们会根据客户反馈持续改进底层机器学习模型，以提供更高的准确性。今天，我们很高兴宣布通过 DetectDocumentText API 对我们的文本提取功能进行了质量改进。

通过 DetectDocumentText API 可用的最新文本检测模型现在改进了单词和行提取的准确性，特别是针对支票中常用的 E13B 字体、银行单据中的国际银行账号以及长词（例如电子邮件地址）。

最后，我们很高兴宣布我们增强了底层机器学习模型的功能，从而减少了调用 DetectDocumentText API 时的延迟。

从 9 月 20 日起，此更新现将在以下区域推出：美国东部（俄亥俄州、弗吉尼亚州北部）、美国西部（北加利福尼亚）、美国西部（俄勒冈州）、亚太地区（孟买、首尔、新加坡、悉尼）、加拿大（中部）、欧洲地区（法兰克福、爱尔兰、伦敦、巴黎）以及 AWS GovCloud（美国）。

要开始使用，请登录到 Amazon Textract 控制台以试用新功能。要了解有关 Textract 功能的更多信息，请访问 Amazon Textract 网站、开发人员指南或资源页面。