发布于: Sep 23, 2022
Amazon Textract 是一种机器学习服务,可从任意文档或图像中自动提取文本、手写内容和数据。我们会根据客户反馈持续改进底层机器学习模型,以提供更高的准确性。今天,我们很高兴宣布通过 DetectDocumentText API 对我们的文本提取功能进行了质量改进。
通过 DetectDocumentText API 可用的最新文本检测模型现在改进了单词和行提取的准确性,特别是针对支票中常用的 E13B 字体、银行单据中的国际银行账号以及长词(例如电子邮件地址)。
最后,我们很高兴宣布我们增强了底层机器学习模型的功能,从而减少了调用 DetectDocumentText API 时的延迟。
从 9 月 20 日起,此更新现将在以下区域推出:美国东部(俄亥俄州、弗吉尼亚州北部)、美国西部(北加利福尼亚)、美国西部(俄勒冈州)、亚太地区(孟买、首尔、新加坡、悉尼)、加拿大(中部)、欧洲地区(法兰克福、爱尔兰、伦敦、巴黎)以及 AWS GovCloud(美国)。
要开始使用,请登录到 Amazon Textract 控制台以试用新功能。要了解有关 Textract 功能的更多信息,请访问 Amazon Textract 网站、开发人员指南或资源页面。