发布于: Aug 9, 2021
Amazon Comprehend 是一种自然语言处理(NLP)服务,它使用机器学习来分析文本文档并获取文本中的情绪、实体和主题之类的洞察。我们今天更新了自定义实体识别模型,从而让您能够使用更少的训练文档来训练模型。自定实体识别功能扩展了 Amazon Comprehend 的功能,让您可以非作为预设通用实体类型而受到支持的新实体类型。这意味着除可以识别来自检测实体 API(例如 LOCATION 或 DATE、PERSON)的实体类型外,您还可以分析文档并提取实体(例如 PRODUCT_CODE、EMPLOYEE_ID、CONTRACTOR_NAME)或者您定义的适合您具体需求的业务特定实体。从今天开始,我们将需要的最小训练文档数量减少了 50%。这意味着您可以用低至 250 个文档,每个实体类型 100 个标注来训练自定义模型。如果训练更多的文档,甚至可以用比以前更新的模型获得更佳的结果!
更新后的自定义实体识别模型已在所有提供 Amazon Comprehend 的 AWS 区域开放。要试用此新功能,请登录 Amazon Comprehend 控制台以获得无代码体验,或下载 AWS 软件开发工具包。您也可以阅读我们的博客,以详细了解这项新功能。