Publié le: Aug 9, 2021
Amazon Comprehend est un service de traitement du langage naturel (NLP) qui utilise le machine learning pour analyser des documents textuels afin d'y identifier des informations telles que le ressenti, les entités et les rubriques. Aujourd'hui, nous mettons à jour nos modèles personnalisés de reconnaissance d'entités, de sorte que vous puissiez entraîner des modèles avec moins de documents d'entraînement. La reconnaissance d'entités personnalisées étend les capacités d'Amazon Comprehend en vous permettant d'identifier de nouveaux types d'entités non pris en charge en tant qu'un des types d'entités génériques prédéfinis. Cela signifie, qu'en plus d'identifier les types d'entités à partir de l'API Detect Entities, par exemple LOCALISATION, DATE ou PERSONNE, vous pouvez analyser des documents et en extraire des entités telles que PRODUCT_CODE, EMPLOYEE_ID, CONTRACTOR_NAME, ou des entités spécifiques au métier que vous définissez en fonction de vos besoins. À partir d'aujourd'hui nous avons réduit de 50 % les documents d'entraînement minimum requis. En d'autres termes, vous pouvez entraîner des modèles personnalisés avec moins de 100 annotations par type d'entité à partir de 250 documents. Si vous avez plus de documents d'entraînement, vous pouvez même espérer de meilleurs résultats issus de modèles plus récents qu'auparavant !
Les modèles personnalisés de reconnaissance d'entités mis à jour sont disponibles dans toutes les régions AWS où Amazon Comprehend est disponible. Pour essayer la nouvelle fonction, connectez-vous à la console Amazon Comprehend pour une expérience sans code, ou téléchargez le kit AWS SDK. Pour en savoir plus également sur cette nouvelle fonction, consultez notre blog.