Publicado en: Sep 23, 2022
Amazon Textract es un servicio de machine learning que extrae texto, escritura manual y datos de cualquier documento o imagen en forma automática. Mejoramos continuamente los modelos subyacentes de machine learning en función de los comentarios realizados por los clientes para ofrecer una precisión aún mayor. Nos complace anunciar hoy las mejoras en la calidad de nuestra característica de extracción de texto disponible a través de la API de DetectDocumentText.
Los últimos modelos de detección de texto disponibles a través de la API de DetectDocumentText ahora ofrecen mejoras en la precisión para la extracción de palabras y de renglones, y, específicamente, para las fuentes E13B que suelen encontrarse en verificaciones/cheques, números de cuentas bancarias internacionales de documentos bancarios y palabras largas (por ejemplo, direcciones de correo electrónico).
Finalmente, nos complace anunciar que incorporamos mejoras a los modelos subyacentes de machine learning, que dieron como resultado una disminución en la latencia al llamar a nuestra API de DetectDocumentText.
Esta actualización está disponible a partir del 20 de septiembre en las siguientes regiones: Este de EE. UU. (Ohio, Norte de Virginia), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Asia-Pacífico (Bombay, Seúl, Singapur, Sídney), Canadá (centro), Europa (Fráncfort, Irlanda, Londres, París) y AWS GovCloud (EE. UU.).
Para comenzar, inicie sesión en la consola de Amazon Textract y pruebe la nueva característica. Para obtener más información sobre las capacidades de Textract, visite el sitio web de Amazon Textract, la guía para desarrolladores o la página de recursos.