Publicado en: Mar 28, 2019
Amazon Transcribe es un servicio completamente administrado de reconocimiento automático del habla (ASR) que le permite agregar capacidades de voz a texto a sus aplicaciones con facilidad. Amazon Transcribe ahora admite pronunciaciones personalizadas y formatos de visualización, lo que aumenta la capacidad de la característica de vocabulario personalizado.
Puede dar a Amazon Transcribe más información sobre cómo procesar el habla en su archivo de audio o video de entrada mediante la creación de un vocabulario personalizado. Un vocabulario personalizado es una lista de palabras específicas que desea que Amazon Transcribe reconozca en su entrada de audio. En general, son palabras y frases específicas de un dominio, palabras que Amazon Transcribe no reconoce o nombres propios.
Ahora, con el uso de los caracteres del alfabeto fonético internacional (AFI), puede mejorar cada término personalizado con las pronunciaciones personalizadas correspondientes. Alternativamente, también puede usar la ortografía estándar del idioma para imitar la forma en que suena la palabra o la frase.
Además, ahora es posible designar exactamente cómo se debe mostrar la terminología de un cliente cuando se transcribe (por ejemplo, "Bulevard" como "Blvr", en contraposición con "Blvd").
La pronunciación personalizada y las mejoras en los formatos de visualización del vocabulario personalizado están disponibles en las mismas regiones que Amazon Transcribe. Pruebe las nuevas características del vocabulario personalizado en la consola de Amazon Transcribe o use la interfaz de línea de comandos (CLI) y los SDK de AWS. Para obtener más información, visite esta página de documentación.