- Machine Learning›
- Amazon Polly›
- Preguntas frecuentes
Preguntas frecuentes acerca de Amazon Polly
Aspectos generales
¿Qué es Amazon Polly?
Amazon Polly es un servicio que transforma texto en voz natural. Amazon Polly incluye una característica de primera clase que permite a las aplicaciones existentes hablar y crea la oportunidad de nuevas categorías de productos con funciones de habla, desde aplicaciones móviles y coches, hasta dispositivos de diversos tipos. Amazon Polly incluye decenas de voces realistas y soporte para varios idiomas, de modo que puede seleccionar la voz ideal y distribuir las aplicaciones con voz en muchos países distintos. Amazon Polly es fácil de usar: basta con que envíe el texto que desea convertir en habla a la API de Amazon Polly, y Amazon Polly enviará la transmisión de audio al instante a su aplicación, para que pueda reproducirlo directamente o almacenarlo en un formato de archivo de audio estándar, como MP3. Amazon Polly admite etiquetas Speech Synthesis Markup Language (SSML) como prosodia para que pueda ajustar la velocidad de habla, el tono o el volumen. Amazon Polly es un servicio seguro que ofrece todos estos beneficios a gran escala y con baja latencia. Puede almacenar en caché y volver a reproducir el habla generada por Amazon Polly sin costo adicional. Amazon Polly le permite convertir millones de caracteres al mes gratis durante el primer año, tras la inscripción. Los precios de pago por uso, el bajo costo por solicitud y la ausencia de restricciones de almacenamiento y reutilización de la salida de voz de Amazon Polly lo convierten en una forma rentable de habilitar la síntesis de habla en cualquier lugar.
¿Por qué debería utilizar Amazon Polly?
Puede utilizar Amazon Polly para mejorar su aplicación con habla de alta calidad. Este servicio rentable ofrece tiempos de respuesta muy bajos y está disponible para prácticamente cualquier caso de uso, sin restricciones de almacenamiento o reutilización del habla generada.
¿Qué características están disponibles?
Puede controlar diversos aspectos del habla como la pronunciación, el volumen, el tono, la velocidad de habla, etc., mediante el sistema Speech Synthesis Markup Language (SSML) estandarizado. Puede sintetizar el habla para ciertas voces neuronales usando el estilo de presentador de noticias para hacer que suenen como un noticiero de TV o Radio. Puede detectar cuándo palabras u oraciones específicas del texto están hablando con el usuario basándose en los metadatos incluidos en el stream de audio. Esto permite al desarrollador sincronizar el resaltado gráfico y las animaciones, como los movimientos de los labios de un avatar, con el habla sintetizada. Puede modificar la pronunciación de determinadas palabras, como nombres de empresas, acrónimos, palabras extranjeras y neologismos, p. ej.: “P!nk”, “ROTFL”, “C’est la vie” (cuando se habla en una voz no francesa) con léxicos personalizados.
¿Qué son las marcas de voz?
Las marcas de voz están diseñadas para complementar el habla sintetizada que se genera a partir del texto de entrada. Al usar este flujo de metadatos junto con el flujo de audio de voz sintetizada, los clientes pueden crear sus aplicaciones con una experiencia visual mejorada, como animación sincronizada con voz o resaltado estilo karaoke.
Amazon Polly genera marcas de voz utilizando los cuatro elementos siguientes:
- Oración, que indica un elemento de oración en el texto de entrada que debe pronunciarse;
- Palabra, que indica un elemento de palabra en el texto;
- Visema, que describe la forma de los labios que corresponde al sonido que se pronuncia;
- SSML, que describe un elemento SSML utilizado en el texto.
Las marcas de voz se entregan en formato de una secuencia JSON -- específicamente, un conjunto de objetos JSON independientes delimitados con nuevas líneas -- que contiene de uno a cuatro de estos elementos, cuando se usa el método sintetizar voz con el parámetro tipos de marcas de voz. Puede encontrar más información en la Guía para desarrolladores de Amazon Polly.
¿Cuáles son los casos de uso más comunes de este servicio?
Con Amazon Polly, puede hacer que sus aplicaciones cobren vida incorporando capacidades de habla realista. Por ejemplo, en formación online y educación, puede crear aplicaciones aprovechando la capacidad de texto a habla (TTS) de Amazon Polly para ayudar a personas con dificultades para leer. Amazon Polly se puede utilizar para ayudar a las personas invidentes y con discapacidad visual a consumir contenido digital (eBooks, noticias, etc.). Amazon Polly se puede utilizar en sistemas de anuncios en transporte público y sistemas de control industrial para notificaciones y anuncios de emergencia. Existe una amplia gama de dispositivos como decodificadores, relojes inteligentes, tablets, smartphones y dispositivos de IoT, que pueden utilizar Amazon Polly para proporcionar salida de audio. Amazon Polly se puede utilizar en soluciones de telefonía para sistemas de respuesta de voz interactiva. Aplicaciones como juegos de preguntas, animaciones, avatares o generación de narración son casos de uso comunes para la solución TTS en la nube como Amazon Polly.
¿Cómo funciona este producto con otros de AWS?
Cuando se combina con Amazon Lex, los desarrolladores pueden crear interfaces de usuario de voz avanzadas para sus aplicaciones. Dentro de Amazon Connect, la voz de Amazon Polly se utiliza para crear servicios de centro de contacto basados en la nube de autoservicio. Además, los desarrolladores de aplicaciones para dispositivos móviles y soluciones de Internet de las cosas (IoT) pueden aprovechar Amazon Polly para agregar salida de voz a sus propios sistemas.
¿Qué ventajas tiene una solución de conversión de texto a habla basada en la nube en comparación con una basada en un dispositivo?
Las soluciones de texto a voz integradas en un dispositivo requieren que dicho dispositivo tenga disponibles recursos informáticos considerables, sobre todo potencia de CPU, RAM y espacio en disco. Esto puede generar un costo de desarrollo superior y mayor consumo de potencia en dispositivos como tablets, smartphones, etc. Por el contrario, la conversión de texto a voz realizada en la nube reduce drásticamente los requisitos de recursos locales. Esto permite soportar todos los idiomas y las voces disponibles con la mayor calidad posible. Además, las correcciones y mejoras de habla están disponibles de forma instantánea para todos los usuarios finales y no requieren más actualizaciones de todos los dispositivos. El sistema de texto a habla (TTS) en la nube no depende de la plataforma, por lo que minimiza el tiempo y el esfuerzo de desarrollo.
¿Cómo puedo comenzar a utilizar Amazon Polly?
Basta con iniciar sesión en la cuenta de AWS y desplazarse hasta la consola de Amazon Polly (que forma parte de la consola de AWS). Después puede utilizar la consola para escribir cualquier texto y escuchar el habla generada o guardarla como un archivo de audio.
¿En qué regiones está disponible el servicio?
Consulte la Lista de servicios regionales de AWS para conocer todas las regiones compatibles con las voces estándar de Amazon Polly. Las voces neuronales son compatibles en el siguiente subconjunto de regiones: Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Canadá (centro), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), África (Ciudad del Cabo), UE (Londres), UE, (Fráncfort), UE (Irlanda) y AWS GovCloud (Oeste de EE. UU.).
¿Qué lenguajes de programación se admiten?
Amazon Polly admite todos los lenguajes de programación incluidos en el AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go y C++) y el SDK para móviles de AWS (iOS/Android). Amazon Polly también soporta una API de HTTP para que pueda implementar su propia capa de acceso.
¿Qué formatos de audio se admiten?
Con Amazon Polly, puede transmitir audio a sus usuarios casi en tiempo real. Puede elegir entre varias tasas de muestreo para optimizar el ancho de banda y la calidad de audio de su aplicación. Amazon Polly soporta MP3, Vorbis y formatos de transmisión de audio PCM sin procesar.
¿Qué idiomas se admiten?
Consulte la documentación para ver la lista completa de idiomas que admite Amazon Polly.
¿Amazon Polly tiene limitaciones de servicio de AWS?
Para ayudar a garantizar la disponibilidad de los recursos de AWS y reducir riesgos de facturación de nuevos clientes, AWS conserva limitaciones de servicio para cada cuenta. Cuando utiliza Amazon Polly con su aplicación con salida de voz de alta calidad, existen limitaciones de servicio predeterminadas que incluyen: limitación controlada, operaciones y lenguaje de marcado de síntesis de voz (SSML). Para obtener más detalles, consulte los límites de Amazon Polly en la guía para desarrolladores de Amazon Polly. Combinar Amazon Polly con otros servicios de AWS, como AWS Batch para lograr un procesamiento de lotes eficiente, puede ayudarlo a sacar el máximo provecho de Amazon Polly dentro de dichos límites de servicio.
¿Amazon Polly cuenta con la certificación de HIPAA?
R: Amazon Polly es un servicio que cumple los requisitos de HIPAA y que está cubierto bajo el anexo para socios empresariales de AWS (AWS BAA). Si cuenta con un AWS BAA vigente, Amazon Polly usará, difundirá y conservará la información sanitaria protegida (PHI) siempre y cuando lo permitan los términos de su AWS BAA y no en función de lo que se especifique en la sección de privacidad de datos de las preguntas frecuentes sobre Amazon Polly.
¿Cómo puedo comenzar a utilizar la voz de marca de Amazon Polly?
Si está interesado en desarrollar una voz de marca usando Amazon Polly, póngase en contacto con su administrador de cuentas AWS o comuníquese con nosotros para obtener más información.
¿Cuál es el costo y el plazo para crear una voz de marca?
Cada voz es única; por lo tanto es importante que sepamos más acerca de sus metas para poder definir con precisión una interacción de voz de marca. Si está interesado en desarrollar una voz de marca usando Amazon Polly, póngase en contacto con su administrador de cuentas AWS o comuníquese con nosotros para obtener más información.
Facturación
¿Cuánto cuesta Amazon Polly?
Consulte la página de precios de Amazon Polly para ver información actualizada de precios.
¿Puedo usar el servicio para generar indicaciones de voz estáticas que se reproduzcan varias veces?
Sí, es posible. El servicio no restringe este uso y no implica costos adicionales.
¿Puedo usar el servicio para generar contenido que se utilizará en sistemas de notificación masiva (por ejemplo, en una estación de tren)?
Sí, es posible. El servicio no restringe este uso y no implica costos adicionales.
Si solicito sintetizar 1 000 caracteres y solicito marcas de voz con los mismos 1 000 caracteres, ¿me cobrarán por 2 000 caracteres?
Sí. Se le cobrará por cada solicitud de habla o de marca de voz según el número de caracteres que envíe al servicio.
¿Amazon Polly participa en la capa gratuita de AWS?
Sí, como parte de la capa de uso gratuita de AWS, puede comenzar a utilizar Amazon Polly de forma gratuita. Después de iniciar sesión, los nuevos clientes de Amazon Polly pueden sintetizar millones de caracteres gratis por mes durante los primeros 12 meses. Consulte la página de precios de Amazon Polly para ver información actualizada de precios.
¿Los precios incluyen impuestos?
Para obtener más información sobre impuestos, consulte la ayuda sobre impuestos de Amazon Web Services.
Privacidad de datos
¿Los textos de entrada que Amazon Polly procesa se almacenan? ¿Cómo los utiliza AWS?
Amazon Polly puede almacenar y utilizar los textos de entrada que el servicio procesa únicamente para proporcionar y mantener el servicio, y para mejorar y desarrollar el nivel de calidad de Amazon Polly y de otras tecnologías de aprendizaje automático/inteligencia artificial de Amazon. El uso de su contenido es importante para la mejora continua de su experiencia como cliente de Amazon Polly, incluido el desarrollo y el entrenamiento de tecnologías relacionadas. No utilizamos información de identificación personal que pudiera estar incluida en el contenido para venderle a usted o a sus usuarios finales productos o servicios, ni para campañas de marketing. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte https://thinkwithwp.com/compliance/data-privacy-faq/. Puede desactivar el uso de su contenido para mejorar y desarrollar el nivel de calidad de Amazon Polly y de otras tecnologías de aprendizaje automático e inteligencia artificial de Amazon. Para ello, utilice una política de no participación de AWS Organizations. Para obtener más información acerca de cómo optar por la exclusión, consulte Administración de la política para no participar en los servicios de IA.
¿Quién tiene acceso al contenido que se procesa y almacena en Amazon Polly?
Solo los empleados autorizados tendrán acceso al contenido que procese Amazon Polly. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte https://thinkwithwp.com/compliance/data-privacy-faq/.
¿Continuaré siendo el propietario del contenido que se procese y almacene en Amazon Polly?
Siempre conservará la titularidad del contenido, que se utilizará únicamente con su consentimiento.
¿El contenido que procesa Amazon Polly se traslada fuera de la región de AWS en la que estoy usando el servicio?
Todo el contenido que se procesa con Amazon Polly se cifra y almacena en reposo en la región de AWS en la que está usando el servicio. Es posible que una parte del contenido procesado por Amazon Polly se almacene en otra región de AWS únicamente a los fines de mejorar y desarrollar continuamente su experiencia como cliente de Amazon Polly y otras tecnologías de aprendizaje automático/inteligencia artificial de Amazon. Si deshabilita el uso de su contenido para mejorar y desarrollar el nivel de calidad de Amazon Polly y de otras tecnologías de aprendizaje automático/inteligencia artificial de Amazon poniéndose en contacto con AWS Support, su contenido no se almacenará en otra región de AWS. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte https://thinkwithwp.com/compliance/data-privacy-faq/.
¿Puedo utilizar Amazon Polly en sitios web, programas u otras aplicaciones dirigidos o concebidos para niños menores de 13 años y sujetos a la Ley de protección de la privacidad de los niños en línea (COPPA)?
Sí, en cumplimiento de los Términos de Servicio de Amazon Polly, incluida su obligación de proporcionar cualquier aviso requerido y obtener cualquier consentimiento verificable de los padres según COPPA, puede usar Amazon Polly en relación con sitios web, programas u otras aplicaciones dirigidos o concebidos, en todo o en parte, para niños menores de 13 años.
¿A quién pertenecen los registros de Polly?
Entre tú y AWS, los resultados de Polly te pertenecen. Si introduce texto en Polly que pertenece a un tercero, requerimos que tenga los derechos para hacerlo. Para obtener más información, consulte nuestro Acuerdo de cliente y el modo en que trata “Su contenido”
¿Cómo puedo determinar si mi sitio web, programa o aplicación está sujeto a la ley COPPA?
Para obtener información sobre los requisitos de la ley COPPA y sus directrices a fin de determinar si su sitio web, programa u otra aplicación están sujetos a la ley COPPA, consulte directamente los recursos proporcionados y mantenidos por la Comisión Federal de Comercio de Estados Unidos. Este sitio también contiene información sobre cómo determinar si un servicio está dirigido o concebido, en todo o en parte, para niños menores de 13 años.
Más información sobre los precios de Amazon Polly