Amazon ofrece un nuevo servicio para que pongas a hablar a tus aplicaciones

Germán Castaño envió un nuevo contenido a Laneros.com

Amazon ofrece un nuevo servicio para que pongas a hablar a tus aplicaciones

parrot-850593_1280-1024x575.jpg


Amazon Polly, es un nuevo servicio en AWS con el que puedes utilizar una API para convertir fácilmente texto a voz, con la ayuda de inteligencia artificial y deep learning. Con 47 voces disponibles en 24 idiomas incluyendo el español, Amazon desea que los creadores de aplicaciones puedan crear soluciones que hablen a sus usuarios de una manera sencilla.
Amazon Polly soporta todos los lenguajes de programación del AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go, y C++) y de AWS Mobile SDK (iOS/Android). también se pueden crear procedimientos propios mediante la api http.​

Usar Polly puede ser tan simple como enviar el texto y el idioma y recibir el sonido en streaming para ser reproducido inmediatamente o en formatos descargables como MP3. Además del idioma, pueden manipular otros aspectos del sonido como el volumen, la velocidad e incluso le han adicionado palabras con pronunciación especial para que la reproducción suene menos robotizada.

El servicio se cobra por los caracteres reproducidos, pero tiene una capa gratuita en la cual pueden usar 5 millones de caracteres por mes durante el primer año. Personalmente le veo gran aplicabilidad a esta API a temas de accesibilidad para invidentes o aplicaciones educativas, sin contar los usos que podrían tener en soluciones de IoT.

Les comparto un ejemplo donde pueden ver cómo esta API reproduce la frase:

Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.

En voz de hombre:

https://d0.awsstatic.com/product-marketing/Polly/HelloSpanish-Miguel.mp3

En voz de mujer:

https://d0.awsstatic.com/product-marketing/Polly/HelloSpanish-Penelope.mp3



Ustedes qué opinan. En qué usarían esta nueva API?

vía Amazon
Continúa leyendo en nuestra sección de Noticias
 
Las voces suenan muy naturales en comparación con Siri y Google Now. Pero por el momento creo que Cortana sigue siendo la mejor voz.
 
Ese servicio no me convence.

Esta empresa tiene mucho mejor pronunciación.
http://www.acapela-group.com/
 

Los últimos temas