– Deep Voice – ¿Clonar voces en unos segundos?

Baidu's Deep Voice

– Deep Voice – ¿Clonar voces en unos segundos?

Baidu’s desarrolla un software clonador de voz 

Baidu’s Deep Voice es el nuevo software que puede clonar cualquier voz en 3.7 segundos de audio. Este software usa fragmentos de voces pudiendo crear nuevos discursos, acentos y tonos. La compañía asiática ha presentado su software mostrando los mejores resultados hasta ahora vistos.

Esta tecnología muestra el avance de la Inteligencia Artificial. Con unos segundos de voz y algunos datos faciales, se hace muy simple crear una entrevista, conferencia o noticia.

Este sistema a voz fue construido a partir de redes neuronales profundas.  El desafío de IA ha sido conseguir sintetizar la voz a gran velocidad. Se ha producido una aceleración de hasta 400 veces superior a las implementaciones anteriores.

 

Baidu's company

Baidu’s company

 

Clonar cualquier voz es posible con Deep Voice

Este nuevo algoritmo de Inteligencia Artificial puede clonar en sólo 3,7 segundos la voz de cualquier persona. Deep Voice ha sido desarrollado por Baidu’s, el gigante tecnológico Chino. La compañía puede clonar voces falsas muy creíbles gracias a este software. Esta investigación nos hace ver que cada vez es más difícil creer en cualquier medio de comunicación de internet.

Los investigadores de la compañía mostraron sus últimos avances en Deep Voice. Hasta hace solo un año, se necesitaban unos 30 minutos de audio para poder crear nuevos falsos audios a través de la voz. Ahora este sistema puede crear mejores resultados con solo unos segundos de la voz original. Los resultados suenan como un audio de baja calidad. Cuantas más muestras de capacitación se obtengan mayor será la calidad del resultado de la clonación.

En estas muestras podemos ver algunos de los resultados;

En el primero de ellos se escucha la voz original de un hombre británico. En el segundo, con el clonador de voz Deep Voice, podemos escuchar la voz de un hombre americano.

 

Aspectos destacados

Entre los aspectos más curiosos, el sistema puede cambiar las voces femeninas a masculinas, cambiar un acento británico a uno estadounidense. Estos resultados muestran como la Inteligencia Artificial puede aprender a imitar distintas expresiones y darles un nuevo matiz.

Este sistema de clonación podría tener aplicaciones importantes en la personalización de interfaces entre el hombre y la máquina sin requerir interfaces visuales. El texto a voz (TTS) es un elemento importante en muchas aplicaciones como sistemas de navegación y ayuda para personas con problemas visuales.

Deep Voice es un componente de síntesis e voz que puede reproducir voces humanas de modo efectivo. El sistema que la compañía asiática ha logrado con los mejores resultados hasta el momento.

Voice cloning

Voice cloning

 


 

Zapp Studio está especializada en la creación de aplicaciones móviles, y sabemos las importancia que tienen en la sociedad. Para mejorar la optimización y visibilidad de un negocio es de gran relevancia contar con una app móvil que  mejore el servicio o contacto con los clientes, a la vez que la organización internar. Un medio rápido y eficaz con el que los usuarios se sienten más cercanos a ti y ello les da confianza y seguridad.

Éstas son las bases para que una sociedad prospere. Queremos poner nuestro granito de arena. Si estás pensando en crear una aplicación, cuenta con nosotros. Pida presupuesto sin compromiso aquí.

 

zapp-studio-logo-nosotros