Skip to content
El logo de OpenAI, empresa especializada en inteligencia artificial liderada por Sam Altman

La IA de OpenAI Revoluciona la Clonación de Voces en solo 15 Segundos de Audio

OpenAI ha anunciado avances impresionantes en la generación de voces sintéticas. Ahora, su sistema Voice Engine puede clonar cualquier voz en cualquier idioma con tan solo 15 segundos de audio como muestra.

En su comunicado reciente, OpenAI detalla cómo su sistema Voice Engine, presentado por primera vez en 2022, ha evolucionado para clonar voces con una precisión asombrosa a partir de muestras de audio muy breves. Las demostraciones compartidas por la empresa son verdaderamente sorprendentes, mostrando la capacidad del Voice Engine para generar voces ultra realistas a partir de breves fragmentos de audio. Esto abre un abanico de posibilidades, desde la asistencia a la lectura hasta la ayuda a personas con dificultades en el habla.

Aunque no es la primera vez que vemos sistemas de inteligencia artificial que clonan voces, OpenAI ha logrado un avance significativo al reducir drásticamente la duración del audio necesario para recrear una voz con precisión. Mientras que sistemas anteriores requerían muestras más largas, Voice Engine puede trabajar con tan solo 15 segundos de audio.

El funcionamiento aparentemente simple del sistema permite a los usuarios proporcionar una breve grabación de voz y un texto. La IA luego utiliza esta muestra para «clonar» la voz y narrar el contenido del texto con un tono realista y emotivo.

Sin embargo, OpenAI reconoce los riesgos asociados con esta tecnología y está evaluando cuidadosamente su posible impacto antes de hacerla pública. Dada la posibilidad de uso indebido, la empresa está adoptando un enfoque cauteloso y analizando los riesgos. Aunque aún no está disponible para el público en general, OpenAI considerará los resultados de sus pruebas piloto para determinar si lanzará esta tecnología como un servicio accesible.

En resumen, OpenAI ha alcanzado un hito significativo en la generación de voces sintéticas con su Voice Engine, ofreciendo un potencial revolucionario en diversos campos. Sin embargo, la empresa también está comprometida con la responsabilidad y la evaluación cuidadosa de los riesgos antes de hacer que esta tecnología esté ampliamente disponible.