Edición México
Suscríbete
Ed. México

El Imparcial / Lo curioso / Inteligencia artificial

Inteligencia artificial ya imita a la perfección la voz humana, creadores advierten que lanzarla podría ser peligroso

Esta tecnología ha sido capaz de emular a detalle el discurso hablado

Inteligencia artificial ya imita a la perfección la voz humana, creadores advierten que lanzarla podría ser peligroso

Microsoft ha creado una nueva tecnología llamada VALL-E 2, que es un generador de voz con inteligencia artificial (IA). Este sistema puede imitar la voz de una persona usando solo unos pocos segundos de audio. Es tan realista que suena como si fuera una persona de verdad hablando.

Avance en la tecnología de voz

En un estudio reciente disponible en AirXiv, los investigadores de Microsoft afirmaron que VALL-E 2 puede generar voces que son casi indistinguibles de las humanas. Esto significa que la calidad del sonido generado por esta IA es tan buena como la voz de una persona real.

¿Cómo funciona VALL-E 2?

VALL-E 2 tiene dos características principales que lo hacen especial:

Repetition Aware Sampling: Esta función ayuda a que la voz generada suene más natural, evitando que se repitan sonidos o palabras de manera incómoda.

Grouped Code Modeling: Esto hace que el sistema sea más eficiente y rápido al generar voz, procesando menos fragmentos de sonido a la vez.

Evaluación de VALL-E 2

Los investigadores probaron VALL-E 2 usando bibliotecas de audio y descubrieron que superaba a otros sistemas anteriores en términos de claridad y similitud con la voz humana. Usaron un marco de evaluación llamado ELLA-V para medir la precisión y calidad de la voz generada.

Riesgos y usos futuros

Aunque VALL-E 2 es muy avanzado, Microsoft no lo pondrá a disposición del público por ahora debido a los riesgos potenciales, como el uso indebido para suplantar identidades o crear falsificaciones de voz. Sin embargo, los investigadores creen que esta tecnología podría ser útil en el futuro para la educación, entretenimiento, contenido periodístico, accesibilidad, sistemas de respuesta de voz interactiva, traducción y chatbots.

VALL-E 2 representa un gran avance en la tecnología de generación de voz con IA, pero su potencial de uso indebido hace que sea peligroso para el público en general en este momento. Microsoft continuará investigando y desarrollando esta tecnología con precaución.

Te puede interesar: ¿Qué sucede en tu cerebro cuando lees? Esto dice la ciencia

Temas relacionados