Meta anunció Voicebox, una IA generadora de habla que crea voces nuevas en seis idiomas

Voicebox es la nueva IA de Meta que genera audios a partir de texto en seis idiomas.
/ Meta AI

19/06/2023 19H19

Meta ha anunciado un nuevo avance en Inteligencia Artificial. Se trata de Voicebox, un modelo generativo de habla el cual se basa en un nuevo método propuesto por Meta IA llamado Flow Matching.

De acuerdo con el comunicado de Meta, este modelo generativo de IA ayuda a la edición, sampling y estilización de audio. Además, en un futuro ayudará “a los creadores a editar fácilmente pistas de audio, permitir a las personas con discapacidad visual escuchar los mensajes escritos de sus amigos en sus voces y que las personas se comuniquen en cualquier idioma extranjero usando su propia voz”, señaló la compañía de Mark Zuckerberg.

MIRA: Apple lanza su visor VR mientras el CEO de Meta se centra en su rutina de entrenamiento militar

Si quieres conocer más sobre este nuevo modelo de Inteligencia Artificial de Meta, te damos los detalles.

¿Cómo funcionará Voicebox?

Voicebox nace con el propósito de darle un nuevo enfoque a la generación de voz. Y es que muchos de los sintetizadores de voz que existen en la actualidad dan salidas de audio monótonas, algo que Meta está dispuesto a cambiar.

Con el uso del método de Flow Matching, el cual ha mejorado los modelos de difusión, Meta busca que Voicebox pueda “entrenarse con datos más diversos y una escala de datos mucho mayor”, además de tener variaciones de voz que rompan con este esquema del habla monótono.

MIRA: Te enseñamos a usar MusicGen, la nueva IA de Meta para crear música a partir de texto

Al respecto, Meta explica en su comunicado que se capacitó a “Voicebox con más de 50 000 horas de voz grabada y transcripciones de audiolibros de dominio público en inglés, francés, español, alemán, polaco y portugués. Voicebox está entrenado para predecir un segmento de voz cuando se le da el habla circundante y la transcripción del segmento. Habiendo aprendido a rellenar el habla a partir del contexto, el modelo puede aplicar esto en las tareas de generación de voz, incluida la generación de partes en medio de una grabación de audio sin tener que volver a crear la entrada completa”.

Es decir que nos encontramos con un modelo totalmente distinto a los sintetizadores de voz que ya conocemos y el cual brindará una experiencia de habla mucho más natural. Además que en un futuro puede llegar a beneficiar a varios sectores de la sociedad.

MIRA: TikTok comienza a perder popularidad frente a los Reels de Instagram, según un estudio

Un modelo multitareas

El modelo inteligente de Voicebox le permitirá a los usuarios realizar varias tareas que facilitarán su comunicación con otras personas. A continuación te enlistamos algunas de las que mencionó Meta:

Síntesis de contexto de texto a habla. En su comunicado, Meta señaló que “utilizando una muestra de audio de tan solo un par de segundos, Voicebox puede adaptar el estilo de audio y utlizarlo para la generación de texto a habla”.

Edición de habla y reducción de ruido. Una de las tareas que te permitirá hacer Voicebox es mejorar el audio eliminando el ruido del exterior o sustituyendo palabras que el hablante pronunció de manera inadecuada, esto sin tener que volver a grabar de nuevo el discurso.

Transferencia de estilo entre idiomas. Como mencionamos anteriormente Voicebox tendrá la capacidad de producir el habla en seis idiomas diferentes, incluso si la muestra del habla y el texto no se encuentran en el mismo idioma.

MIRA: Solo el 26% de los empleados de Meta aún confían en el liderazgo de Mark Zuckerberg, según encuesta

Con ello, Meta da un paso importante en la brecha de comunicación entre diferentes países ya que en un futuro, las personas podrán comunicarse de forma natural con individuos que no hablen el mismo idioma.

Muestreo de habla diversa. Otras de las características importantes de Voicebox, es que este modelo también podrá generar un habla muy parecida a cómo se expresan las personas en el mundo real.

Por lo que ya no parecerá que hablamos con un robot, sino más bien con una persona más de nuestro círculo. Además, esto lo podrá hacer en los seis idiomas mencionados anteriormente.

MIRA: La IA que lanzó Meta tiene la capacidad de completar imágenes usando el “sentido común”

Uso de Inteligencia Artificial con responsabilidad

El uso de la Inteligencia Artificial en los últimos tiempos ha generado polémica debido a la mala práctica que se le puede dar a los avances de esta rama y que pueden ocasionar daños potenciales.

Meta está consciente de ello, por está razón en su comunicado dio a conocer que este modelo generativo de voz “puede distinguir entre voz auténtica y audio generado con Voicebox para mitigar riesgos futuros”. Además, compartieron sus avances en un artículo para que la comunidad de investigadores puedan basarse en su trabajo para crear nuevas aproximaciones en un futuro.

GDA / El Universal / México

IA

Inteligencia artificial

VIDEO RECOMENDADO

Le pedimos a ChatGPT que cree una canción criolla y Marco Romero la interpretó: ¿cuál fue el resultado?

Mujer advierte sobre los peligros de dormir con mascotas en la cama

El Comercio

El inesperado comentario que recibió una mujer en su primera cita con un hombre

El Comercio

El hombre que ganó $2,5 millones en la lotería gracias a un truco que vio en YouTube

El Comercio

Un fontanero advierte: este es el alimento que nunca deberías arrojar por el fregadero

El Comercio

La reacción de una madre al ver que solo una de sus gemelas fue invitada a una fiesta de cumpleaños

El Comercio

Influencer robó en Target y fue arrestada por video que ella misma publicó en TikTok: ¿qué se sabe del caso?

El Comercio

Meta anunció Voicebox, una IA generadora de habla que crea voces nuevas en seis idiomas

Voicebox es una IA que puede generar audio a partir de texto y ayudar a editar contenido de sonido

¿Cómo funcionará Voicebox?

Un modelo multitareas

Uso de Inteligencia Artificial con responsabilidad

TAGS

Meta

IA

Inteligencia artificial

VIDEO RECOMENDADO

Contenido sugerido

Mujer advierte sobre los peligros de dormir con mascotas en la cama

El inesperado comentario que recibió una mujer en su primera cita con un hombre

El hombre que ganó $2,5 millones en la lotería gracias a un truco que vio en YouTube

Un fontanero advierte: este es el alimento que nunca deberías arrojar por el fregadero

La reacción de una madre al ver que solo una de sus gemelas fue invitada a una fiesta de cumpleaños

Influencer robó en Target y fue arrestada por video que ella misma publicó en TikTok: ¿qué se sabe del caso?

Inteligencia Artificial

Meta anunció Voicebox, una IA generadora de habla que crea voces nuevas en seis idiomas

Voicebox es una IA que puede generar audio a partir de texto y ayudar a editar contenido de sonido

¿Cómo funcionará Voicebox?

Un modelo multitareas

Uso de Inteligencia Artificial con responsabilidad

TAGS

Meta

IA

Inteligencia artificial

VIDEO RECOMENDADO

CONSULTA, DolarToday y Monitor Dólar hoy, 26 de noviembre: cotización del dólar en Venezuela

La última conversación: lo que Sheyla no sabía del policía asesino que la esperaba en Comas [CRÓNICA POLICIAL]

Presidente del Fondo Blanquiazul: “Voy a insistir para que Alianza recupere su aliancismo y retome el espíritu de campeón”

Contenido sugerido

Mujer advierte sobre los peligros de dormir con mascotas en la cama

El inesperado comentario que recibió una mujer en su primera cita con un hombre

El hombre que ganó $2,5 millones en la lotería gracias a un truco que vio en YouTube

Un fontanero advierte: este es el alimento que nunca deberías arrojar por el fregadero

La reacción de una madre al ver que solo una de sus gemelas fue invitada a una fiesta de cumpleaños

Influencer robó en Target y fue arrestada por video que ella misma publicó en TikTok: ¿qué se sabe del caso?