Mucho hemos platicado —y nos hemos sorprendido— brutal advances in Artificial Intelligence (AI) que nos encontramos en los últimos meses. Ya sean imágenes that ganan competitions of art, digital reports oh texting creators that our podrían quitar el trabajoestamos frente a momento de locura total en la tecnología que, por supuesto, también hold on riesgos.

Y así fue que, hablando de softwares that our dieron ñáñaras, queremos contarles de VALL-E.

Photo: Pixabay.

This new AI desarrollada por Microsoft agarró de sorpresa al mundo porque es capaz de imitar la voz de cualquier persona. ¿Lo more impressive? Solely necessary 3 segundos de audio para lograrlo.

VALL-E, the AI ​​that you imitated

This new adventure of Microsofts’lama VALL-E technically it is a software of TTS —text to speech— that, in summary, is the more advanced version of cualquier otro programa del estilo. Are you here evolution from the voice of Wazethe translator of Google o como aquella que se llamaba Loquendode los años mozos de YouTube.

Sin embargo, los advances se centran en que, en lugar de tener una voz predeterminada, necesita solo 3 segundos para poder imitar a cualquier persona.

Además, como si eso no fuera suficiente, es capaz de identify emociones y presentar grabaciones con la entonación correcta.

¿Quieres que oigan tu demo?  Spotify launches 'hub' of Radar for emerging artists
Pixabay

¿Como lo logra? Pues, sin meternos mucho en el enredo técnico, esta AI analiza as suena the persona dividing the audio into instant pequeños that llama ‘tokens’. Con eso a la mano, VALL-E Obtiene muestras de las ondas de sonido personales y utiliza su entrenamiento para ‘autocomplete’ —con esos mismos patrones— cualquier frase than pidas.

ya saben, usa AI para ‘imaginarse’ cómo sonaría la misma voz… pero con cualquier otra frase.

If the gustan las ciencias computacionales, acá the original dejamos el paper.

Volviendo al tema y para que se den una idea del tamaño de información con la que trabaja, VALL-E se entrenó con una base de datos de 60 thousand hours of audiocon más de 7 thousand different voices. The mayoría of ellos, sacados de audiolibros de dominio público, todos gratuitos.

Las pruebas de VALL-E

The presentation of this AI of Microsoft agarró al mundo de la tecnología por sorpresa. Between the emocion, sus creadores hicieron a site in el que puedes escuchar casi 50 pruebas de audio distintas.

Algunas toman solo 3 segundos de una plática y crean una frase completamente distinta.

intelligence-artificial-robots
Photo: Pixabay

Otras veces, toman una sola frase y VALL-E modify the audio para que la persona diga las cosas con tonos enojados, con sueño, divertidos o con asco. Está impressive.

El site de las pruebas lo pueden ENCONTRAR AQUÍ o acá abajo les compartimos a video of alguien navegándolo:

Ahora bien, los creadores de esta AI in Microsoft saben de las broncas éticas en los que se están metiendo.

VALL-E from Microsoft is blocked

The creators of VALL-E saben que la posibilidad de imitar cualquier voz, para que las personas —presidentes, políticos, where you are— digan cualquier otra cosa que no dijeron, es terribly worrying.

Hasta el momento, todas las voces que se usaron en las pruebas, lo hcieron con su consentmiento y el código de esta AI is encuentra blocked.

vall-e-microsoft-ia-audio-voz-imitar-persona-pruebas-video-escucha
Photo: Pixabay

A diferencia de otras IA que podemos probar nosotros mismos, como ChatGPT oh Midjourneythe case of VALL-E is important that se utilice con mucho —pero mucho— careful.

Assume that this is AI podría ayudar in educational applicationsin personal grabaciones to complete phrases que no se escucharon bien o en models de audio avanzados, pero habrá que llevársela con calmed down.

California18

Welcome to California18, your number one source for Breaking News from the World. We’re dedicated to giving you the very best of News.

Leave a Reply