Compartir

Microsoft tiene una de las herramientas de inteligencia artificial más avanzadas pero es un riesgo para todos, por lo que VALL-E 2 no llegará a ver la luz.

La avanzada tecnología es tan convincente que la empresa se niega a compartirla con el público, alegando “riesgos potenciales” de uso indebido. VALL-E 2, es un generador de texto a voz capaz de imitar una voz a partir de unos pocos segundos de audio.

Microsoft la entrena para reconocer conceptos sin proporcionarle previamente ningún ejemplo de esos conceptos, en un escenario denominado aprendizaje sin disparos. Además, es el primero de su clase en alcanzar la “paridad humana”, lo que significa que cumple o supera los estándares de semejanza humana.

VALL-E 2 la IA que no verá la luz por ser un riesgo para todos

De acuerdo con Microsoft Research, VALL-E 2 puede producir “un habla precisa y natural con la voz exacta del hablante original, comparable al rendimiento humano”. Además de frases cortas, puede sintetizar oraciones complejas.

Para ello, la IA aprovecha dos funciones llamadas: Repetition Aware Sampling y Grouped Code Modeling.

Repetition Aware Sampling se ocupa de los problemas que plantean los tokens repetitivos, es decir, las unidades de datos más pequeñas que puede procesar un modelo lingüístico, representadas aquí por palabras o partes de palabras.

Es decir, evita que se repitan sonidos o frases durante el proceso de descodificación, lo que ayuda a variar el discurso del sistema y hace que suene más natural.

Microsoft afirma que VALL-E 2 no se hará público en un futuro próximo, ya que lo considera un proyecto puramente de investigación y actualmente.

Actualmente no hay planes de incorporar VALL-E 2 a un producto ni de ampliar su acceso al público. Puede conllevar riesgos potenciales en el mal uso del modelo, como la suplantación de la identificación de voz o la suplantación de un hablante específico.

Microsoft afirma que las sospechas de uso indebido de la VALL-E 2 pueden denunciarse a través del sitio oficial.

El vishing, una combinación de voice (voz) y phishing (suplantación de identidad), es un tipo de ataque en el que los estafadores se hacen pasar por amigos, familiares u otras personas de confianza por teléfono.

Date una vuelta por Discord y no te pierdas las noticias en Google News.  Además, recuerda seguirnos en Instagram.