puede traducir un centenar de idiomas
la empresa de Mark Zuckerberg fue noticia por el lanzamiento de un traductor de voz simultáneo. Funciona con Inteligencia artificial tenedores capaz de traducir cien idiomas. La revista ‘Nature’ publicó este avance tecnológico.
El modelo de inteligencia artificial generativa de Meta, SeamlessM4T, es capaz de traducir y transcribir automáticamente voz y texto en 101 idiomas de origen y hasta 36 idiomas de destino: genera texto traducido en 96 idiomas, pero sólo puede producir una traducción oral en 35, explica ‘Expansión’.
En agosto de 2023, la empresa ya había publicado una demostración y una primera versión del estudio. Esto representa un avance significativo en Sistemas de traducción más rápidos, fiables y transfronterizos..
Sin costuraM4T
SeamlessM4T es un modelo único que admite traducción de voz a voz (de 101 a 36 idiomas), traducción de voz a texto (de 101 a 96 idiomas), traducción de texto a voz (de 96 a 36 idiomas), traducción de texto a voz (de 96 a 36 idiomas), traducción del habla. traducción de texto (96 idiomas) y reconocimiento automático de voz (96 idiomas).
Fue desarrollado utilizando un nuevo corpus multimodal de traducciones de voz alineadas automáticamente y otros datos disponibles públicamente. SeamlessM4T es uno de los primeros sistemas multilingües que es capaz de traducir hacia y desde el inglés para voz y texto. Además, supera a los sistemas en cascada de próxima generación existentes, logrando puntuaciones de evaluación bilingüe suplente (BLEU) hasta un 8% y un 23% más altas, respectivamente, para tareas de texto a voz y texto a voz.
Además de la calidad, cuando se prueba su robustez, el sistema es prácticamente un 50% más resistente al ruido de fondo y variaciones de los hablantes en las tareas de conversión de texto a voz en comparación con sistemas de última generación anteriores. Se evaluó SEAMLESSM4T en busca de toxicidad general y sesgo de género para evaluar la seguridad traslacional. Para el primero, con dos estrategias añadidas de mitigación de la toxicidad que funcionan en el momento del entrenamiento o de la inferencia.
Los recursos utilizados para desarrollar este avance se pondrán a disposición del público para uso no comercial. Este modelo se considera un posible primer paso hacia la generalización de las aplicaciones de traducción automática simultánea.
Síguenos en nuestro canal whatsapp y no te pierdas las últimas noticias y actualizaciones de antena3noticias.com
Puedes consultar la fuente de este artículo aquí