Google incorporó 110 nuevos idiomas a su servicio de traducción, Google Translate, utilizando su modelo de inteligencia artificial PaLM 2. Esta expansión es la más grande realizada hasta la fecha en la plataforma y permitirá a más de 614 millones de personas acceder a traducciones en su lengua materna, especialmente al dar acceso a lenguas indígenas y dialectos casi extintos.
La tecnología usada para esta expansión ha sido implementada desde 2022, aunque en ese momento se añadieron apenas 24 idiomas usando el sistema Zero-Shot Machine Translation, un modelo de aprendizaje automático que puede traducir a un nuevo idioma sin haber visto ejemplos previos. Pero con la reciente ampliación, el objetivo de la plataforma es llegar a los 1.000 idiomas, con el objetivo de respaldar las lenguas más habladas en todo el planeta.
La clave de esta expansión reside en el modelo de lenguaje grande PaLM 2
Una IA que permite a Google Translate aprender nuevos idiomas de manera más eficiente, especialmente aquellos que están estrechamente relacionados entre sí. Este modelo ha sido fundamental para lograr la inclusión de 110 nuevos idiomas en el traductor, superando todas las expansiones anteriores.
PaLM 2 funciona utilizando técnicas de aprendizaje automático y redes neuronales profundas para analizar y comprender las estructuras y reglas de los idiomas. A través de enormes cantidades de datos lingüísticos y ejemplos de traducción, el modelo puede captar patrones y relaciones entre palabras y frases en diferentes lenguas.
Esto le permite generar traducciones precisas y coherentes incluso en idiomas que no han sido extensamente documentados o digitalizados
Ejemplos de nuevos idiomas en Google Translate
- Afar: un idioma tonal hablado en Djibouti, Eritrea y Etiopía. Afar destaca por haber recibido la mayor cantidad de contribuciones comunitarias voluntarias.
- Cantonés: uno de los idiomas más solicitados para Google Translate. Su escritura a menudo se superpone con el mandarín, lo que presenta desafíos únicos para la recopilación de datos y el entrenamiento de modelos.
- Manx: la lengua celta de la Isla de Man, que casi se extinguió con la muerte de su último hablante nativo en 1974. Gracias a un movimiento de revitalización a nivel de la isla, ahora cuenta con miles de hablantes.
- Nko: una forma estandarizada de las lenguas mandingas de África occidental, unificando muchos dialectos en un idioma común.
- Punjabi (Shahmukhi): la variante del punjabi escrita en escritura perso-arábiga, siendo el idioma más hablado en Pakistán.
- Tamazight (Amazigh): una lengua bereber hablada en el norte de África, escrita tanto en alfabeto latino como en tifinagh, ambos soportados por Google Translate.
- Tok Pisin: una lengua franca de Papúa Nueva Guinea basada en el inglés. Los hablantes de inglés pueden intentar traducir al tok pisin y posiblemente entenderán el significado.
Fuente: Infobae.
Te puede interesar ⮕ Spotify trae de vuelta una función gratuita que miles de usuarios extrañaban