Google Translate añade más de 100 nuevos idiomas gracias a la IA

Google Translate ha anunciado la incorporación de 110 nuevos idiomas a su plataforma, utilizando la inteligencia artificial para romper barreras lingüísticas y facilitar la conexión entre personas de todo el mundo. Esta es la mayor expansión de Google Translate hasta la fecha, y se ha logrado gracias al modelo de lenguaje grande PaLM 2.

Traducción para más de 614 millones de personas

Entre los nuevos idiomas añadidos se encuentran el cantonés, NKo y tamazight, que representan a más de 614 millones de hablantes, lo que equivale a aproximadamente el 8% de la población mundial. Esta expansión no solo incluye idiomas de gran relevancia mundial, como el cantonés con más de 100 millones de hablantes, sino también lenguas de pequeñas comunidades indígenas y algunas en proceso de revitalización.

Un cuarto de los nuevos idiomas provienen de África, destacando como la mayor expansión de lenguas africanas en la historia de Google Translate. Entre estos idiomas se incluyen Fon, Kikongo, Luo, Ga, Swati, Venda y Wolof.

Idiomas destacados

  • Afar: Hablado en Djibouti, Eritrea y Etiopía, Afar es un idioma tonal que recibió la mayor cantidad de contribuciones de la comunidad voluntaria.
  • Cantonés: Este idioma ha sido uno de los más solicitados en Google Translate. A pesar de las dificultades para encontrar datos y entrenar modelos debido a su superposición con el mandarín en la escritura, ahora está disponible.
  • Manx: El idioma celta de la Isla de Man, que casi se extinguió en 1974, ha visto un renacimiento gracias a un movimiento de revitalización.
  • NKo: Una forma estandarizada de los idiomas Manding de África Occidental, unifica muchos dialectos en un lenguaje común.
  • Panyabí (Shahmukhi): Variante del panyabí escrito en el alfabeto perso-arábigo, es el idioma más hablado en Pakistán.
  • Tamazight (Amazigh): Lengua bereber hablada en el norte de África, con varias escrituras como el alfabeto latino y Tifinagh, ambas soportadas por Google Translate.
  • Tok Pisin: Criollo basado en el inglés, es la lingua franca de Papúa Nueva Guinea. Los hablantes de inglés pueden entender fácilmente algunas traducciones.

Selección de variedades lingüísticas

La elección de los idiomas a añadir no es sencilla debido a las variaciones regionales, dialectos y diferentes estándares ortográficos. Google ha priorizado las variedades más comúnmente usadas de cada idioma. Por ejemplo, el idioma romaní, que tiene muchos dialectos en toda Europa, se ha representado principalmente en su variedad más usada en línea, el Vlax Romaní del sur, aunque también incluye elementos de otras variantes.

El modelo PaLM 2 ha sido crucial para aprender idiomas relacionados entre sí de manera más eficiente, como Awadhi y Marwadi (cercanos al hindi), y criollos franceses como el criollo de Seychelles y el criollo mauriciano.

Futuro de Google Translate

Google planea continuar ampliando su soporte para más variedades y convenciones ortográficas con la ayuda de lingüistas expertos y hablantes nativos. Esta expansión refleja el compromiso de Google de hacer que la tecnología sea accesible para todos, sin importar el idioma que hablen.


Esta noticia representa un hito significativo en la accesibilidad y conectividad global, reafirmando el papel de Google Translate como una herramienta esencial para la comunicación y comprensión intercultural.