Google vient d'intégrer 110 langues nouvelles dans son traducteur Translate, dont l'occitan.
Après ChatGPT, MiNT Machine translation (un moteur de traduction hébergé par la fondation Wikimedia), il s’agit d’un nouveau système de traduction avec des modèles neuronaux qui intègre l'occitan.
L'intelligence artificielle et la collecte massive de données (lexiques, textes) depuis Internet ont permis le développement de cet outil de pointe : en langue d'entrée il a une bonne reconnaissance de la diversité de l'occitan et il propose en sortie un occitan languedocien de façon générale.
Avec le nombre incroyable de paires de langues proposées, ce sont des outils complémentaires de Revirada : le traducteur du Congrès, développé avec un système de règles, traite quant à lui plus la qualité et la cohérence linguistique et aussi la diversité en langue de sortie (variétés languedocien, gascon et demain aranais, limousin, etc.).
Lo Congrès, qui pilote la feuille de route de développement numérique de l'occitan, veille à produire des ressources et outil avec l’accès et les droits les plus ouverts possibles pour en assurer la diffusion la plus large.
Nous ne pouvons que nous réjouir de voir des entreprises internationales comme Google prendre compte désormais l'occitan. Nous espérons bientôt retrouver des technologies comme la synthèse et la reconnaissance vocale, et pourquoi pas des systèmes complets intégrés !