2e prix pour le projet du datachallenge d'IA Pau

2e prix datachallenge IA Pau

Du 4 au 6 décembre, Lo Congrès a participé à IA Pau, un festival sur l’intelligence artificielle qui a lieu tous les ans à Pau, et qui s’est déroulé à distance cette année, par voie numérique.

Lo Congrès a tout d’abord participé à l’organisation en créant l’interface web de l’évènement. En effet, en plus du direct en vidéo, IA Pau a proposé des salons de pause en visioconferénce, des informations interactives sur l’évènement, un chat pour que les participants puissent commenter l’évènement...

Mais Lo Congrès a également fait partie des structures qui ont présenté un sujet au datachallenge. Il s’agit d’une compétition destinée aux étudiants. Des entreprises qui font des demandes d’outils et qui mettent à disposition des données pour les bâtir. Les étudiants ont deux jours pour développer quelque chose, et ceux qui ont travaillé le mieux reçoivent des prix.

Cette année, Lo Congrès leur a donné le défi de réaliser un PoS-tagger et un lemmatiseur en occitan. C’est un outil qui, pour chaque mot d’un texte, donne sa catégorie grammaticale et son lemme (l’infinitif pour les verbes, le masculin singulier pour les adjectifs...).

Deux équipes ont tenté l’aventure. L’une d’entre elles s’en est bien sorti, et a remporté à la fois le deuxième prix et le prix spécial environnement. L’équipe Buddhisteam a proposé Outilocc, un outil qui peut donner la catégorie grammaticale d’un mot avec 80% de précision, indiquer son lemme à 90% de précision, mais aussi prédire le mot suivant à un utilisateur qui tape du texte, et extraire des mots-clés d’un document.

L’outil avait la particularité de proposer un mode « économies d’énergie », avec des résultats moins bons mais un bilan carbone plus bas. L’outil méritera d’être davantage travaillé pour pouvoir être publié, mais ce qui est déjà développé est très prometteur.