Le Congrès permanent de la langue occitane est porteur d’un programme d’action dans le cadre du Contrat de plan ETat-Région (CPER) 2021-2027 pour les régions Auvergne-Rhône-Alpes, Nouvelle-Aquitaine et Occitanie.
Il s’agit d’un projet d’infrastructure numérique dédiée à la langue occitane, permettant de créer, structurer et relier différentes ressources lexicographiques, textuelles et toponymiques autour d’une interface de consultation publique, d’un niveau d’excellence comparable à celui du Centre national des ressources textuelles et lexicales (CNRTL) pour la langue française. Lancé en 2024, le programme prévoit différents travaux, dont la rédaction du dictionnaire général informatisé de la langue occitane, la restauration de la toponymie occitane (en partenariat avec l’IGN) et le traitement massif des données au standard TAL (traitement automatique des langues).
2025 aura vu la montée en puissance du programme opérationnel, mobilisant expertise scientifique, innovation technologique et coopération étroite avec les collectivités, les institutions culturelles et les partenaires académiques.
Dans ce cadre, le Congrès a poursuivi le développement du Dictionnaire général informatisé de la langue occitane (DGILO), pierre angulaire de la future plateforme. L’équipe lexicographique a été renforcéeet désormais stabilisée autour de cinq lexicographes et d’une gestionnaire de données, sous la direction scientifique d’une commission du Conseil linguistique du Congrès. L’arrivée de deux nouveaux lexicographes a en effet permis à l’équipe de trouver un nouveau rythme de croisière, avec 2 805 articles créés à ce jour, et impulsé une nouvelle dynamique permettant désormais d’avoir une perspective de 17 000 articles en sortie de programme (2029).
De plus l’outillage numérique a été renforcée sur la période avec :
- Enrichissement du Cercador, moteur de recherche contextuelle au sein d’un corpus de plus de 1 000 oeuvres (romans, poésies, revues, oeuvres lexicographiques) enrichi en 2025 par la numérisation de de plus de 200 œuvres littéraires de référence couvrant l’ensemble des parlers d’oc, en partenariat avec le Cirdoc.
- Évolution de la plateforme TEI (l’outil de rédaction du DGILO), avec de nombreuses optimisations fonctionnelles permettant de faire gagner du temps à l’équipe de lexicographie ,
- Création de Freqlex, outil de fréquences lexicales fondé sur un corpus de 12,2 millions de mots.
Le Congrès a poursuivi en 2025 la mise en œuvre du Plan de restauration et de valorisation de la toponymie occitane, conduit en convention avec l’IGN pour lequel le Congrès est le référent pour l’analyse orthographique et la correction des toponymes d’origine occitane.
Notre toponymiste a pu traiter, sur 234 communes réparties sur trois régions (Auvergne-Rhône-Alpes, Nouvelle-Aquitaine et Occitanie), 15 584 microtoponymes ainsi que de nombreux hydronymes et odonymes.
L’année 2025 aura permis également l’enrichissement de la base bibliographique à 849 références, dont 171 nouvelles, le dépouillement systématique d’archives départementales, la structuration d’un inventaire thématique et géographique complet.
Le Congrès a répondu à plusieurs sollicitations émanant de collectivités, d’associations et de services régionaux afin de sensibiliser plus encore à l’importance de la toponymie en tant que patrimoine immatériel, à travers des conférences, ateliers pédagogiques et événements académiques.
Enfin le pôle informatique a posé les bases technologiques du futur topòc : cette grande base “mère” contiendra l’ensemble des informations toponymiques occitanes et qui sera interopérable avec les standards cartographiques et bases de données (Géoportail, Openstreetmap, Wikidata). Pour ce faire, a été engagé un travail sur la définition de format de données, qui sera en TEI-P5, un format XML déjà utilisé pour les données lexicographiques du Congrès, et le développement de programmes de conversion et d’extraction de données. Les toponymes de la zone occitanophone sur Openstreetmap ont donc ainsi été collectés et serviront de base de travail aux toponymistes.
Le Congrès poursuivra en 2026 la mise en œuvre de ces programmes structurants, en étroite collaboration avec ses partenaires institutionnels, scientifiques et territoriaux, afin de garantir la transmission, la visibilité et la reconnaissance de la langue occitane dans l’ensemble de son domaine linguistique.