Lettre de liaison :

Diagnostic de l'état du développement numérique occitan

La première étape de l'étude consistait à réaliser un diagnostic de l'état du numérique occitan. Ce dernier a servi de base à la définition et à la priorisation des besoins pour le calendrier de réalisation.

Inventaire des ressources et des outils numériques occitans

Pour avoir une vision la plus large possible, un inventaire de tous les outils et ressources numériques connus a été dressé.

 

Synthèse de l'inventaire

Ressources linguistiques
Recensées
Utilisables en informatique*
 
Corpus monolingues de textes
27
2
 
Corpus monolingues de parole
28
0
 
Corpus parallèles
1
1
 
Corpus multimédias e multimodaux
24
0
 
Lexiques
73
8
 
Bases terminologiques
21
2
 
Tesauri, Wordnets, ontologies
1
1
 
Toponymie
3
3
 
Grammaires, modèles de langage
30
0
 
Outils de technologie du langage
Recensés
 
 
Reconnaissance de l'écriture
0
 
 
Reconnaissance de la parole
0
 
 
Synthèse vocale
0
 
 
Analyse grammaticale
6
 
 
Analyse sémantique
0
 
 
Génération de texte
0
 
 
Traduction automatique
2
 
 
Recherche et extraction d'information
0
 
 
Autres outils
Recensés
 
 
Logiciels disponibles en occitan
6
 
 
Outils numériques pour apprendre l'occitan
4
 
 


* Les ressources linguistiques ont été séparées en deux catégories : celles qui sont utilisables directement pour un usage informatique et celles qui nécessitent un traitement plus ou moins lourd pour pouvoir être utilisées pour créer des outils.

Conclusions

Il existe peu d'outils de technologie de la langue. Les ressources recensées sont plus nombreuses, mais peu réutilisables (corpus oraux non transcrits, dictionnaires souvent anciens ou pas OCRisés, grammaires destinées à une utilisation pédagogique et pas informatique, question de la validité et de la qualité linguistique pour plusieurs documents...). Il faudrait donc créer les ressources linguistiques de base avant de pouvoir développer des outils.

Expériences pour les autres langues

Dans le cadre de l'étude, quatre experts internationaux ont partagé leur expérience :

  • Langue basque : Xavier Artola (Ixa, Université du Pays Basque) ;
  • Langue bretonne : Olier Ar Mogn (Office public de la langue bretonne) ;
  • Langue catalane : Asunción Moreno (TALP, Université Polytechnique de Catalogne) ;
  • Langue galloise : Francis M. Tyers (Norgga Árktalaš Universitehta).

Pour la langue occitane, les intervenants en ont tiré quatre lignes directrices :

  • Importance de bien planifier et de faire les choses dans l'ordre ;
  • Il faut développer aussi bien les ressources que les outils ;
  • Intérêt de la coopération pour améliorer l'efficacité ;
  • Importance des licences libres pour pouvoir partager les développements.

Voir aussi :