Lettre de liaison :

Sélectionnez votre langue

Diagnostic

o congrès de la langue occitane - développement numérique de l'occitan
o congrès de la langue occitane - développement numérique de l'occitan

La première étape de l'étude consistait à réaliser un diagnostic de l'état du numérique occitan. Ce dernier a servi de base à la définition et à la priorisation des besoins pour le calendrier de réalisation.

Inventaire des ressources et des outils numériques occitans

Voici la liste des ressources recensées lors de l'étude, leurs nombres et le nombre de celles utilisables en informatique.

Ressources linguistiques

  • Corpus monolingues de textes
    • Recensées : 27
    • Utilisables : 2
  • Corpus monolingues de la parole
    • Recensées : 28
    • Utilisables : 0
  • Corpus parallèles
    • Recensées : 1
    • Utilisables : 1
  • Corpus multimédias e multimodaux
    • Recensées : 24
    • Utilisables : 0
  • Lexiques
    • Recensées : 73
    • Utilisables : 8
  • Bases terminologiques
    • Recensées : 21
    • Utilisables : 2
  • Tesauri, Wordnets, ontologies
    • Recensées : 1
    • Utilisables : 1
  • Toponymie
    • Recensées : 3
    • Utilisables : 3
  • Grammaires, modèles de langage
    • Recensées : 30
    • Utilisables : 0

Outils de technologie du langage

  • Reconnaissance de l'écriture
    • Recensés : 0
  • Reconnaissance de la parole
    • Recensés : 0
  • Synthèse vocale
    • Recensés : 0
  • Analyse grammaticale
    • Recensés : 6
  • Analyse sémantique
    • Recensés : 0
  • Génération de texte
    • Recensés : 0
  • Traduction automatique
    • Recensées : 2
  • Recherche et extraction d'information
    • Recensés : 0

Autres outils

  • Logiciels disponibles en occitan
    • Recensés: 6
  • Outils numériques pour apprendre l'occitan
    • Recensés: 4

* Les ressources linguistiques ont été séparées en deux catégories : celles qui sont utilisables directement pour un usage informatique et celles qui nécessitent un traitement plus ou moins lourd pour pouvoir être utilisées pour créer des outils.

Conclusions

Il existe peu d'outils de technologie de la langue. Les ressources recensées sont plus nombreuses, mais peu réutilisables (corpus oraux non transcrits, dictionnaires souvent anciens ou pas OCRisés, grammaires destinées à une utilisation pédagogique et pas informatique, question de la validité et de la qualité linguistique pour plusieurs documents...). Il faudrait donc créer les ressources linguistiques de base avant de pouvoir développer des outils.

Expériences pour les autres langues

Dans le cadre de l'étude, quatre experts internationaux ont partagé leur expérience :

  • Langue basque : Xavier Artola (Ixa, Université du Pays Basque) ;
  • Langue bretonne : Olier Ar Mogn (Office public de la langue bretonne) ;
  • Langue catalane : Asunción Moreno (TALP, Université Polytechnique de Catalogne) ;
  • Langue galloise : Francis M. Tyers (Norgga Árktalaš Universitehta).

Pour la langue occitane, les intervenants en ont tiré quatre lignes directrices :

  • Importance de bien planifier et de faire les choses dans l'ordre ;
  • Il faut développer aussi bien les ressources que les outils ;
  • Intérêt de la coopération pour améliorer l'efficacité ;
  • Importance des licences libres pour pouvoir partager les développements.

En savoir plus

Présentation

Présentation par Gilbert Mercadier, Président du Congrès

Voir la page

Diagnostic

Diagnostic de l'état du développement numérique occitan

Voir la page

Feuille de route

Feuille de route du développement numérique de l'occitan

Voir la page