Programme LINGUATEC : enregistrement pour la synthèse vocale

Synthèse vocale

Dans le cadre de Linguatec, programme européen de développement des technologies pour les langues des Pyrénées (avec le soutien de la Communauté de Travail des Pyrénées/Comunidad de Trabajo de los Pirineos), le Congrès a enregistré une première voix test en gascon pour la synthèse vocale en occitan (technologie utilisée dans les GPS, transports publics, smartphones, etc.).

À la fin du mois de juin, après une semaine intensive de travail de Domenja Lekuona, qui nous prêta sa voix, de Philippe Boula de Mareüil du LIMSI, pour l'encadrement du traitement linguistique des données et des techniciens du Congrès, la synthèse vocale est entrée désormais dans sa phase de post-traitement des données, travail toujours suivi par les linguistes partenaires du Congrès.

Ce sont environ 7 heures de données linguistiques qui ont pu ainsi être enregistrées et qui, une fois le matériau audio et linguistique alignés, pourront passer la phase suivante de traitement par réseaux de neurones, technologie partagée avec l’institution partenaire Elhuyar, en charge de la langue basque. Un travail équivalent s’ensuivra bien vite pour la version languedocienne de la synthèse vocale en occitan. Un programme à suivre.