Appel à contribution de la communauté : sous-titrer des vidéos

Sous-titrer en occitan.

Vous pouvez aider le Congrès à construire la première reconnaissance vocale occitane en lui envoyant des vidéos en occitan sous-titrées en occitan.

Le projet ReVOc du Congrès permanent de la langue occitane a pour objectif de développer la première reconnaissance vocale pour l'occitan.

La reconnaissance vocale est l'outil qui permet aux ordinateurs de passer la voix à l'écrit. Elle est utilisée, par exemple, dans la transcription ou le sous-titrage automatique de vidéos, par les assistants personnels des téléphones...

Pour entraîner l'intelligence artificielle qui servira à développer la reconnaissance vocale, Le Congrès a besoin d'un très grand nombre de données modèles, c'est à dire des phrases enregistrées avec leurs transcriptions écrites.

Une manière d'aider Le Congrès à constituer ces données est d'aller enregistrer des phrases sur la plateforme dédiée ReVOc : contribuir.locongres.com/revoc.

Mais vous pouvez aussi envoyer des fichiers vidéos ou audios qui vous appartiennent avec leurs sous-titres (des sous-titres en occitan en graphie classique avec les informations temporelles) à l'adresse info@locongres.org, avec un mail qui indique que vous nous autorisez à les utiliser en interne pour entraîner l'intelligence artificielle (elles resteront privées et ne seront jamais rendues publiques sans votre accord).

C'est une bonne manière de faire d'une pierre deux coups : vous ajoutez des sous-titres en occitan à vos vidéos (c'est important par exemple sur les réseaux sociaux, car les gens y vont de plus en plus dans des moments où ils ne peuvent pas activer le son), et vous aidez le Congrès à construire des outils pour, plus tard, ajouter ces sous-titres automatiquement.

Envoyez au Congrès le fichier vidéo/audio avec les sous-titres occitans (s'il en existe également en français, cela nous intéresse aussi pour faire des corpus bilingues). Le Congrès les découpera phrase par phrase, les alignera avec leurs transcriptions et les utilisera pour construire la future reconnaissance vocale.

Si vous ne savez pas comment sous-titrer des vidéos, nous vous avons préparé une notice qui explique comment faire.