BaTelÒc

BaTelÒc

Lo laboratòri CLLE-ERSS de l'Universitat Tolosa-Joan Jaurès ven de metre en linha BaTelÒc, una basa textuala en lenga occitana qu'amassa d'òbras escrichas del sègle XIX a l'ora d'ara.

Aquel còrpus es la resulta d'annadas de trabalh. Recampa d'òbras de mai d'un genre (roman, teatre, poesia, conte, premsa...) e aculhís la variacion grafica e dialectala. Los tèxtes son encodats segon los formats estandard de constitucion e de difusion de còrpus (format XML, nòrma TEI P5).

L'accès a aquelas donadas es essencial pels estudis lingüistics, car son necessàrias per bastir un diccionari general de la lenga occitana, per las recèrcas en literatura, en sciéncias umanas, en didactica e per l'ensenhament de la lenga.

BaTelÒc a pas per tòca de prepausar un còrpus de referéncia de l'occitan, mas de fornir als utilizaires un ensemble de tèxtes pro larg per que cadun i pòsca seleccionar los que li permetràn de se bastir son còrpus de trabalh. Prepausa una interfàcia de consultacion amb un motor de recèrca.

Pel moment, la basa conten 95 tèxtes (3,37 milions de mots) de 49 autors diferents. Serà enriquida regularament.