SITE ERSS/CLID/OCCITAN_1999
Envoyé par: FOSSAT (Jean-Louis) erss_clid <fossat@univ-tlse2.fr> (mwall.univ-tlse2.fr)
Date: Vendredi, 3 Décembre 1999, ˆ 4:24
DEFINITON DU SITE
Le site est organisé autour du POLE (AXE) OCCITAN: LETTRES, LANGUES, LITTERATURE, ETHNOLITTERTURE, ETHNOGRAPHIE, lui-même orienté vers le pôle ROMAN (ETUDES ROMANES), cette terminologe regroupant les langues romanes européennes et plus spécialement les langues de l'Europe méridionale. Concrètement il vise àmettre à disposition des utilisateurs des RESSOURCES LANGAGIERES (LANGUAGE RESSOURCES) et des OUTILS (METHODES) pour les exploiter (opérations dites de TRAITEMENT)
Une place spéciale est accordée à la relation entre OCCITAN (langue, caractérisée par une GRAMMAIRE, un LEXIQUE-GRAMMAIRE) et la langue nationale de FRANCE (le français) dans la mesure oè fe français, dans ses caractéristiques, repose sur des caractères occitans; autrement dit ceci revient à positionner l'OCCITAN, par rapport à l'AXE LANGUES DE FRANCE. OBJECTIFS VISES
• conception, mise en place et maintenance de bases de données appelées ATLAS LINGUISTIQUES: deux bases ont été conçues, mises en place, mises en relation: THESOC (base des bases); et DRAWCARTE.BASE,méthode permettant à chaque utilisateur de concevoir, développer et maintenir sa propre base ATLAS, avec un ensemble d'outils de traitement.
• conception, mise en place et maintenance de bases de données textuelles (écrit) occitan Branche A occitan ancien; branche B occitan moderne et contemporain écrit); cette base en est à sa première étape CONSTITUTIVE; elle regroupe actuellement des textes écrits de l'ethnolittérature occitane moderne, écrite, éditée ou inédite; avec priorité à l'inédit, au non connu, non publié.
• conception, mise en place, maintenance de bases de données textuelles de textes phonétiques (testes transcrits) alignés sur leurs données de SIGNAL; il s'agit d'un programme scientifique amorcé avec la coopération de l'IRIT (Mme Obrecht, Mme. Parlangeau, PRAAAT, WINPITCH etc.); les textes occitans varient entre des textes formés de phrases courtes (occitan entre autres) et des textes phonétiques plus longs (occitans, romans), présentant des caractéristiques typologiques (genres), sémantiques, pragmatiques.
• conception, mise en place et développement de bases de SON (à partir d'une ARCHIVE SONORE DIGITALISEE [Fossat 1999] avec alignement sur les textes transcrits (alignement des ENONCES sur le SIGNAL) en rapport avec des méthodes d'indexation mmuldimedia (INDEXING MULTIMEDIA 1999 IRIT)
• conception, mise en place et développement d'interfaces d'interrogation, pour les bases de données ci-dessus énumérées; dans l'état actuel des choses on distinguera deux types d'applications
(1°) les applications qui utilisent le langage PERL sur site erss/clid/occitan (M. MEQQORI en est le WEBmaster);
2° les applications de BD conçues soit en DBASE3 (PC/UNIX), soit en BASE 4D (APPLE) réalisées avec la collaboration de la Société IMAGE TOULOUSE.
• conception, mise en place et développement d'une base de données dite DICTIONNAIRE (1) monolingue OCCITAN (2) prototypage de dictionnaire OCCITAN, CATALAN, ARAGONAIS (axe du plurilinguisme)
• Connexion des outils et données créés par le CLID (opération d'ERSS, UMR du CNRS et UTM) avec (1) un SERVEUR DE REGION (CONTRAT DE PLAN ETAT-REGION: SERVEUR ATLAS; SERVEUR D'ARCHIVES SONORES; SERVEUR DE TEXTES); nous avons déjà construit une METHODE (DRAWCARTE) qui permette de construire des passerelles entre les diverses bases de données, des passerelles entre différents outils de traitement (TACT, NATUREL, STABLEX, ALCESTE, HYPERBASE etc.)
• conception et mise en place de liens entre Formation, Recherche Linguistique, Sciences de l'Education, en matière de didactique de l'occitan langue vivante (proposition tripartite à la CEE, en 1997 (Rectorat, Région, Université) d'un support concret permettant de mettre en place (préfiguration, prototypage) des outils qui permetteent d'apprendre l'occitan langue vivante dans ses dimensions, grammaticele, lexicale, historique, sociologique et ethnologique.
A ce titre le CLID participe au sein d'ERSS à la nouvelle opération lancée par la DGLF OBSERVATOIRE DES PRATIQUES LANGEGIERES: LANGUES DE FRANCE. Un projet de linguistique informatique (exploitation du corpus de MASSAT) est en cours en 1999-2000: fonds sonores (grandes et belles voix de MASSAT; MASSAT dans les textes et les Lettres; Massat dans les ATLAS; MASSAT demain.
• OCCITAN ET LANGUES DE FRANCE: l'occitan mérite d'exister dans un vrai RESEAU qui relie au FRANCAIS les LANGUES DE FRANCE • L'OCCITAN n'existe pas sans un contexte INTERNATIONAL (France, Espagne, Italie, Catalogne, Andorra); on a ici privilégié de longue date l'établissement de GRANDS CORPORA PYRENEENS: GASCON, LANGUEDOCIEN, CATALAN, ANDORRAN, ARANAIS et BASQUE. PERSONNELS: il faut que les constucteurs des CENTRES DE RESSOURCES projetés sachent que ce qui a été fait dans ce domaine a été fait sans RESSOURCES SALARIALES; il faut aussi que l'on sache
(1°) que nous ne rêvons pas de poursuivre ce travail dans de telles conditions; seul le recrutement d'un INGENIEUR DU FAIT DE LANGUE OCCITAN est de nature à assurer les conditions de DEVELOPPEMENT.
(2°) On doit aussi savoir que les données rassemblées, les méthodes conçues et développées, ont pu l'être grâce aux ressources de QUATRE PROGRAMMES CONSECUTIFS DU CONSEIL REGIONAL DE MIDI-PYRENEES, assurant la continuité institutionnelle de la RECHERCHE OCCITANE.
(3°) on doit aussi savoir que le schéma des bases de données OCCITAN n'aurait jamais vu le jour sans la contribution décisive des TRAVAILLEURS INTELLECTUELS de l'INSTITUT NATIONAL DE LA LANGUE FRANCAISE Jacques DENDIEN, J.-L. ARTIS et surtout HAMON, ce dernier disparu.
(4°) Jamais les outils d'extraction des connaissance n'auraient vu le jour sans les outils forgés antérieurement à 1994 par Marc PEYTAVI, disparu en 1994.
C'est sur la base de ce programme de PROJET que nous avons obtenu, en 1994, notre rattachement à l'UMR ERSS Equipe de Recherche en Syntaxe et Sémantique.
5° pour poursuivre ce PROJET, on a créé un site parallèle:
ercvox@free.fr.
Mèstres, regents deras escòlas, joeneças, que mos hets nacèra: qu'avem besonh de vos toti, adara; deman que sirà tròp tard.