ERCVOX

Forum du CLiD
Nous sommes actuellement le 19 Avr 2024, 09:24

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 08 Oct 2007, 17:12 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
FONDS LINGUISTIQUE FRANCAIS NUMERISE

Envoyé par: FOSSAT Jean-Louis erss_clid UTM <fossat@univ-tlse2.fr> (mwall.univ-tlse2.fr)
Date: Lundi, 20 Décembre 1999, ˆ 10:59

Etat de l'art (données à rendre disponibles) à partir de méthodes d'alignement de l'ENONCE et du SIGNAL.
On rappelle que la collection créée et cataloguée constitue le FONDS LINGUISTIQUE à mettr een exploitation. On distingue deux classes de fonds accessibles
• FONDS MERIDIONAUX (CD-AUDIO et CD_ROM du français parlé à BAYONNE, par exemple); ce fonds peut exploiter des documents INA, des documents constitués par diverses équipes de recherche universitaire, avec distinction sur critères d'objectifs et critères juridiques; par priorité nous numérisons les fonds de FRANCAIS des informateurs bilingues interrogés en priorité pour leur connaissance de l'occitan (FONDS MASSAT 09 ARIEGE par exemple; Contrat DGLF 1999-2000 banc d'essai 1999 réalisé); ces fonds numérisés sont destinés à être déposés pour accès au grand public et aux publics en formation (collections de DVD indexés)
• FONDS FRANCE DIALECTALE CENTRE-OUEST, EST C'est ainsi que nous accordons priorité au fonds POITEVIN (français local, et ses formes dialectales corresppondantes): on voudra bien, si l'on veut évaluer la nature des données accessibles, se reporter sur notre SERVEUR INTERNET erss/clid/occitan au module SON (CATALOGUE des collections en voie de numérisation depuis 1999). Certains de ces fonds ont été translitérés antérieurement à 1986; nous distinguons toute translitération, si fine soit-elle, avec ou sans conventions de ponctuation (méthodes du groupe de Genève ROULET, MOECHLER etc.) des méthodes de transcription phonétique; dans la tradition anglosaxonne, on emploie le terme TRANSCRIBER et TRANSCRPTION pour les deux cas; notre pratique distingue les corpus translitérés et les corpus transcrits; un signal PATRAULT (texte translitéré) peut avoir sa graphie intermédiaire phonologisante; qui constitue ce que j'appelle le niveau de MIEJA GLANA /m'Etso gl'ano/
• FONDS ONOMASTICA Les textes des langues de France, translittérés ou transcrits nécessitent la constitution de DICTIONNAIRES DE PRONONCIATION DES NL (toponymes et Noms de personnes liées, au plan de l'onomastique). C'est pourquoi nous avons en priorité constitué le banc d'essai de dictionnaires de prononciation des NL (1) pour l'occitan (2) pour le français, à partir de la base de données IGN TOP 25, aux conditions juridiques et commerciales de son accessibilité. On voit ainsi que le SERVEUR INTERNET ERSS/clid/OCCITAN, a vocation à accueillir toutes sortes de données, concernant une situation linguistyique qui peut très largement déborder le domaine occitan, du fait même du couplage ancien et constant des domaines: linguistique romane; linguistique française; linguistique occitane; ceci ne signifiant pas que l'occitan soit la quatrième roue de la charrette LINGUISTIQUE FRANCAISE; c'est le mérite très ancien des opérations telles que TGLPF (Trésor général des Langues et Parlers de France (P. Imbs, B. Quemada, Robert Martin, puis enfin Bernard Cerquiglini) que d'avoir attiré l'attention sur la nécessité de constituer l'archive sonore des langues de France (fonds Ferdinand BRUNOT :BnF, INATHEQUE); j'ai personnellement, sur ce point l'attitude constante de respect des outils légués par les prédécesseurs; et c'est à ce titre, qu'avec diverses équipes j'ai constitué des fonds français que le CNRS a jugés dignes de rentrer dans les bibliothèques de fonds français sonores inventoriés, transmissibles, accessibles: il s'en faut que l'accès à de telles ressources n'intéressent que la seule caste des Linguistes, la caste des savants des SHS; leur numérisation est un moyen d'inventer de nouvelles voies de restitution des savoirs, principe qui fut un des très vieux principes de la déontologie ethnolinguistique à Toulouse, dès les années 60. Malheureusement, cette urgence est encore mal comprise, ce qui explique l'inorganiosation actuelle des tâches, ou leur exécution dans une ambiance de bricolage; chaque génération de petits débrouillards ajoutant qui sa carte sonore, qui son logiciel audiomedia, qui son graveur etc. sans qu'un système collectif dans le Service Public se préoccupe vraiment avec sérieux de cet aspect très sérieux de l'accès pour extraction à ce type d'information; parmi les deux alertes (en termes d'état d'urgence): (1) NUMERISATION des enquêtes anciennes (fonds) et constitution de nouveaux fonds (2) saisie des données, les deux opérations étant àporésent couplées, en montage parallèle, et non séparées (3) on sait que notre SERVEUR par ailleurs abrite diverses collections iconographiques (IMAGE) qui représentent parfois les conditions mêmes de production de la parole: parole de CONTEURS, DE CONTEUSES, en actes et en action; produire les données hors support image est procéder par omission d'une partie importante de l'information vocale; ces voix ont une présence. Fort heureusement, le niveau associatif (TALVERA, par exemple, ALPES DE LUMIERE, entre autres exemples) s'est puisamment organisé sans attendre souvent l'assistance des Ressources Publiques, qui sont venues APRES.


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 2 invité(s)


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr