ERCVOX

Forum du CLiD
Nous sommes actuellement le 19 Avr 2024, 14:07

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 09 Oct 2007, 15:16 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
BASE DE TEXTES OCCITANS [DGLF_2000]

Envoyé par: FOSSAT (Jean-Louis) ERSS_CLID <fossat@univ-tlse2.fr> (mwall.univ-tlse2.fr)
Date: Lundi, 31 Janvier 2000, ˆ 11:17

BASE DE CONNAISSANCE EXPLOITANT LA PAROLE TRANSCRITE (TEXTES SONORES; ARCHIVE SONORE NUMERIQUE DIGI_CULT, HERITAGE CULTUREL)

1.- OBJECTIFS: TRAITEMENT DU PATRIMOINE LANGAGIER MONDIAL

• PATRIMOINE LANGAGIER ET ORALITE FONDATRICE: PHONOSYNTAXE ET CONTOURS PROSODIQUES L'objectif essentiel est la constitution, dans l'ATLAS PARLANT DES LANGUES DE FRANCE PAR REGIONS, de corpus numérisés de parole "provoquée". L'opération repose prioritairement sur la numérisation des fonds d'enregistrements analogiques antérieurs, catalogués, et sur le déclen,chement simultané d'une nouvelle campagne de recueil de données sonores en mode numérique (data_sony; panasonix; camescope sony/panasonic reliables à un ordinateur, à des fins descriptives et didactiques.
• PATRIMOINE LANGAGIER MONDIAL ET ORALITE TRANSCRITE ET ANNOTEE La parole ne devient exploitable que par acte d'ECRITURE, de TRANSCRIPTION; c'est à ce titre que se pose la rapport de l'ORAL à l'ECRIT, pour les Langues de France; langue occitane; parlers dits d'oïl etc. On vise essentiellement à indexer des documents sonores numérisés préalablement transcrits (TRANSCRIPTION 2000 DGLF)
• EXPERIMENTATION DU RAPPORT DE L'ORAL A L'ECRIT [programme THESOC 2000] A titre expérimental, avec les autorisations et collaborations exigibles, on prend appui sur des textes de l'ethnolittérature ayant déjà fait l'objet de publication universitaire, sur plan de financement notamment, (RCP Pays de Sault; littérature grise émanant du plan des mémoires, thèses d'université, d'EHESS etc.; collections émanant des actions ERA 352 CNRS, URL8 INALF avec collaboration sur convention inscrite: parla papèr! ), ou émanant du niveau associatif (M. Valière, La Marchoise, 86 Gençay, DRAC 86 F; Talvera; Programme associatif libellé ERCVOX_2000 d'association ERCV TOULOUSE), selon des conventions grapho-phonologisantes qui permettent de retrouver sous l'énoncé organisé, l'oralité (LE SON): deux cas de figure existent: 1° la base sonore n'existe pas (Base ARNAUDIN): la tâche est de la créer 2° la base sonore existe, quand des ethnographes, anthropologues, linguistes, ont constitué une archive sonore numérisée ou en cours de numérisation; la tâche est alors d'aligner le SIGNAL créé sur les énoncés fragmentés sur critères syntaxiques, pragmatiques, discursifs, selon des méthodes qui incluent l'ethnométhodologie de la communication en interaction sociale. Il fallait pour la mise en place de ce dispositif, créer ce que nous appelons des STATIONS D'ECOUTE : Fossat JL et Lamassoure Jean-Louis, Gèdre 65 F, 26-27 janvier 2000: 10 heures d'écoute de parole suivie. Ce rapport écrit-oral permet de définir un plan sécuritaire et de résoudre la question de l'insécurité langagière liée au non-enseignement de la langue.

2.- LES INSTRUCTIONS ET LE DISPOSITIF DE TRAITEMENT DES CORPUS OCCITANS

Instruction 1 OUTILS D'INDEXATION On s'inspirera le plus possible de • présentation HYPERBASE (opération particulière, avec livraison d'un PRODUIT): texte clickable de BRUNET
• PRESENTATION BASE PORTUGAIS (ancilla)
• présentation d'opération particulière DRAWCARTE SUR TEXTES par (CLICK): origine ERSS_CLID et Société IMAGE

- langues

- dialectes

- localités

- auteur

- genre

- responsable du recueil (ex. LO BOIER)

- carte des data Existants (click)

- DATES

- MCLES (DOMAINES, THESAURUS DE DOMAINE) ****************************************************** Instruction 2: TEXTES DISPONIBLES AU TELECHARGEMENT

- textes phonétiques transcrits (protocole atlas; protocole erss_clid etc.)

- textes graphiques du plan expérimental défini plus haut

- textes

- textes graphiques provoqués (protocole erss_clid d'alignement de l'énoncé écrit sur le signal); les corpus expérimentaux du programme 2000 portent sur les fonds constitués par Bruno Besche, J-L. Fossat, Jean-Louis Massoure, Jean Séguy et Xavier Ravier

************************************************************ Instruction 3.- OUTILS DISPONIBLES POUR LA CONSTITUTION D'UNE BASE DE TEXTES (jusqu'à 20 MEGAOCTETS)

- au téléchargement

- en mode local (préciser): DRAWCARTE.BASE (application TEXTES) • INDEX disponibles • CONCORDANCES DISPONIBLES • FREQUENCES DISPONIBLES • ANNOTATION DISPONIBLE MORPHOLOGIE; GRAMMMAIRE disponible ************************************************************ Instruction N° 4.- DICTIONNAIRES DE PRONONCIATION DISPONIBLE (LISTES DE MOTS: EXEMPLIERS) • DICTIONNAIRES D' ETYMONS DISPONIBLES • SON/SIGNAL/TEXTE DISPONIBLE (sur catalogage des SONS)

- format

- durée

- qualité • Etudes disponibles se fondant sur analyse de TEXTE • importation de listes triées en direction de DICTIONNAIRE ELECTRONIQUE • RESULTAT D'EXTRACTION SUR BASE DE TEXTE SUR CRITERE PHONETIQUE, PHONOLOGIQUE, MORPHOLOGIQUE, SYNTAXIQUE, LEXICAL


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 1 invité


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr