ERCVOX

Forum du CLiD
Nous sommes actuellement le 28 Mars 2024, 14:24

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 14 Fév 2011, 14:15 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
J.-L. Fossat (clee_erss/to eldor) 13/2/2011
CONTRIBUTION AUX PROPOSITIONS DE TRAITEMENT NUMERIQUE ET A l'ANALYSE A LONG TERME DE MATERIAUX OCCITANS 13/2/2011
PAROLE: ATLAS "ex machina"(vernaculaires)
PAROLE: CORPUS_BOURCIEZ "ex machina" (vernaculaires)
PAROLE: CORPUS_SACAZE "ex machina" (vernaculaires)
PAROLE: CORPUS_CLID communication horizontale et verticale multilingue
TEXTES: corpus juridique "ex machina" de vernaculaires en prose
LEXICOGRAPHIE NUMERIQUE: DICTIONNAIRES "ex machina"
CORPUS ICONOGRAPHIQUES "ex machina" (géolinguistique; ethnographie)
ARCHIVE SONONE NEMERIQUE "ex machina" (vernaculaires, occitan, etc.)
I.- PRINCIPES DE BASE
En résumé, on vise la minimisation des solutions logicielles (calcul, prévision, stockage, fouille de données, cartographie, iconographie, archive sonore numérique, cartomatique: logiciel libre: open sources; archive ouverte, non fermée ( à bon entendeur ...). Dans la mesure du possible, au vu des conditions de travail (ergonomie et coût des tâches), on s'efforce de se rapprocher de normes de travail des groupes opérant en contexte TGE_ADONIS (groupes de numérisation, archives ouvertes, BNF_dépôts de fonds, CROM).
II.- PLAN D'INTERROGATION DES DONNEES SONORES NUMERIQUES AVEC LE LOGICIEL OCCITON2_2010 (conception et réalisation A. Meqqori et Jean-Louis FOSSAT, ercvox)
Toutes les données sonores sont exportables en tant que fichiers/wav/mp3 en direction de toute opération TGE_ADONIS.
BILAN ET PROJET
1._-PHONETIQUE et PHONOLOGIE: DiaLang_PH
Il s'agit essentiellement de donner accès aux données de l'archive sonore numérique des fonds d'atlas linguistiques, couplés aux corpus de parole dialectale d'origine diverse (Grimalt, Alain Maille, fonds Arrous, fonds Besche-Commenge, fonds Romieu, fonds Decomps etc.) et aux fonds dictionnairiques numériques. L'accès aux données en contexte OCCITON2,2010 est effectué à partir d'un index multiple multi-champs. - indexation des entrées lexicales du dictionnaire français - indexation des entrées lexicales du dictionnaire dialectal - indexation par mots-clés du domaine: phonologie, prosodie, phonétique. - indexation du champ Sources juridiques citées.
2.- LEXIQUE: DiaLang/LEX
Il s'agit ici d'appliquer, par étapes, les logiciels déjà existants (ERSS Gaume, DiLang, Basilio Calderone (géométrie lexicale 2011]) aux données lexicales, avec une attention spéciale au traitement des dictionnaires électroniques existants: PALAY/ESTALENX entre bien d'autres; DiaLang_LEX_TESOC couplé à un logiciel PROX_DiaLang qui reste à créer (application géométrie lexicale vocabulaire pastoral Haute-Bigorre LNR-2010: voir mon compte-rendu)
3.- MORPHOLOGIE VERBALE ET CONJUGUEUR DiaLang/VERBE/morphologie
Il s'agit ici d'une part de réutiliser les données numériques de la morphologie verbale du gascon (structures locales), pour atteindre la structure globale du domaine occitan
4.- MORPHOSYNTAXE: PHRASE, CATEGORIES, CLASSES, APPROCHE PRONOMINALE: DiaLang/M-SYNTAXE/PROSODIE
Il s'agit de généraliser la méthode d'analyse mise en place par Jean SEGUY (ALG6, table de variables morphosyntaxiques par paquets) d'une part, d''autre part de réutiliser les dispositifs déjà existants de traitement des corpus de parole (ILF, LEXICO, ALCESTE, etc. entre autres outillages d'analyse non supervisée); et d'autre part d'utiliser des logiciels déjà opératifs au sein de CLEE_erss-Hatout/ groupe morphologie.
5.-GEOGRAPHIE LINGUISTIQUE ET GEOMETRIE DES AIRES
A court terme, il s'agit de généraliser à la morphosyntaxe la solution logicielle conçue par H. Casanova (UMS838, MSH, MdR) qui a donné lieu à trois volumes de cartes distributionnelles pour le gascon et ses structures locales dialectales, sans perspective de généralisation à court terme, dans les opérations d'analyse typologique programmables.
BILAN 2010 ANALYSE DISTRIBUR+TIONNELLE ET REPRESENTATION TYPOLOGIQUE
Volume 1 PHONETIQUE
VOLUME 2 PHONOLOGIE
VOLUME 3: MORPHOLOGIE VERBALE. A moyen terme, il s'agit de généraliser par étapes cette représentation à d''autres structures locales, par calcul de voisinage (PROX_DiaLang)
Référence: Basilio Calderone 2010 géométrie lexicale.
PROJET 2011 GEOMETRIE MORPHOSYNTAXIQUE MS3_PrCo
VOLUME4: cartographie distributionnelle de structures locales morphosyntaxiques. A long terme, sont réutilisables ici les solutions logicielles conçues et réalisées en géolinguistique des langues romanes (Salzbourg Hans Goebl; Atlas catalan (Barcelona, Valencia): atlas asturien (Uvièu): atlas roumain; atlas basque Bilbao/Bayona etc); couplées aux logiciels classiques de classification en mode exploratoire (CAH/CDH,ANACORR etc.)
III.- VALORISATION
1.- OCCITON2 2010 ercvox: atelier de développement (tâches d'analyse linguistique; tâches d'ingénierie, sur base de logiciels d'accès libre existants sur internet actuel)
2. Valorisation du Fonds Numérique Jean SEGUY (archive IEM/CROM/BNF avec TGE_ADONIS)
3. Valorisation de l'archive numérique antérieure des programmes du "CLiD": programme de numérisation exécuté par ercvox (JL Fossat, A. Meqqori) 2000-2010.
3.1 archive sonore numérique (achèvement de l'opération: fin 2011: 2 opérateurs)
3.2 archive visuelle numérique (achèvement de l'opération: 2012).
3.3 OCCITON2, 2010
OCCITON2, 2010 vise à créer des ateliers d'écoute par concepteurs-utilisateurs, accédant à la matière dialectale ATLAS, DICTIONNAIRES, GRAMMAIRES, PAROLE TRANSCRITE. Cette solution logicielle de grande robustesse, a été diffusée en 2010, à l'occasion du congrès international de Linguistique romane de Valencia.): sa robustesse en fait un outil didactique qui pourrait être appréciable dans l'action pédagogique de formation aux méthodes et de la gestion d'applications par ateliers étudiants transcripteurs, en apprentissage linguistique supervisé ou non.

IV.- DISCUSSION
DECISIONS (MIN)
RESSOURCES (MIN, TGE_ADONIS, ANR etc.)
Depuis 1996, les opérations de numérisation et analyse exécutées par l'opérateur ERCVOX ne sont pas à charge du budget Recherche des Services Publics

BIBLIOGRAPHIE
RID 2, 1978 Bologna, indebolimento consonantico [Giannelli e Savoia]
RID 2, 1988 Sobrero: compétence communicative
HABERMAS 1973, compétence communicative


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Bing [Bot] et 1 invité


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr