ERCVOX

Forum du CLiD
Nous sommes actuellement le 28 Mars 2024, 13:58

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 11 Oct 2007, 10:46 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
DONNEES INITIALES
DONNEES NUMERIQUES DERIVEES
DONNEES SPATIALISEES
HISTIORIQUE
ETAT DES LIEUX
OPERATIONS NOUVELLES



ATLAS LEXICAL OCCITAN: post NALF(60-00)

Envoyé par: FOSSAT JL ERSS MSH_mdr <fossat@univ-tlse2.fr> (212.83.190.226)
Date: Vendredi, 23 Novembre 2001, ˆ 2:47

L'atlas occitan lexical post_NAL D R F DRF a pour ORIGINE les enquêtes lexicales conduites par ERA 352 CNRS (archive sonore, archive visuelle 1960-1978) et traitées dans le cadre des activités d'un laboratoire propre du CNRS (LP 6862 URL8 CNRS ( 1978-1986).
Les caractéristiques d'organisation de l'accès à ces données sont ici rappelées, conformément à une analyse du problème conduite par J. DENDIEN(INALF, HAMON INALF et JLFOSSAT URL8 INALF, ENSICA JUNIOR ENTREPRISE PROTOTYPE 4D, ECOLIA UPS Prototype DBASE3:
COLONNE 001 N° INFORMATEUR par rapport à COLONNE 2
COLONNE 2 ENQUETEUR
COLONNE 3 DATE
COLONNE 5 N° LOCALITE
COLONNE 6 NOM DE LOCALITE: les colonnes 001 à 006 INFORMANT SUR LA RELATION INFORMATEUR/LOCALITE / ENQUETEUR.# COLONNE 7
COLONNE 7 N° QUESTION de QUESTIONNAIRE SPECIFIQUE (domaine, thésaurus) exemple 081 [40BIS DATAORIGINE] par référence à DATA de fichier électronique libelle RENS_Q//rens_i (informateurs et RENS_l localités pour le questionnaire spécifique ici présenté; le tout donnant lieu à FONDS_K fonds de cartes pour les localités pour R1 (référentiel Gascogne) et R2 Référenciel domaine languedocien ( présentés en REUNION): ici finit la zone INFORMATION DE STRUCTURATION EXTERNE et commence la zone DATA# COLONNE 8
COLONNE 8: INFORMATION LEXICALE en transcription phonétique /lu gul'a /
COLONNE 9 INFORMATION GRAMMATICALE DE DICTIONNAIRE (LEMME, NORME (exemple GOLAR) COLONNE 010 ENCOPDAGE GRAMMATICAL [ 011MSG.D] interprété à partir d'une LEGENDE D'ENCODAGE: ici se clôture le fichier des REPONSES SPONTANEES fournies par un INFORMATEUR# cet informateur est alors soumis à des testts de CONTROLE et les données dites de CONTROLE sont portées dans deux colonnes supplémentaires formant le fichier de contrôle (acceptation, rejet, degré d'acceptation, degré de rejet) formant les colonnes 11 et 12 # COLONNE 13
COLONNE 13: INDICATION CONTEXTUELLE: l'informateur a produit la donnée dans un CONTEXTE donné, facultatif: EXEMPLE < golar se dit pour le porc: certains font le GOLAR en CARBOADA GRASSA> # COLONNE 14 ZONE DE COMMENTAIRE DE LA REDACTION (zone ouverte), tous les autres champs constituant des champs fermés: EXEMPLE DE COMMENTAIRE << la relation entre GOLAR.D (information 1) et l'information2 CARBOADA GRASSA.D, s'établit en termes de pratique, dans un champ d'expérience donné le terme B spécifiant la signification par identification d'un CARACTERE dans un couple GRAS/MAIGRE; autrement dit, dans les pratiques (1) une première solution est d'utiliser les viandes du goula pour le boudin ; une seconde solution est de l'utiliser comme base d'une pièce classée en termes de salaisons; et cette discrimination peut donner lieu à une carte des pièces de salaisons, qui présente au moins un intérêt technique en termes de gradient d'utilisation des pièces dans la géographie alimentaire traditionnalle V. Claude THOUVENOT.- Géographie des comportements alimentaires (FRANCE_EST)>> .
Ces fichiers ont été saisis, puis portés en base de données de type relationnel sous DBASE3, pour donner lieu à traitement, requêtes de type SQL (langage de requêtes généralisé: bases ACCES, DBASE, 4D SQL etc.); la base de renseignements ainsi constituée est destinée à un traitement statistique (le prototype des années 86 prévoyait alors l'utilisation de STATITCF: la dernière étape consistait alors à produire une classification des REPONSES LEXICALES, en couplant à STAT_ITCF un outif de CARTOGRAPHIE DES CLASSES DE REPONSES LEXICALES, en termes de MULTIMESURE: cet outil CERTE est libellé CARTE"Z" : il a été conçu, séparément, par ZOUHEIR SANDOUK, qui l'a couplé à STATITCF, dans une architecture globale conçue par JL FOSSAT (URL8 INaLF) et Mounir KRIAA (alors membre de la Junior Entreprise de l'Université Paul Sabatier, sous la direction du professeur GUY GOURDERES, membre de l'équipe de recherche de l'IRIT Reconnaissance de la Parole, alors dirigée par le Pr. Guy PERENNOU.
La nécessité de transférer l'archive de travail (mémoire de laboratoire) de la mdr sinistrée au site ERCV (association ERCV 24 bis chemin de Cantalauseta), en décembre 2001) nous permet de reposer la question de la réuyilisation de ces jeux de données, de l'extension de la saisie, de la création des fichiers sonores digitalisés correspondants, ainsi que des ressources réelles ressources dans le réel affectées à cette partie de l'opération de la dialectologie, moment de l'histoire banale, triviale, de la dialectologie à Toulouse.
Nous pensons que cette information appelle plusieurs analyses, plusieurs types de questions, plusieurs types de réponses, le silence constituant parfois une réponse structurante.
On notera in fine que le premier jeu de données saisies donna lieu à une classification des REPONSES LEXICALES par ALCESTE (CAH et ANACOR); et que les résultats cartographiques furent alors possibles dès 1986 par utilisation du logiciel de CARTOGRAPHIE AUTOMATISEE du Pr. MALLET STRASBOURG, connu sous le nom de CARTOLAB: ce contrat fut exécuté et achevé en 1986 par SOCIETE IMAGE, TOULOUSE (M. Choeb ZAFAR: Rapport de clôture du programme): le prototype était achevé en tant que prototype.
L'intérêt de ces données était d'établir le poids des réponses dialectales, eu regard des réponses non dialectales, mais françaises, complémentaires, chez des informateurs tous bilingues (bilinguisme avec diglossie, en territoire urbain et territoiure rural) Ces données anciennes sont réutilisables en tant que jeux de données électroniques (fichiers électroniques récupérables).
On notera enfin que J. DENDIEN et Y. HAMON (ce dernier décédé) avaient alors organisé les sous-ensembles des fichiers de la BASE, qui fut clôturée, dès lors que le CNRS clôturait le programme de l'URL8 de l'INalf (CNRS) REF RAPPORT DE CLOTURE URL8 INALFF 2 VOLUMES, déposé BU, BM, BnF DEPOT LEGAL (collection DARSLM Documents et Archives pour la Recherche Sociolinguistique Méridionale): un programme de terminologie conduit à initiative de la DGLF permit dans les années 1996-1998 de présenter à nouveau ce type de données et d'en souligner l'intérêt en rapport avec des propositions de MESURE DE L'IMPLANTATION (C. Langard, Mme. RODRIGUEZ, principalement et JL Fossat, TERMISTI)


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 2 invité(s)


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr