TERMINOLOGIE
NOMENCLATURE
HOMOGENEITE
POLYMORPHSME D
PLURILINGUISME
ANALYSE DES DONNEES
CARTE DE L'ATTRITION LEXICALE! IMPLANTATION DE X.F et X.DF
CORPUS DRDF PROTOTYPE URL8 INALF
ANALYSE DE DONNEES
CLASSIFICATION (CAHi CAHjLEX, ALCESTE, SICLA ADDAD, EDA
ENCODAGE
CARTE DE L'ATTRITION LEX
CARTE D'IMPLEMENTATION DE X.F X,DF
PROTOTYPAGE BASE DBASE3 ANALYSE RELATIONNELLE DE TYPE ATLAS LEXICAL (doc. thématique)
Re: LEXICOLOGIE OCCITANE ELECTRONIQUE
Envoyé par: FOSSAT J.-L. erss/DGLF 1995 (193.55.175.20)
Date: Samedi, 23 Octobre 1999, ˆ 5:39
En Réponse à: LEXICOLOGIE OCCITANE ELECTRONIQUE (Fossat Jean-Louis erss/clid/occitan)
TERMINOLOGIE DIALECTALE
1° de quelles données empiriques dispose-t-on? On dispose sur le site erss/clid/occitan, des données téléchargeables d'une opération de terminologie dialectale (INALF: URL8: CNRS 1980-1986) Lexiques BETAIL_VIANDES LIBELLE DES FICHIERS: DMRDH STOCKAGE: CD_ROM erss/clid (rapatriement du site hôte du CICT TOULOUSE)
DIFFUSION: site WWW/erss/clid/occitan (documents téléchargeables) et site séccurité
ercvox@free.fr ARCHOIVE OUVERTE OPEN SOURCE.
data empiriques localisés .
questionnaire terminologique multidomaines .
liste des localités .
liste des informateurs
liste des enquêteurs .
données date/lieu .
données CARNETS .
données SON ANALOGIQUE .
données CD_rom (son numérisé) .
liste des réponses . réponses graphiques . réponses phonétiques spontanées, provoquées par question .
données de contexte .
réponses extorquées (provoquées par stratagème)
La base a ainsi une architecture dite répartie.
PLAN DE TRAITEMENT
Au terme d'une analyse conduite par J. DENDIEN (ingénieur, bases de données FRANTEXT) et JL Fossat, Y. HAMON implémentait une base de données lexicale, destinée à être transférée sous un des standards commodes: ORACLE, FOXPRO, accès, couplée à EXCEL, STAT ITCF et à un cartographieur maison : appelé "ZZZ" trace de son auteur Zouheir SANDOUK (UPS3 et Damas Syrie c/o CAUBET UPS3.
OBJECTIF L'objectif était de remettre en question la problématique des types de réponses multilingue: les réponses dialectales étant négociées avec des réponses de français technique unifié, des réponses "répliquantes" du lexique dialectal arrangé en français régional; l'objectif était de traiter par la méthode géolinguistique, ces données empirique, à partir des requêtes à la base; et ceci, sur la base d'une hypothèse territoriale (polarisation des métropoles urbaines; polarisation sur les territoires ruraux organisés; position du lexique rural isolé). On recherche un modèle mathématique apte à rendre compte de la diffusion en réseaux sociaux de relations (MSS UTM2, MSH, CLLE-erss, CLID-erss).
RESULTATS
1° création des fichiers de DATA
2° réutilisation des data importés dans le logiciel ALCESTE
3° classification EDA, ADDAD (Michel Grosetti; Société Image; J. Vanpoucke; J. Horber etc.)
4° représentation cartographique de la dynamique territoriale; ce n'est pas la genèse des lexiques qui est ici visée, mais leur représentation en rapport avec une problématique du lexique rapporté aux fonctions sociales, en rapport a) avec la DIFFERENCIATION LEXICALE paramétrée, avec la VARIATION DE SYSTEME paramétrée. Ch. Zafar et Marc Peytavi avaient alors utilisé un logiciel cartographique de la faculté desd Sciences de Strasbourg, pour produire la première représentation cartographique de CLASSES_OBJETS TERRITORIALES SECANTES.
5° documentation lexicographique des bases DICTIONNAIRES TEXTO (stockés sur site CICT, rapatriés sur CD (données partielles parfois, compte tenu des conditions déplorables d'administration des bases, bases il faut le dire pionnières, en leur temps. . base DAO . base DAFR . base CARNE (castillan, catalan, galicien etc.) . base BRASIU (banc d'essai terminologie brésilienne) Sur cette base nous avons exposé en 1995, à l'issue d'une convention de recherche avec la DGLF, les principes de mise en place d'un ATLAS TERMINOLOGIQUE (TERMISTI 16, 1998).
On se représente souvent comme particuliers, mineurs, voire risibles, le
recueils de données lexicales concernant les domaines d'expérience NEGOCE BOUCHERIE ALIMENTATION CARNEE, prolongeant les domaines d'expérience AGRICULTURE, ELEVAGE, ZOOTECHNIE, PATHOLOGIE ANIMALE; mais il s'est trouvé des experts internationaux pour défendre ces orientations aussi importantes que celle de la constitution des bases de données LEX lexiques intellectuels européens MA, Renaissance, XVII, XVIII, période révolutionnaire et postrévolutionnaire.
Les documents partiels ERA 352 URL8 INALF dont on parle ici sont tous accessibles en tant que DATA (données empiriques disponibles; mais ceci est à peine le banc d'essai, au regard de ce qui reste à faire, de la numérisation de l'archive sonore (opération nouvelle amorcée dès 1998 : Conseil Régional de Midi-Pyrénées) aux opérations de traitement qui permettent de produire des résultats intéressants, interprétables.
6° On a d'autre part rassemblé une vaste littérature scientifique et technique du domaine ( au plan national FRA, et au plan international européen ITAL, ESP, etc.), qui témoigne de la genèse du domaine, de l'invasion du domaine des usages vernaculaires par le français scientifique et technique (histoire des terminologies des systèmes agraires et de développement au 19ème s/ textes édités; collections d'archives: documentation largement inédite, qui met en jeu les rapports entre LANGUES et INSTITUTIONS.
L'état d'avancement de ce chantier a permis la mise en place d'un chantier de traitement multimedia de la variation, par application à des collections de données plus générales (données dialectales d'atlas d'une part) et, d'autre part, a permis d'aborder la problématique du traitement de l'enquête dialectale conversationnelle (récits, conversations, production orale "naturelle" et "situationnelle"
DOCUMENTATION ELECTRONIQUE
Le dossier des DATA_origine DMRDH se compose _ de 7 liasses, qui contiennent les bordereaux de réponses de 152 témoins (réponses multilingues); les données saisies concernent, pour 152 témoiugnages les localités du sud-ouest gascon (Landes, Gironde, Lot-et-Garonne et partie du Gers.) _ des liasses de données intermédiaires VERIFIEES (travail de Y. HAMON, ingénieur CNRS, depuis décédé en 1998): fichiers de découpâge automatique . MOTS . PH Le principe du découpage automatique a été généralisé par le standard DRAWCARTE/ Ce standard est du domaine public et permet à tout utilisateur qui l'acquiert de traiter des applications de ce type.
Ce fut l'étape de banc d'essai, de création, de vérification, de développement et de préfiguration de ce qui pourrait, avec d'autres ressources, sur d'autres bases, donnier lieu à la création d'un SERVEUR LANGUES incluant la problématique des langues régionales, dont occitan, catalan.
Il fut mis un terme à cette expérience au sein de l'INALF sous la responsabilité nationale de M. Fr. Lautman. Mais les données restent en ARCHIVE OUVERTE, pour un plan FORMATION AUX METHODES DE TRAITEMENT, MODELISA1TION RESEAUX SOCIAUX, etc.