ERCVOX

Forum du CLiD
Nous sommes actuellement le 28 Mars 2024, 19:50

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 7 messages ] 
Auteur Message
MessagePublié: 06 Oct 2007, 14:52 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
LEXICOLOGIE OCCITANE ELECTRONIQUE
DICTIONNAIRE DIAL ELECTRONIQUe
GASC
OCCITAN
ARAG
ASTUR
CORPUS TEXTES

Envoyé par: Fossat Jean-Louis erss/clid/occitan <fossat@univ-tlse2.fr> (193.55.175.20)
Date: Samedi, 23 Octobre 1999, ˆ 2:51

Il existe deux façons de travailler en lexicologie occitane, en fonction de la nature des matériaux documentaires utilisés . lexicologie de texte . lexicologie de dictionnaire, sur base lexicographiqueDate: Tue, 30 Sep 1997 Voici un exemple de mise en discussion de message reçu concernant l'accès à une base lexicale dialectale OCCITAN, sur SERVEUR

Référence Message envoye par : fossat@cict.fr a417-3.univ-tlse2.fr 193.55.172.158 Types de documents . communication de masse: conversations . descriptions techniques (maladie, médecine, description au médecin, à l'infirmière; accidents; pathologie; remèdes: soins) . dictionnaire multilingue

ENTREE NOTIONNELLE Ces remarques concerne la notion abcès
Traduction Francaise : abcès
Occitan : apostema
Grammaire : s. m. sg._aposternir
Forme des vocables : Prononciation :[(a)pust'Eme]
On enregistre ici les variables de prononciation: effacement de voyelle [a] extramétrique; réalisation (implémentation phonétique du TIMBRE de la VOYELLE ATONE FINALE, de timbre soit CLAIR, soit SOMBRE
IMAGE: insertion d'une image carte (K) illustrative de cette dernière problématique
Localite : non localisé, terminologie scientifique savante, adaptée: c'est un arrangement négocié d'un terme médical de formation savante (grec) NIVEAU TERMINOLOGIQUE Voici les remarques : On renvoie pour expliquer la présence d'une terminologie scientifique adaptée à notre Etude Terminologie de strates dialectales; strate D, strate R, strate F, strate DF; on y explique la présence dans le vocabulaire occitan de strates diachroniques que l'on peut considérer comme variantes synchroniques ou registres STRATE_D (fonds dialectal): la strate dialectale a négocié un arrangement avec la strate terminologique; le résultat est un aménagement phonologique plausible. STRATE_R fonds dit de français régional (substrat lexical) STRATE_DF strate de l'emprunt néologique avec utilisation de filtres d'adaptation à la phonétique dialectale (emprunt adapté) STRATE F constituant la strate terminologique de la terminologie de référence, diffusée (modèle à inondation) Historiquement la terminologie médicale savante (mots savants français) a pu être diffusée par les médécins et professeurs de l'école de médecine de Montpellier (version occitane de Chirurgie d'Albucassis; de la chirurgie de Mondeville etc...)
DICTIONNAIRE DE PRONONCIATIONS Toute la pratique de la dialectologie débouche sur la prise en compte de la pluralité raisonnable des normes ou variétés:la question de la représentation de la prononciation ne peut se satisfaire des solutions empiriques des dictionnaires bilingues français-espagnol du 19ème s.
SERVEUR : SERVEUR LEXICAL

Une des solutions est recherchée actuellement en direction du langage JAVA, pour les projets UNIX. IL existe à cette solution des alternatives. PERSONNEL (administrateur de SERVEUR, de SITE. On recherche des ingénieurs des langues (linguistes informaticiens) capables de nous concevoir, créer, administrer un tel SERVEUR, pour des données concernant les situations dialectales, les états dialectaux des langues..

INDEXATION DE ZONE PHONETIQUE
Avec notre standard DRAWCARTE.baseatlas, dictionnaire, texte, de quelque aplication qu'il s'agisse, nous disposons d'un moteur de requête puissant sur chaîne de caractères, qui repose sur l'indexation de tous les champs des bases de données.
SITE LEXICAL WEB Pour l'instant, quand vous accédez à DICTIONNAIRE, vous avez accès à une IMAGE non interrogeable (la zone d'annotation phonétique); l'application conduite sous environnement PERL est donc en retard par rapport à l'application réalisée avec le moteur de requêtes de la base DRAWCARTE. CREATION DU SON DIGITALISE Nous ne pouvons nous contenter de créer une zone de transcription phonétique "image" au format GIF, vu le volume de l'information à traiter; le champ PHONETIQUE est indexable; à un index de notation est associé un fichier phonétique appelé base_sons, en principe indépendant de la base de données. Le son créé ou importé, est alors exportable en direction de logiciels d'analyse acoustique du SON DIGITALISE.
Référence
site ERCVOX dictionnaire
OCCITAN GASCON (source ESTALENX)
ARAG source G. ROHLFS Pyrwörter CAT, ARAG GASC BASQUE

Réponses à ce message

* Re: LEXICOLOGIE OCCITANE ELECTRONIQUE (views: 23)
Archives Départementales 65 (193.55.175.20) -- Samedi, 23 Octobre 1999, ˆ 3:08
* Re: LEXICOLOGIE OCCITANE ELECTRONIQUE (views: 22)
KREMNITZ Georges AIEO VIENNE (193.55.175.20) -- Samedi, 23 Octobre 1999, ˆ 3:26
* Re: LEXICOLOGIE OCCITANE ELECTRONIQUE (views: 21)
ZAFAR Choeb Société IMAGE (193.55.175.20) -- Samedi, 23 Octobre 1999, ˆ 4:33
* Re: LEXICOLOGIE OCCITANE ELECTRONIQUE (views: 19)
THESOC unice http://ancilla.unice.fra (193.55.175.20) -- Samedi, 23 Octobre 1999, ˆ 4:51
* Re: LEXICOLOGIE OCCITANE ELECTRONIQUE (views: 18)
FOSSAT J.-L. erss/DGLF 1995 (193.55.175.20) -- Samedi, 23 Octobre 1999, ˆ 5:39
* Re: LEXICOLOGIE OCCITANE ELECTRONIQUE (views: 24)
CAMLONG (andré) UTM PORTUGAIS, MR (193.55.175.20) -- Lundi, 25 Octobre 1999, ˆ 10:26


Haut
 Profil Envoyer un message privé  
 
MessagePublié: 06 Oct 2007, 15:00 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
Re: LEXICOLOGIE OCCITANE ELECTRONIQUE

Envoyé par: Archives Départementales 65 <fossat@univ-tlse2.fr> (193.55.175.20)
Date: Samedi, 23 Octobre 1999, ˆ 3:08

En Réponse à: LEXICOLOGIE OCCITANE ELECTRONIQUE (Fossat Jean-Louis erss/clid/occitan)

LEXICOLOGIE ONOMASTIQUE ELECTRONIQUE
Une équipe du PARC DES PYRENNES vient d'éditer les résultats d'une enquête toponymique des Pyrénées centrales. Nous souhaitons poser ici la question de l'analyse lexicographique et lexicologique des toponymes. Nous faisons référence à un message ancien adressé par des chercheurs romanistes: Date: Mon, 20 Oct 1997 16:05:16 +0200 (MET DST) From: SERVEUR HTTPD (GALLOU) To: fossat@cict.fr Subject: update} Message envoye par : fossat@cict.fr 193.55.172.157 193.55.172.157

CONTENU Ces remarques concerne la notion abri (habitat), dans le lexique général accédé, puis dans l'utilisation qui en est faite (non plus la genèse, mais le lexique en rapport avec ses fonctions dans la communication sociale).
Traduction Francaise : abri
Occitan : tecoera, escota, cabana, espuga, abelha, devesa
Pour en savoir davantage, consultez le dictionnaire, à partir de la rubrique notionnelle ABRI Grammaire : NC===>NP GENRE: M? F? Forme des vocables dérivés en toponymie romane : ARTDEF+N Prononciation : l*.* Localite : pan-occitan, pan-roman (italien, cast, cat, arag. portugais, etc.) DONNEES EMPIRIQUES
1° de quelles données empiriques disposez-vous; comment sont-elles constituées en recueil; documents écrits, datation (archéologie toponymique)/enquête toponymique orale (V. SAUDINOS, 31 LARBOUST, OUEIL)
2° dans quel cadre théorique acceptable peut-on ou doit-on parler des données toponymiques? description, acquisition, apprentissage; interprétation. Voici les remarques : Soit une liste de données extraites de l'article ABRI: telle que NP : Latecouère, Lescoute, Lacabanne, Lacabanotte, Lespugue, Ladevèze, Lacouture, Lestage etc.
EXPLICATIONS Comment s'expliquent ces mécoupures?
REPONSE: on peut évoquer les suites nominales avec traces concrètes de non séparation non marquage des frontières de mots; comme cela est fréquent en ancien occitan (Acte Notarial Borssard, Tulle 19, 1482 ( Lemouzi 144, 1997), pp. 85-107 lautre part l'intratge lintrada Lespinatz lobradour laqueiria de lautre fenestra laffachadour lestacga l'esc(l)alier Las Bordas la prada la renda los pratz las vinhas La Boria lappoinctamen etc.
Comme on le voit, c'est un programme minimaliste très simple (fusion/non fusion; métamorphisme) qui régit la faculté d'agglutiner (agréger) qui caractérise ici le parler "tullaud".
Toutefois il conviendra de distinguer les applications faisant appel à des données en provenance d'archive historique et celles qui proviennent du traitement de l'archive sonore contemporaine. On distinguera plusieurs niveaux explicatifs (graphique, paléographique, philologique; morphologique.
DISPOSITIF EXPERIMENTAL: TOP25 C'est la base de données IGN au 25.000ème (plusieurs millions d'entrées).
CARTOGRAPHIE On préconise l'utilisation du logiciel ALLIANCE (SIT) sur poste de travail, sur SERVEUR UNIX, en collaboration avec le laboratoire GEODE (UTM), avec le groupe de recherche RECLUS (Université de Montpellier), dans le cadre du contrat de plan ETAT-REGION (Midi-Pyrénées), recherche transversale et multidisciplinaire. Cette solution n'a jamais été mise en oeuvre; Les propositions concernant Carte_données (Articque) n'ont jamais donné lieu à application; aucune utilisation d'ArcInfo, de MapInfo.


Haut
 Profil Envoyer un message privé  
 
MessagePublié: 06 Oct 2007, 15:05 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
Re: LEXICOLOGIE OCCITANE ELECTRONIQUE

Envoyé par: KREMNITZ Georges AIEO VIENNE <fossat@univ-tlse2.fr> (193.55.175.20)
Date: Samedi, 23 Octobre 1999, ˆ 3:26

En Réponse à: LEXICOLOGIE OCCITANE ELECTRONIQUE (Fossat Jean-Louis erss/clid/occitan)

Comment s'opère sur le SERVEUR, la JONCTION (mise en CORRESPONDANCE) de données DICTIONNAIRE ET DE DONNEES ATLAS (THESOC)

PREMIERS ELEMENTS en réponse à votre message à l'AIEO (Vienne 1999)

Référence de la proposition antérieure: Date: Fri, 13 Jun 1997 10:47:44 +0200 (MET DST) From: SERVEUR HTTPD (GALLOU) To: fossat@cict.fr Subject: SERVEUR OCCITAN: LEXIQUE

Message envoyé par : fossat@cict.fr a417-3.univ-tlse2.fr 193.55.172.158

Ces remarques concerne la notion abcès Traduction Francaise : abcès Occitan : postèma Grammaire : aucune idée précise Forme des vocables : ? apostèma/postèma Prononciation : ?pust'Emo Localite : gascon occidental Voici les remarques :
1° localisation: comment localiser l'information sur un fonds de carte ?
2° peut-on avoir des informations sur l'hésitation de genre? et ses facteurs? quels éléments facilitent l'interprétation comme N FEMININ? (Bibliographie M. Roché, erss)
3° comment se fait-il que postèma ait une forme apostèma?
4° Les exemples contiennent-ils indifféremment le mot postème et ses synonymes?
5° Comment se définit le mot ? abcès avec formation de pus ? comment valider cette définition?
REPONSE
1° accédez aux données ATLAS_lexique . soit par la base K (ICONOGRAPHIE: CARTES ALG: POSTEMA (abcès) . soit par la base lexicale atlas de THESOC, drawcarte, qui exploite les données précédentes. importez ces données comme illustrations dans la base DICTIONNAIRE (en utilisant le standard DRAWCARTE_base DICO, sur MAC, demain ( ???) sur machine UNIX (SERVEUR UNIX, peut-être ??????).
2° sémantique lexicale: on ne peut en parler qu'à partir de commentaires recueillis en cours d'enquête, de l'exemplier du dictionnaire, de l'extraction systématique (LEXTERM, Bourigault_erss) de termes scientifiques français dialectalisés, dans des textes d'archive écrite.
En approche logique, l'objet PUS habite un LIEU, caractérisé par la présence d'une manifestation visible (ABCES): avec/sans suppuration; d'autre part, il se peut qu'une notion de ce type, en rapport avec des facteurs psycholinguistiques, ait entraîné des dérivations métaphoriques ou figuratives difficiles à expliquer sans recours à une sémantique anthropologique: colobra, par exemple, "couleuvre"; que vient faire ici cet animal inoffensif, mais lié à des systèmes de croyances (Univers dits de croyance de Robert Martin) bien répertoriés par l'ethnographie? européenne, méridionale?


Haut
 Profil Envoyer un message privé  
 
MessagePublié: 07 Oct 2007, 09:18 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
ZAFAR Choeb Société IMAGE <zafar@cict.fr> (193.55.175.20)
Date: Samedi, 23 Octobre 1999, ˆ 4:33

En Réponse à: LEXICOLOGIE OCCITANE ELECTRONIQUE (Fossat Jean-Louis erss/clid/occitan)

GESTION DES CONTEXTES ET CONCORDANCES Vous ne dites pas comment sont gérées les concordances et contextes sur les sites DICTIONNAIRE.
GRAPHES
NAVIGATION DANS LA DOCUMENTATION
MARQUAGE DES LIENS, RELATIONS

Eléments de réponse Les concordances et contextes sont définis et gérés dans la perspective qui est celle des standards de traitement de type HYPERBASE (http://ancilla.unice.fr), ALCESTE, FRANTEXT.
En voici un exemple par rapport à l'exemmple sélectionné Date: Wed, 10 Sep 1997 16:45:10 +0200 (MET DST) From: SERVEUR HTTPD (GALLOU) To: fossat@cict.fr Subject: LEMMATISEUR OCCITAN Message envoye par : fossat@cict.fr a417-1.univ-tlse2.fr 193.55.172.157 CONCORDANCE ET CONTEXTE: ABCES

Ces remarques concernent la notion abcès (domaine d'expérience médecine dans la source dictionnaire idéologique FRA-GASC de François d'ESTALENX édité par EUS 2 Volumes, par JL Fossat, à demande de famille d'Estalenx Le Houga).
Traduction Francaise : abcès (domaine: régions)
Occitan : index nominal de 33 termes Grammaire : N Forme des vocables : 33 vocables nominaux en observation Prononciation : indifférente Localite : indifférente
Voici les remarques : On cherche à donner de chaque terme constituant une entrée graphique normée d'index de dictionnaire directeur une définition simple: qu'ai ua colòbra al dit

colòbra 1= ; colòbra
2 Beaucoup d'unités lexicales sont ici par approximation : verruga, hic, désignent à proprement parler des excroissances (creissents) et dans le domaine des excroissances la région sémantique des verrues, avec ou sans écoulement sanguin, avec ou sans écoulement purulent.
On a aussi recours à une catégorie relationnelle prédicative poirir, par ses dérivés: poiridís, poire, poirèr, poirumi, sans localisation précise, mais en conformité avec la grammaire du lexique du parler directeur; de même on a recourts à IF bàter, par batedís, postverbal.
La question est la suivante
1° comment constituer et interroger l'index des VOCABLES?
2° comment ajouter des textes et ou CONTEXTES, dotés de CONCORDANCES, de textes de définition simples (monolingues ou bilingues) dans le champ discussion, ils ne sont que proposés; comment accéder à la page html Contexte, modifier par ajout ou retranchement tel contexte?
ELEMENTS DE REPONSE Une réponse est donnée par le prototype OCCITAN / dictionnaire drawcarte sous 4D version 6.5, qui fonctionne en local, sur MAC (version accessible à tous utilisateurs à demande: zafar@cict.fr ou fossat@univ-tlse2.fr
PROTOTYPE DRAWCARTE_BASE DICTIONNAIRE
Un prototype a été réalisé par CLID-erss sur 3 BLOCS ou PAQUETS d'information non alphabétique mais notionnelle BLOCS A B C, en vue de normer le dictiponnaire-source de laa base. L'axe d'un dictionnaire normé est donné en termes de "lexique-grammaire", au sens de Maurice GROS (LADL): le prototype a donné lieu à une implémentation plus sommaire sur les sites W3 clid/erss et ervox@free.fr: faites travailler vos neurones à partir de là: il en restera quelques traces, solide.


Haut
 Profil Envoyer un message privé  
 
MessagePublié: 07 Oct 2007, 09:33 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
| Répondre | Lire le message précédent | Lire le message suivant |

Re: LEXICOLOGIE OCCITANE ELECTRONIQUE

Envoyé par: THESOC unice http://ancilla.unice.fra <dalbera@unice.fr> (193.55.175.20)
Date: Samedi, 23 Octobre 1999, ˆ 4:51

En Réponse à: LEXICOLOGIE OCCITANE ELECTRONIQUE (Fossat Jean-Louis erss/clid/occitan)

LA LOCALISATION DANS LE DICTIONNAIRE OCCITAN: principes et limites.
ELEMENTS DE REPONSE APPORTES La localisation dans le dictionnaire est une localisation "globale", non locale; elle est accédée par des clés de REGIONS LEXICALES (ADOUR, BAS ADOUR, CHALOSSE, GASC MARITIME, LOMAGNE; certeines de ces régions sont floues; ainsi MT MONTAGNE; ces clés locales enveloppantes sont indexées dans la base relationnelle 4D; cette localisation repose sur les indications des dictionnaires antérieurs utilisés comme SOURCE (PALAY, D'ESTALENX); il est rare que la localisation soit une localisation précise au sens géolinguistique site X (x,y), principe fondamental de la localisation des ATLAS NALF; cependant, voyez l'application G. ROHLFS, aragonais, catalan, basque, en cours d'immplémentation sur site W3 erss/clid et ercvox; pour le dictionnaire aragonais, on dispose d'une localisation précise par SITE: Anso, Echo, Urdues etc. et il est possible de dresser la carte sommaire d'un TRAIT, d'une propriété (par exemple la NON-SONORISATION des consonnes intervocaliques: foratata, foraton; forato.
Voici un exemple de réponse portant sur la localisation: la réponse optimale consiste à introduire une carte lexicale en provenance des collections scannées, ou de TESOC, dans l'article de dictionnaire (rubrique IMAGE); on aide alors l'utilisateur à ENTRER DANS LA LECTURE D'UNE CARTE (Fijalkow: Entrée en lecture); de plus si la carte est sonore, on aide l'utilisateur à entrer dans LA BASE DE SONS (dictionnaire de prononciations localisées).
EXEMPLE DISCUTE (banc d'essai, préfiguration, banc d'essai de SERVEUR LEXICAL) Date: Wed, 10 Sep 1997 12:07:54 +0200 (MET DST) From: SERVEUR HTTPD (GALLOU) To: fossat@cict.fr Subject: update} Message envoye par : fossat@cict.fr a417-1.univ-tlse2.fr 193.55.172.157 LIBELLE: ABCES: LOCALISATION DES REPONSES (données empiriques: base carnets NALF ALG Enq DAUZAT ALG 1 2 3; bandes Origine; CD_atlas.CARNETS exportés vers TESOC Q001-Q088 comme prototype: attention doc. initiale CARNETS n'est pas doc. dérivée CARTE!!!!!!!:; base de textes)

Ces remarques concernent la notion abcès (Médecine) Traduction Francaise : abcès (sorte)
Occitan : amas
Grammaire : postverbal sg. de amassar V G1 (voir CONJUGUEUR, si vous voulez vérifier la conjugaison, voire l'apprendre. Forme des vocables : amas
Prononciation : am'as prononcée (appeler fichier SON)
Localite : néant
// INSERER CARTE ALG (collection K_CARTE: libellé ABCES
Voici les remarques : Quand une localisation est néant, c'est que l'unité de travail est de type pan-occitan et appartient au niveau de langue appelé "directeur"; le terme est candidat alors non seulement à des usages en langue littéraire, mais aussi à des usages en langue réputée socialement inférieure, chez les linguistes qui pensent que le langage directeur est supérieur aux usages dans les formes locales de la société; on voudrait savoir les positions des utilisateurs sur cette proposition; si l'on se heurte au silence voulu ou inconscient des utilisateurs potentiels, où qu'ils soient, et qui qu'ils soient, c'est que nous n'avons pas encore su créer le SITE WWW digne de ce nom que mérite le projet OCCITAN.
THESOC a demandé des données empiriques et des analyses relatives à CAVECA "chauve-souris" et borrega, "brebis" (GDR de morphologie lexicale: certitudes historiques: *KK dans une base prélatine et _ICU (da,s le vocabulaire zootechnique des langues indo-européennes); ces deux entrées posent des problèmes dignes d'intérêt; on y répondra prochaînement, en faisant référence aux enseignements de J. Séguy, lexicologue et dialectologue, dans les années 50-60; il est pour cela indispensable de créer la base ARCHIVE NUMERIQUE de NALF ALG fonds JSEGUY et de la mettre à disposition en ARCHIVE OUVERTE, pour la faire travailler: Travaille, disait le père à ses disciples, à ses élèves, et surtout aux moins doués, ignorants agrégés de grammaire..


Haut
 Profil Envoyer un message privé  
 
MessagePublié: 07 Oct 2007, 09:53 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
TERMINOLOGIE
NOMENCLATURE
HOMOGENEITE
POLYMORPHSME D
PLURILINGUISME
ANALYSE DES DONNEES
CARTE DE L'ATTRITION LEXICALE! IMPLANTATION DE X.F et X.DF
CORPUS DRDF PROTOTYPE URL8 INALF
ANALYSE DE DONNEES
CLASSIFICATION (CAHi CAHjLEX, ALCESTE, SICLA ADDAD, EDA
ENCODAGE
CARTE DE L'ATTRITION LEX
CARTE D'IMPLEMENTATION DE X.F X,DF
PROTOTYPAGE BASE DBASE3 ANALYSE RELATIONNELLE DE TYPE ATLAS LEXICAL (doc. thématique)
Re: LEXICOLOGIE OCCITANE ELECTRONIQUE

Envoyé par: FOSSAT J.-L. erss/DGLF 1995 (193.55.175.20)
Date: Samedi, 23 Octobre 1999, ˆ 5:39

En Réponse à: LEXICOLOGIE OCCITANE ELECTRONIQUE (Fossat Jean-Louis erss/clid/occitan)

TERMINOLOGIE DIALECTALE
1° de quelles données empiriques dispose-t-on? On dispose sur le site erss/clid/occitan, des données téléchargeables d'une opération de terminologie dialectale (INALF: URL8: CNRS 1980-1986) Lexiques BETAIL_VIANDES LIBELLE DES FICHIERS: DMRDH STOCKAGE: CD_ROM erss/clid (rapatriement du site hôte du CICT TOULOUSE)
DIFFUSION: site WWW/erss/clid/occitan (documents téléchargeables) et site séccurité ercvox@free.fr ARCHOIVE OUVERTE OPEN SOURCE.
data empiriques localisés .
questionnaire terminologique multidomaines .
liste des localités .
liste des informateurs
liste des enquêteurs .
données date/lieu .
données CARNETS .
données SON ANALOGIQUE .
données CD_rom (son numérisé) .
liste des réponses . réponses graphiques . réponses phonétiques spontanées, provoquées par question .
données de contexte .
réponses extorquées (provoquées par stratagème)
La base a ainsi une architecture dite répartie.

PLAN DE TRAITEMENT
Au terme d'une analyse conduite par J. DENDIEN (ingénieur, bases de données FRANTEXT) et JL Fossat, Y. HAMON implémentait une base de données lexicale, destinée à être transférée sous un des standards commodes: ORACLE, FOXPRO, accès, couplée à EXCEL, STAT ITCF et à un cartographieur maison : appelé "ZZZ" trace de son auteur Zouheir SANDOUK (UPS3 et Damas Syrie c/o CAUBET UPS3.

OBJECTIF L'objectif était de remettre en question la problématique des types de réponses multilingue: les réponses dialectales étant négociées avec des réponses de français technique unifié, des réponses "répliquantes" du lexique dialectal arrangé en français régional; l'objectif était de traiter par la méthode géolinguistique, ces données empirique, à partir des requêtes à la base; et ceci, sur la base d'une hypothèse territoriale (polarisation des métropoles urbaines; polarisation sur les territoires ruraux organisés; position du lexique rural isolé). On recherche un modèle mathématique apte à rendre compte de la diffusion en réseaux sociaux de relations (MSS UTM2, MSH, CLLE-erss, CLID-erss).

RESULTATS
1° création des fichiers de DATA
2° réutilisation des data importés dans le logiciel ALCESTE
3° classification EDA, ADDAD (Michel Grosetti; Société Image; J. Vanpoucke; J. Horber etc.)
4° représentation cartographique de la dynamique territoriale; ce n'est pas la genèse des lexiques qui est ici visée, mais leur représentation en rapport avec une problématique du lexique rapporté aux fonctions sociales, en rapport a) avec la DIFFERENCIATION LEXICALE paramétrée, avec la VARIATION DE SYSTEME paramétrée. Ch. Zafar et Marc Peytavi avaient alors utilisé un logiciel cartographique de la faculté desd Sciences de Strasbourg, pour produire la première représentation cartographique de CLASSES_OBJETS TERRITORIALES SECANTES.
5° documentation lexicographique des bases DICTIONNAIRES TEXTO (stockés sur site CICT, rapatriés sur CD (données partielles parfois, compte tenu des conditions déplorables d'administration des bases, bases il faut le dire pionnières, en leur temps. . base DAO . base DAFR . base CARNE (castillan, catalan, galicien etc.) . base BRASIU (banc d'essai terminologie brésilienne) Sur cette base nous avons exposé en 1995, à l'issue d'une convention de recherche avec la DGLF, les principes de mise en place d'un ATLAS TERMINOLOGIQUE (TERMISTI 16, 1998).

On se représente souvent comme particuliers, mineurs, voire risibles, le
recueils de données lexicales concernant les domaines d'expérience NEGOCE BOUCHERIE ALIMENTATION CARNEE, prolongeant les domaines d'expérience AGRICULTURE, ELEVAGE, ZOOTECHNIE, PATHOLOGIE ANIMALE; mais il s'est trouvé des experts internationaux pour défendre ces orientations aussi importantes que celle de la constitution des bases de données LEX lexiques intellectuels européens MA, Renaissance, XVII, XVIII, période révolutionnaire et postrévolutionnaire.
Les documents partiels ERA 352 URL8 INALF dont on parle ici sont tous accessibles en tant que DATA (données empiriques disponibles; mais ceci est à peine le banc d'essai, au regard de ce qui reste à faire, de la numérisation de l'archive sonore (opération nouvelle amorcée dès 1998 : Conseil Régional de Midi-Pyrénées) aux opérations de traitement qui permettent de produire des résultats intéressants, interprétables.
6° On a d'autre part rassemblé une vaste littérature scientifique et technique du domaine ( au plan national FRA, et au plan international européen ITAL, ESP, etc.), qui témoigne de la genèse du domaine, de l'invasion du domaine des usages vernaculaires par le français scientifique et technique (histoire des terminologies des systèmes agraires et de développement au 19ème s/ textes édités; collections d'archives: documentation largement inédite, qui met en jeu les rapports entre LANGUES et INSTITUTIONS.
L'état d'avancement de ce chantier a permis la mise en place d'un chantier de traitement multimedia de la variation, par application à des collections de données plus générales (données dialectales d'atlas d'une part) et, d'autre part, a permis d'aborder la problématique du traitement de l'enquête dialectale conversationnelle (récits, conversations, production orale "naturelle" et "situationnelle"

DOCUMENTATION ELECTRONIQUE
Le dossier des DATA_origine DMRDH se compose _ de 7 liasses, qui contiennent les bordereaux de réponses de 152 témoins (réponses multilingues); les données saisies concernent, pour 152 témoiugnages les localités du sud-ouest gascon (Landes, Gironde, Lot-et-Garonne et partie du Gers.) _ des liasses de données intermédiaires VERIFIEES (travail de Y. HAMON, ingénieur CNRS, depuis décédé en 1998): fichiers de découpâge automatique . MOTS . PH Le principe du découpage automatique a été généralisé par le standard DRAWCARTE/ Ce standard est du domaine public et permet à tout utilisateur qui l'acquiert de traiter des applications de ce type.
Ce fut l'étape de banc d'essai, de création, de vérification, de développement et de préfiguration de ce qui pourrait, avec d'autres ressources, sur d'autres bases, donnier lieu à la création d'un SERVEUR LANGUES incluant la problématique des langues régionales, dont occitan, catalan.
Il fut mis un terme à cette expérience au sein de l'INALF sous la responsabilité nationale de M. Fr. Lautman. Mais les données restent en ARCHIVE OUVERTE, pour un plan FORMATION AUX METHODES DE TRAITEMENT, MODELISA1TION RESEAUX SOCIAUX, etc.


Haut
 Profil Envoyer un message privé  
 
MessagePublié: 07 Oct 2007, 10:01 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
Re: LEXICOLOGIE OCCITANE ELECTRONIQUE

Envoyé par: CAMLONG (andré) UTM PORTUGAIS, MR <camlong@univ-tlse2.fr> (193.55.175.20)
Date: Lundi, 25 Octobre 1999, ˆ 10:26

En Réponse à: LEXICOLOGIE OCCITANE ELECTRONIQUE (Fossat Jean-Louis erss/clid/occitan)
ANDRE CAMLONG est à TOULOUSE, le seul chercheur à avoir mis à notre disposition et à disposition de doctorants en ECOLE DOCTORALE son immense savoir en lexicologie électronique et numérisation, sous la forme d'un outil évolutif STABLEX: il fallait que ceci fut dit et mieux encore écrit. Ceci est fait.

Voua avez en main les résuktats de la méthode de traitement statistique lexicographique opéré avec l'outil STABLEX - data: data 1 cartulaire de Lézat; data 2: textes dialectaux de 15 localités constituant l'OBSERVATOIRE de FIGEAC (C. LANGARD 1996) - on télécharge les textes localisés sous format texte pour une session de travail utilisant STABLEX - B1: tri alphabétique des variables (variables lexicales; variables graphiques; variables phonétiques ou phonologiques, selon la nature du data traité. - DELAT: liste de fréquences, croissantes ou décroissantes, pour les variables prises en considération - B2 tri du bloc B2 - calcul de probabilité pour B1 - calcul de probabilité pour B2 - TABLEAU GENERAL DE L'OBSERVATOIRE: • rang • fréquence (croissante/décroissante= option) • distribution du texte 1, ..., n • TDR= TABLE DE DISTRIBUTION DES ECARTS REDUITS • calcul du POIDS des UNITES (par exemple lexicographiques) "concentrées" • densité de chaque "groupe" ou "cellule" • tableau des probabilités pour 6, 16 variables (localités) • MOYENNES • écarts réduits • écart type • KHI2 • commentaires • histogrammes excel (histogrammes; courbe; radar) - ETABLISSEMENT DES CARACTERISTIQUES PREFERENTIELLES (vocabulaire préférentiel, par exemple, s'agissant de textes juridiques occitans; graphies préférentielles, si le dictionnaire de variables prend en compte les variantes de la tradition manuscrite ou scripta etc.) On calcule ici la densité de TOUS les éléments pris en compte, par rapport au seuil de 1,96. Pour d'autres traitements, VA PORTEXT, Laboratoire INALF, Université de NICE (http://ancilla.unice.fr)
Nous avons créé sur cette base un PROTOTYPE SACAZE HISTOIRES RECITS OCCITAN: libelle MASSAT, OUST, CASTILLON, ST-GIRONS. L'apport d'André CAMLONG à la modélisation, à la création de représentations fut décisif; il est regrettable que cette coopération n'ait pu se poursuivre; cependant le tout est disponible sous forme de données initiales, données dérivées de calculs, représentations; la coopération est ouverte, à condition que les données soient accessibbles en archive ouverte; ce quqi est le cas. Fouillez dans bases de textes téléchargeables,
à condition que les datas soient accessibles en archive ouverte: ce qui est le cas (archive erss_clid/occitan, ercvox@free.fr fonds numériques)


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 7 messages ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 2 invité(s)


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr