ERCVOX

Forum du CLiD
Nous sommes actuellement le 29 Mars 2024, 07:05

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 10 Oct 2007, 08:27 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
CARTE/COGNITION: état de la question

Envoyé par: Fossat J.L erss_clid UTM <fossat@univ-tlse2.fr> (mwall.univ-tlse2.fr)
Date: Mercredi, 9 Février 2000, ˆ 11:30

LA CARTE LINGUISTIQUE: COLLECTION? DONNEES? BASE DE CONNAISSANCES, MEMOIRE DE L(HISTOIRE DES LANGUES, MEMOIRE DES SAVOIRS

Référence AUDIT_DRAWCARTE 2/11/99 P. Lescure (Société Image, Toulouse, représentant Ch. Zafar, Marc Peytavi ), J.L. Fossat (UTM,erss_clid), Jean Le Dû (Université de Brest), G. Brun-Trigault (THESOC, Cnrs, INalF), L. Tanguy (UTM, erss, opération Sémantique)

Outils généraux et bref historique: ETAT DE LA QUESTION, BILAN
• PREAMBULE Dans les années 50, Jean Séguy lors de la soitenance de sa thèse de doctorat sur les noms de plantes dans les Pyrénées cenntrales (aragonaises, basques, ariégoises, catalanes, proposait à son jury un résumé de connaissances cartographiées. Dans les années 69, lors de ma soutenance de thèse sur un vocabulaire bizarre, infiniment particulier, j'arrivais en soutenance avec la maquette d'une représentation cartographique en pleine gestation et proposais au jury de l'examiner; mais j'avais une connaissance très précvise de la distance qui sépare matériaux bruts recueillis et faisant liste/corpus, et données de connaissance, résultat représentable par certains types de cartes. Depuis les années 70, nous avons rassemblé matériaux, outils d'extraction de l'information, outils de représentation; où en sommes-nous? et qu'allez-vous trouver, retrouver, où , et comment, et quand, sur le SITE du CLID?

DATA
• carte_thesoc (carte de data, avec requête aux data) La carte THESOC, vise à donner accès à des données regroupées, avec objectif de description à échelle pan-occitane, par étapes.
• RESULTATS

Par résultats, on entend des résultats de dénombremement et de classement d'objets, selon des critères explicites définis avec minutie. Pour obtenir des résultats, on utilise des méthodes (outils); et les résultats obtenus donnent alors lieu à interprétation.

ETAT DE LA QUESTION
• Images de cartes de type NALF (Petit format) : base "K" Les données mises en observation prennent ici le format liste_CARTE, hors base de données. Ces cartes, scannées sous format ADOBEPHOTOSHOP, ont été constituées en collections d'images sous format PICT, et chargées dans une base iconographique "K", accessible par INDEXATION DU CONTENU; l'utilisateur accède aux données de son choix par muli-index.. Pour permettre une extraction de DONNEES, à partir de ces matériaux mis en première forme territoriale, on leur a associé des clés d'interrogation par diphones; le diphone [x,y], ou [y,x] existe dans le document carte N° [ØØØØ]; il s'agit d'une collection de cartes, lisibles à l'écran, donc d'une documentation numérisée, mais accédée hors base de données; c'est un moyen commode de lire par échantillonnage les atlas linguistiques, qui, le plus souvent, ne sont pas lus, mais confisqués dans des bibliothèques, où ils soit soit non exploités, soit mal lus. Pour une lecture plus systématique, ces cartes doivent être accédées - par le CATALOGUE qui leur est associé, dans le module ICONOGRAPHIE (clé = VARIABLES) - par les dictionnaires de variables (DICVAR) acccessibles sur site depuis ALG7, constitué à partir des données d'ALG6C tables P1,P2,M3,V4,L5; le but de ces tables, dressées par Séguy 1973 est toujours de proposer un système de mesure quantitative de l'information grammaticale (P1,P2,M3,V4) ou lexicale (L5), à des fins de réduction de l'incertitude sur le raport MATIERE/FORME. Ces pièces sont d'utilisation nécesaire et incompressible par l'ingénieur de dialectologie chargé d'exploiter et de médiatiser ce que l'on appelle les fonds constitutifs du PATRIMOINE DIALCTAL OCCITAN, partie du patrimoine mondial: ce dernier couvre la totalité du domaine, des gavacheries occitano-françaises de l'ouest, aux gavacheries dites "franco-provençales" à l'Est; aux gavacheries entre Aragon et Pyrénéen, entre catalan pyrénéen et languedocien pyrénéen, aux gavacheries entre gascon et domaine basque en domaine sud-occidental. On peut consulter ainsi les collections aquitaniques suivantes: SEGUY ALLIERES (nalf_alg4): collection de faits classés par morphèmes constitutifs (cartes de petit format (PF): les cartes constituent une sorte de hangar d'archive des morphèmes rangés, ps en ordre, représentés par carte; l'interprétation est ici indissociable d'un livre d'auteur (Allières ALG5) qui est accessible en bibliothèque (épuisé au CNRS). PHILPS_adipyc (1) data; cartes de classes (ADDAD) Ces cartes de classes sont indissociables d'un livre d'auteur (édition épuisée) accessible seulement en bibliothèque sous forme non numérisée. JAGUENEAU (cartes de classes (ADDAD) Ces cartes de classes sont accessibles à l'interprétation à partir d'un livre d'auteur inédit (thèse de doctorat d'état de l'Université de Toulouse) AURREKOETXEA (basque de Biskaye); cartes de classes Ces cartes de classe sont commentées etinterprétées par un livre d'auteur, déposé en bibliothèque (version basque); la version espagnole écrite par l'auteur n'a pas été éditée, faute de ressources, alors que c'est un ouvrage majeur des 20 dernières années, en description et didactique des organisations dialectales.

• carte Z (PC): démo pour Ludovic Tanguy: contrainte: importer une classification faite sous statitcf; initialement prévu dans un schéma DB3 (IRIT/UTM; Junio entreprise ECOLIA, Gouardères et collaborateurs successifs; requêtes; export data vers statitcf: classification exportée dans carteZ; carte de CAH ascendante [et/ou] descendante; création Z.sansouk (1991); mise au point Soc. IMage (T. Bousqué) en 1994; cet outil permet de donner une image tramée de l'espace organisé par un bloc de variables bien maîtrisé, de taille N. Il est commode pour donner une première représentation gradiente du polymorphisme (data alg12, 1999-2000: 1/4 du contrat quadriennal, opération atlas: systèmes phonologiques). Sous-exploité, ce logiciel peut permettre d'entrer dans le dispositif de mesure quantitative exploratoire de l'information dialectale, puisqu'il accepte d'importer dans le logiciel STATITCF toute table de données constituant une mesure quantitative de l'information. ACQUISITION: il suffit de demander la carte Z: elle est à tous ceux qui veulent s'en emparer; pas de mur de feu! pas de commerce électronique ! des apprentissages fondamentaux!

• alliance (Soc. Icare, PC) (SIG), sous Windows (poste PC ATS BRAVO, installé): utilisé pour carte toponymique (groupe Andorra); utilisable pour ALG12 cartes de GRADIENT (Fossat déc. 99: calendrier de saisie nov. 99: Objectif 100 bases pour carte-données); on exporte en direction d'alliance les tables excel qui produisent les mesures quantitatives de l'information dialectale telles que les a - manuellement - dressées Jean Séguy (Séguy 1973 ALG6A répartitions du polymorphisme) DROIT: tout laboratoire utilisateur doit disposer( d'une licence, et éventu ellement des diverses mises à jour; nous n'en avons pas assuré le suivi, faute de ressources humaines et financières. Ce logiciel, testé por une utilisation dialectale, a trouvé son plein emploi dans le laboratoire de géographie de l'UTM (SIG), où il est utilisable, entre autres SIG. Un ingénieur de dialectologie aura à décider de son utilisation ou de son abandon.

• carte-données d'Articque (c'est le logiciel de représentation cartographique de référence), principalement destiné à une utilisation en Sciences Sociales (matrices de Bertin etc.); si un ingénieur de la dialectologie est recruté il doit traiter avec la version 2000 à acquérir (mise à jour) toutes les données rendues disponibles sur le site CLID (erss/clid/occitan: on trouve données et résultats antérieurs au module Etudes, sous le libellé provisoire libellé LIVRE. DROIT: tout utilisateur doit alors disposer d'une licence, au sens juridique du terme (possibilités ouvertes MAPINFO, ARCINFO).

• prototype CARTE_LEXIQUE (classif ALCESTE; résultat cartographié sous logiciel CARTO U STRASBOURG (Peytavi et Zafar 1991; avec implémentation de fonds carte URL8 INaLF sur site CICT (machine TEKTRONIX): abandonné pour DRAWCARTE.carte en 1991 Jacques VANPOUCKE (avec un de ses élèves) a proposé en 1994), un dispositif de mesure de l'information dialectale de caractère lexical, présenté au colloque international ACH 1994 ENS ST-CLOUD et PARIS_SORBONNE (Peytavi, Aidjinou, Vanpoucke, Fossat 1994). On procède par bouquets de variables; la méthode, proposée pour la mesure de l'information lexicale, a été généralisée à la mesure de l'information grammaticale; toutefois, les algorithmes correspondant au programme développé n'ont pas été cléés, faute de suivi par le créateur de la méthode EDA (Eugène HORBER) et faute de ressources. Ce développement appelle une décision de l'ingénieur en dialectologie métrique.

• drawcarte.carte enfin: notre outil, très modeste, conçu et réalisé 1994 pour les besoins de la géolinguistique quantitative, d'inspiration métrique, typologique, quantitative. Ce qu'on cartographie ce sont des classes-objets définies dans la littérature logique (Grize etc.), à partir de bases de données empiriques linéaires,saisies dans un standard de base de données, à des fins d'extraction de l'information utile (base1; base2; base3)

DRAWCARTE (session d'audit 1999-février 2000) DRAWCARTE_version 2000 est une méthode, un outil; il comporte 1° une base La base d'erss_clid accueillle trois types d'applications • atlas et texte phonétique • texte graphique • dictionnaire (occitan-français) 2. un outil de représentation cartographique: drawcarte.carte proprement dit, qui n'a pas donné lieu à développement depuis sa création par Marc Peytavi (1994).

OBJECTIF: CONSTITUTION DE LA COLLECTION K_cartes d'alg12 (programme 2000: 3 mois de saisie pour 100 microsynchronies juxtaposées) – On relève les CARTES déjà exécutées (affichage par "ITEMS"); un item est un OBJET défini en termes de requêtes structurées par l'analyse d'un aspect d'un problème inguistique à résoudre (carte HACHE; carte FOUGERE etc...)
• on les stocke au format WORD, pour affichage, et importation sur POWERPOINT (ex. FOUGERE): on a alors constitué une base.cartes, qui peut donner lieu à commentaire, importation sur site WWW (catalogue de la collection K) EXEMPLE1: CHOUETTE: CAVECA EXEMPLE 2 BORRREC EXEMPLE 3: HACHE (TYPOLOGIE LEXICALE[HUDLETT 1999 Mél. Fourquet] et TYPOLOGIE PHONETIQUE] EXEMPLE 4: FOUGERE EXEMPLE 5: MARDI/MERCREDI etc.

EXEMPLE6: TYPOLOGIE DES SYSTEMES VOCALIQUES TONIQUES alg12: 2210 (programme 2000 Observatoire des Pratiques langagières : mesure quantitative de l'information dialectale 2000)

PREALABLE -mettre une version d'EDA (version POWERPC!!!) DANS l'application que l'on veut créer, chaque fois que l'on exécute une CARTE_CLASSIFICATON (CARTE DE CLASSES SPATIALES). - ouvrir DRAWCARTE - se référer à la présentation du MANUEL DE DRAWCARTE et à la plaquette codiffusée par UTM, CNRS et Société IMAGE - acquérir légalement ou par convention de laboratoire DRAWCARTE (voir Société Image et erss_clid)

PROCEDURE
• EXPORTER "ITEMS" SUR DRAWCARTE.CARTE
• EXECUTER CARTE DE CLASSIFICATION
• STOCKAGE D'UNE COLLECTION DE CARTES ACCESSIBLES - carte (format WORD; import POWERPOINT) - commentaires - diffusion site WWW

INSTRUCTIONS POUR UNE SESSION (CONSTRUCTION DE CARTE en environnement DRAWCARTE)

ETAPE 1: la classification (tâche: exécuter une classification)
• frapper "Classification eda" (version EDA adapter à son type de MAC, POWER=G3) AFFICHAGE • frapper EDA>tree AFFICHE l'arbre des classes • frapper EDA>ncut=10, ...n AFFICHE CLASSES • frapper > stop pour sortir • FICHIER: quitter • frapper EDA>q pour quitter La classification est achevée Pour le détail, se reporter à une session EDA complète.

ETAPE 2 IMPORTATION DE L'APPLICATION [DEMO FOUGERE_MOTPHONOL=K001PHONOL]
• si DRAWCARTE n'est pas localisé, ouvrir l'application DRAWCARTE
• importer items/data de DEMO [fougère_motphonol=K001]
• sélection des COULEURS par CLASSE 1, ..., n - affichage par NOM DE LOCALITE (ex. 548 ST_VIV.) et N° DE CLASSE - descendre avec curseur jusqu'a fin de classe - frapper "SHIFT" FIN DE CLASSE n (n=2 par exemple) SANS "shift": cliquer sur le 1er de la CLASSE AVEC SHIFT: sur le dernier de la classe (pour fermer la classe) La classe est affichée.
• sélectionner COULEUR de la classe marquée • UTILITAIRES: désactiver NOM DE LOCALITE qui a atré utilisé pour colorier les cartes

FACULTATIF • afficher les localités sans données

ETAPE 3 ENREGISTREMENT DE K001[DEMO] dans un DOSSIER K (application K_gradient par exemple) – sauver table data de format EXCEL - import data_excel en direction ALLIANCE, Z etc. - rouvrir la carte avec DRAWCARTE.carte, pour la LIRE
• sauvegarder sous WORD ou POWERPOINT pour commenter, donner accès
• importer site WWW On insiste sur la nécessité de retour aux tables de DATA (tables excel), triées, histogrammes, graphiques excel etc.

INSTRUCTION
• SELECTIONNER K001 Le doc. va dans le presse-papier • masquer DRAWCARTE
• COLLER sur Feuille de présentation vierge de POWERPOINT
• REDUIRE (en prenant les angles et les milieux des côtés) • EDIT: pour modifietr l'objet image avec POWERPOINT
• AJOUT DE TXT_RAPPORT, COMMENTAIRE, LEGENDE, ETUDE
• COPIER-COLLER UNE IMAGE K001_carte, de format WORD, en direction de POWERPOINT.

On a ainsi accès aux images-cartes exécutées, mais sans passer par DATA.BASE (sans accéder aux données de la base) 1° pour DEMONTRER 2° POUR IMPRIMER 3° POUR IMPORTER DANS UNE APPLICATION MULTIMEDIA (Indexing multimedia CBMI99, IRIT 25-27 nov. 99) 4° pour COMMENTER, présenter un RAPPORT, construire un TP, un TD, une leçon de géolinguistique, linguistique spatiale, linguistique variationniste. EXEMPLE HACHE INDEX LEXICAL: entrée de 3 bases SORTIE: fragmentation de chaque base par les critères de variation qui construisent le mot phonologique. 1° HAPCHA est dans une zone de RESISTANCE A L'ACCOMMODATION (zone occidentale aquitanique): V. CARTE 2219 carte binaire en 2 zons avec zone tampon (localités comptabilisées qui ne satisfont pas aux critères 1 et 2 (A et B) 2° ceci est confirmé par les bilans de pourcentage qui, dans cette aire, prennent le format suivant: 653O NON-ACCOMMODATION 0007 ACCOMODATION PARTIELLE: 0000 GEMINATION 0001 ACCOMMODATION T OTALE 0003 Ce type de bilan s'oppose au bilan d'une localité qui obéit à la contrainte GEMINER; en voici un exemple illustratif LOCALITE 790SE ACCOMMOD TOTALE 0000 ACCOMMOD PART 0006 GEMINER (instruction exécutée) 0006 Pour le détail se reporter à la base de données lexicales construite selon les instructions de la carte 2208.

FORMATION ET DIDACTIQUE
Le dispositif de travail présenté est un dispositif d'approche professionnelle; être dialectologue est un métier; on s'y forme par trois stages de 6 mois dans trois laboratoires internationaux (France; Espagne; Autriche ou Allemagne); l'ingénieur en dialectologie devra décider de cette orientation ou de son abandon; en tout cas il est appelé à prendre position s'ur les méthodes d'utilisation de mesure qantitative de l'information dialectale, ou alors il n'est pas ingénieur de l'information, ce qui est, somme toute, très compréhensible.

MA POSITION PERSONNELLE Je pense que le traitement par mesures du seul domaine gascon et languedocien, réserve, au plan cognbitif, d'immenses surprises, fondées sur des découvertes à venir; y ayant consacré plus de 25 ans d'activité, je pense qu'il faut abandonner d'avancer dans ce domaine dans la solitude qui atteint très vite ses limites; c'est ainsi que se dessinait un programme de recherche coopérative avec L'ECOLE NATIONALE SUPERIEURE DES TELECOMMUNICATIONS DE BRETAGNE (turbo-codes appliqués à la matière d'une base de données dialectales); mais le programme a été interrompu, faute de bourse de Région, à Brest; comme il a dû être interrompu à Toulouse, pour donner priorité à la seule opération de NUMERISATION du PATRIMOINE DIALECTAL OCCITAN SONORE: l'opération de numérisation financée par la REGION MIP a permis de conforter l'équipement de base du laoratoire toulousain erss_clid (avant solutions DVD 2000) et le financement d'un mois de salaire d'ingénieur de la numérisation de l'archive sonore.
On connaît au moins un chercheur utilisateur des cartes de l'Atlas Numérique qui a su utiliser cette archive ouverte (UMS838/g/gascon) pour créer de nouvelles re^présentations: Jean-Louis Massoure 2007.

LE PROGRAMME DE DIALECTOLOGIE DANS LA FEDERATION DE LINGUISTIQUE FRANCAISE. C'est une des tâches de la FEDERATION DE LINGUISTIQUE FRANCAISE du CNRS, que de donner à ce secteur des recherches le développement attendu. Les ingénieurs de la dialectologie seront attentifs aux solutions concrètes apportées, qui restent à inventer. Les dialectologues, eux, choisiront de faire ce qu'ils voudront;

ET LES DIALECTOPHONES, EUX ? Pour ce qui est des dialectophones, leur choix est fait: ce n'est pas la théorie de tel ou tel; ce n'est ni OT, ni Martinet, ni Chomsky; c'est parler la langue d'aujourd'hui; pas de meilleure leçon que l'a parte de ce participant à la présentation de l'ouvrage LES MOTS DE TOULOUSE, à la mairie de Toulouse (janvier 2000): " paures; anam parlar patoès, ara ! "- originaire de Frouzins, ce témoin est une des pièces de constitution de l'observatoire sonore; là aussi l'ingénieur en dialectologie doit décider de la poursuite ou de l'abandon du projet qu'Emmanuel Companys en 1985 présentait comme un projet éditorial avec discographie; il est vrai que dans notre société consumériste, on peut faire du commerce électronique avec tout et n'importe quoi! et, à la mairie de Toulouse, comme ailleurs, on a parlé en français, d'un patois de France, à propos d'un des livres qui présente sans dote "un des meilleurs états de la question" (Moreux 2000, PUM, Mots de Toulouse); mais voilà; ces mots de Toulouse n'ont pas été mis en carte. Or le dispositif de traitement des mots des Pyrénées aragonaises, par exemple, ou des Pyrénées gasconnes, languedociennes, se prête admirablement à une représentation cartographique: les mots à la carte.

CENTRE DE RESSOURCES 2000 : PATRIMOINE DIALECTAL OCCITAN: OU EN EST-ON au 30/1/2000?

Il faut pour cela mettre à disposition des utilisateurs l'outil (ensemble d'outils, incluant les solutions de l'Internet) qui leur permette une gestion des collections de faits lexicaux en base de données (tables organisées sur un mode relationnel permettant une représentation des rapports entre langue, espace et temps; à l'école, l'apprentissage de ces méthodes, c'est un peu comme l'apprentissage du solfège, qui, on le sait, n'est pas la musique, mais facilite l'apprentissage de la musique.La barrière entre activité langagière et activité mmusicale, deux activités fondamentales et prédopminantes, ne devrait pas constituer une barrière insurmontable, pour la génération montante. La future médiathèque universitaire du "MIRALH" - fontaine et source, au sens hydrologique du terme, hélas, comme au plan analogique de l'HOMO COGNITIVUS, est là, chantier "planté"; la mise en place d'un SERVEUR OCCITAN, dans ces conditions, n'est pas à chercher dans une telle direction humide [?]; mais de quel côté se tourner? Ce ne sont pas les bocaux de nos bibliothèques de laboratoire qui pourront jouer ce rôle distributeur, qui attend l'ingénieur de la dialectologie, espéré. On peut toujours rêver, me rappelle Andrée Borillo. Peut-être la REGION, la Mairie de Toulouse? Pourquoi la solution temporaire ne serait-elle pas à rechercher en direction des ingénieurs de l'Université (ingénieurs de la carte, du Service CARTE), et des ingénieurs de l'ingéniérie des Langues présents dans les laboratoires, mais affectés à d'autres opérations? on peutbrâver d'un système d'entraide, ne fût-ce que par prélèvement d'une semaine de 30 heures, non? CONCLUSION: et si on se retrouvait à la COOPERATIVE DE GERM, non pour en parler, mais pour y travailler, tous ensemble, pyrénéens, aragonais, catalans, romanistes dialectologues, en fédération de dialectologie internationale de corpus? A VOUS LA REPONSE. La contribution de tous serait une heureuse chose, mais sous quelles formes de travail concret, avec quels états d'avancement, quelles ressources?


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 2 invité(s)


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr