ERCVOX

Forum du CLiD
Nous sommes actuellement le 28 Mars 2024, 14:05

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 2 messages ] 
Auteur Message
MessagePublié: 08 Oct 2007, 17:42 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
MORPHOLOGIE DIALECTALE GRADUELLE

Envoyé par: Fossat (Jean-Louis) ERCVOX et ERSS_clid <fossat@univ-tlse2.fr> (mwall.univ-tlse2.fr)
Date: Mardi, 11 Janvier 2000, ˆ 11:56

Ce message doit se comprendre comme un dialogue préliminaire entre équipes de recherches ou entre composantes de laboratoire entendant pratiques l'analyse graduelle, avec des données adéquates, des corpus, et des outils adéquats d'exploration de corpus dialectaux de France, notamment, mais tout aussi bien d'Europe (ALAR, et ALE sont les institutions qui regroupent les corpus d'observables à cette échelle, sous forme fédératrice).
• PRINCIPE DE BASE: En dialectolohgie l'utilisation de données spatialisées attestées, et localisées, est la seule pratique de base bien établie; on n'est dialectologue que si on a recueilli des données localisées, datées, constituées en corpus sur critères géolinguistiques nets; qui dit corpus dit corpus électroniques, permettent (1) l'extraction des connaissances, l'extraction de l'information (2) la représentation, par exemple la représentation des organisations phonologiques, morphologiques etc. de caractère gradient ou graduel (3) le regroupement d'informations retrouvées (RETRIEVAL); tout ceci suppose (1) maîtrise absolue des systèmes de gestion des bases de données relationnelles (SGBD_R) (2) le couplage à ces SGBD de logiciels d'analyse exploratoire adéquats (outillage EDA) et (3) névcessaireme,nt le couplage à des outils de représentation cartographique de type SIG (V. SCOT, TOULOUSE); nous utilisons quant à nous DRAWCARTE, un outil maison; CARTE-DONNEES D'ARTICQUE, un outil de référence, ALLIANCE (version exploratoire); mais aussi BD_CARTO (modèle IGN) pour le corpus des ONYMES de FRANCE (échelle nationale, réghionale, départementale, cantonale; infra-cantonale; intercommunalité etc.)
• DATA: PRINCIPES DE BASE: en dialectologie les données recueillies sont constituées en corpus électroniques de manière systématique, qu'il s'aggisse d'applications de type (1) atlas) (2) dictionnaire de formes localisées et regroupées couplés à (3) bases de textes de grande étendue (a) textes transcrits (b) textes graphiques (c) textes transcrits ou corpus d'énoncés alignés sur du SIGNAL; le préalable à cette étape est bien évidemment la nupérisation des corpus sonores, la numérisation des données magnétiques ou discographiques initiales, quand on dispose de données attestées enregistrées sur le terrain des enquêtes d'un OBSERVATOIRE permanent.
En dehors de cette discipline, il nous est aussi arrivé d'avoir à recueillir des données hors enregistrement et de constituer des liasses de carnets; on dispose alors de l'archive écrite des BROUILLONS d'où des rédacteurs patients ont extrait ce qu'ils ont appelé CARTES: carte des noms de la HACHE, par exemple; une carte est une liste ordonnée, hiérarchisée, saisie dans un schéma de SGBD, et un recueil de cartes ne devient CORPUS électronique qu'à condition de mettre l'information à disposition de tous, avec des outils d'interrogation (dialogue Homme-Machine); sinon, on a des piles de cartes; des fichiers, inexploitables hors SGBD. Répondent aux exigences d'une linguistique de corpus les opérations telles que (1°) DRAWCARTE.BASE (erss_clid et ERCVOX) (2°) THESOC, pour le domaine occitan; c'est par ce biais que des données occitanes peuvent être exportées en directioin d'entreprises à ambition mondiale (ALAR; ALE Atlas Linguarum Europeae). • LINGUISTIQUE DE LA VARIATION GRADUELLE: les corpus linguistiques électroniques de grande taille alors constitués, testés, permettent alors de pratiquer systématiqueme,t une analyse linguistique de la variation graduelle; pour la dialectologie occitane graduelle, les bases ont été posées dès 1973 par Jean Séguy; les résultats acquis entre 1973 et 99 sont disponibles sur site erss_clid (rubrique atlas; rubrique ETUDES: data et résultats; commentaires temporaires; conclusions provisoires). Certains des fichiers n'ont été constitués en corus qu'en 2000 (programme 2000 JLFossat Base 12 phonologie segmentale du gascon diachroniquement motivée, ce programme exploite 100 bases de données graduelles, avec recours aux outils EDA, et CARTE-DONNESS (articque) en double version MAC et Windows; le recueil des données rompt ici avec la tradition saussurienne de distinction entre diachronie et synchronie; règles et contraintes sont toutes modélisées en termes de CHANGEMENT PHONETIQUE (Historical and Geographical Sound Change; exemple: qu'es aquò ? bien connu des Franchimands: [k'e kOj] 57 Lougratte 7/1/2000 message sonore (SIGNAL) adressé par M. P.D. (mesagerie sonore); on prend pour modèle de base WEN-CHAO-LI A Diachronically-Motivated Segmental Phonology of Chinese Mandarin, P. Lang, 1999; cet auteur a travaillé dans le projet BBC, en enseigné à l'Université de Minnesota; il est PR de linguistique a Taiwan. Son étude permet de préciser les caractéristiques du chinois du sud et du chinois du nord.
• LA TRANSITION: depuis 1986, avec des méthodes de constitution de GRANDS CORPUS TEXTUELS, au sein de l'INALF, nous avons, avec Jacques DENDIEN, JL HAMON, JL ARTIS, posé les bases d'un chantier important de constitution de GRANDS CORPUS TEXTUELS OCCITANS (A) occitan ancien (B) OCCITAN moderne; pour l'occitan ancien existe, sous diverses formes, le CORPUS GENERAL DES TROUBADOURS; équipe française du TELMOO (Univ. Limoges); équipe britannique de Peter Ricketts; équipe italo-américaine, fort avancée en méthodologie; reste évidemment à mettre en route le chantier de la base de textes juridiques de l'ancien occitan, opération qui ne peut être que l'oeuvre de plusieurs laboratoires, à échelle internationale (France, Italie, Espagne etc.).
• LES CORPUS OCCITANS DU CLID: LE CAS DE LA BASE BOUDOU; nous nous sommes limités, quant à nous à la constitution d'un corpus de textes occitanslocalisés et datés mais essetntiellement enregistrés (discographie, enregistrement, voix, à un moment de la constitution du corpus: soit le signal précède; soit le signal suit; comme on fait à la BBC: on édite des textes d'entretiens (phase préalable); on passe ensuite à l'enregistrement des données sonores de terrain; on édite alors un texte transcrit aligné sur l'énoncé tronçonné selon des critères prosodiques, syntaxiques, morphologiques, pragmatiques. Ces corpus sont traités par l'outil DRAWCARTE.BASE; autrement dit drawcarte.base permet de documenter (1) un champ phonologique/phonétique
(2) un champ d'analyse morphologique; on ne recourt ni à l'intuition, ni à un analyseur morphologique, pour l'instant; mais à chaque moment, le lecteur de texte électronique est guidé, dans son étiquetage morphologique par un dictionnaire des possibilités ouvertes pour lever les ambiguïtés (a) catégorielles (b) sémantiques.
• CRITERES QUANTITATIFS On s'astreint à disposer de corpus quantitativement représentatifs du champ de l'ethnolittérature (textes de la tradition orale) pour représenter les grandes tendances de fragmen,tation géolinguistique d'un domaine comme le domaine occitan; c'est pourquoi les textes du CORPUS constitué sont accessibles sur clé géographique hiérarchisée: FRANCE: REGION: DEPARTEMENT: COMMUNE: HAMEAU: LIEU-DIT; EXEMPLE FRA: LE EXTE COCOS DU CHER transcrit sommairement un entretien avec des cocos historiques du CHER (Bourges) témoins cruciaux de l'histoire du travail social; ce texte est au préalable indexé par un outil fruste mais robuste: ALCESTE; on cale alors les énoncés sélectionnés sur le SIGNAL, à condition, qu'existe une BIBLIOTHEQUE DE SIGNAUX et que la diffusion de ces signaux soit autorisée par les citoyens, qui ne sont pas de simples informateurs pour des laboratoires de Sciences du langage soucieux de se faire une bonne réputation dans leur milieu international. Ce corpus représente 48 heures de SON-terrain, pour 2 heures de RADIO (France Culture); la bibliothèque sonore est accessible à l'INATHEQUE, sur demande; ceci est un vrai corpus au sens des linguistiques de corpus (Benoît Habert); j'ajouite que son exploration phonétique, phonologique, morphologique a cessé de m'intéresser personnellement, je ne m'intéresse qu'à ce que ces hommes ont voulu dire, dans leur patois d'ouvriers ou de syndicalistes de Bourges, ici.
• LE SONDAGE, LE GLANAGE: Autre exemple de localisation de l'information, mais hors corpus: le SONDAGE; le glanage; il arrive à tout observateur en déplacement d'observac avec une finesse graduelle qu'il faut passer par le MOULINAL [FRA-al] pour aller de LA SALVAGIE [FRA_IE] à POUMEYROL [FRA @air@Ol]; l'exploration devient exploratyion sur corpus français, quand elle est opérée sur corpus électronique exhaustif, avec critères de tris permettant l'extraction de connaissances (1) historiques (2) géographiques (3) phonétiques (4) morphologiques; la seule chose que je sache est qu'il existe une base IGN qui constitue ce corpus, couplé à une base de type BD_CARTO, pour le coût relativement modeste de FF. 300.000 HT. Il peut arriver au linguiste qui trouve une forme française attestée de faire appel à son intuition, comme à ses connaissances antérieures pour interpréter une forme française localisée: LA FILHOLIE.FRA 24; est bien apparemment une forme en [ie] sur critères mùorphologiques (borderie; filholie; Rougerie; Borie etc... ce sont des miliers d'attestatins dont dispose le linguiste à qui la commission toponymique IGN demande de vérifier les données, de les corriger, de tester les corrections proposées etc... bref c'est la création d'un vrai service public national qui est ici esquqissée, prototypée; le tout est de savoir alors si une Institution telle que le CNRS est prête à s'engager à financer (1° les emplois nécessaires 2° la création d'un serveur adéquant (serveur géographique, couplé au serveur de type IGN, en négociation avec IGN partenaire essentiel; les retombées sur un plan de formation de linguistes, d'historiens, de géographes, , de socio-ethno-anthropologues,sont alors évidents. Au cas où le CNRS se sentirait concerné, il faut savoir que Toulouse peut disposer, avec la Société SCOT, à Toulouse (télédétection et SIG) d'un appui technologique considérable; il faut savoir que ceci peut servir notamment à créer la base française mais aussi une base transpyrénéenne (ANDORRA- CATALOGNE- ARAGON; DOMAINE BASQUE) sans que cela ait rtien à vois avec une fédération de linguistique française. On observera par exemple très vite, à échelle supranationale la régularité de formations de type GN, et on porra alors construiire des dictionnaires toponymiques multilingues (français, espagnol, occitan, catalan, aragonais par exemple) • FRA: La Borie Haute • FRA: Les Bruguettes: dès que je dispose de plus de 2 attestations, j'ai la très forte intuition que ces formes à analyser, par millions, ne relèvent pas dec compétences de la Fér-dération de Linguistique Française, à moins que cette fédération ne confie des missions de construction d'observatoire sur ressources à dezs linguistes dialectologues, avertis des méthodes de la dialectologie, et notamment de la dialectologie française, dont les acquis sont reconnus en milieu britannique et anglo-saxon, comme en milieu asiatique, de longue date.
Réponses à ce message

* Re: MORPHOLOGIE DIALECTALE GRADUELLE (views: 20)
Rabassa (Lidia) erss_CLID, UTM (mwall.univ-tlse2.fr) -- Mardi, 11 Janvier 2000, ˆ 12:25


Haut
 Profil Envoyer un message privé  
 
MessagePublié: 08 Oct 2007, 17:46 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
Re: MORPHOLOGIE DIALECTALE GRADUELLE

Envoyé par: Rabassa (Lidia) erss_CLID, UTM <rabassa@univ-tlse2.fr> (mwall.univ-tlse2.fr)
Date: Mardi, 11 Janvier 2000, ˆ 12:25

En Réponse à: MORPHOLOGIE DIALECTALE GRADUELLE (Fossat (Jean-Louis) ERCVOX et ERSS_clid)

• QUESTION Un groupe andorran de toponymie que je coordonne demande ce qui est intéressant et ce qui fait difficulté dans la liste qui suit (en catalan) • LOC: ST-LLORENç de Cerdans • LISTE; La farga del mitg; La font d'en Pelegri; La Miseria; Veïnat de la Miseria; Serrat de les carnisseres; la farga de les Armes; la farga d'avall; La Fargassa; Motferrer; collada dels Gesos

• REPONSE DE J.-L. FOSSAT à Lidia RABASSA: dels GESOS? VA GESITAINS (cagots, mesels)
Ce texte-là forme une sorte de microsynchronie toponymique; tout de la liste est bien connu (carte des forges à la catalane); aucun problème d'identification morphologique, syntaxique GN N1 deN2; spécification locative; mais semble résister dans la liste collada dels Gesos; je ne sais pas de qui il s'agit; manque de connaissance encyclopédique; je procède par interrogation de ma base par thèmes: collada dels Empedrats (rite de sacrification? rite de pétrification; cartographie de la pétrification bien établie à macro-échelle; pas à micro-échelle; des attestations comme El Pedregar (collectif) renvoient ou non à ce type de représentation? collada d'ègues est transparent, comme collada dels Empurdanesos; coll de Mala Cara sera identifiable moins aisément d'un point de vue sémantique; comme Ort de Mala Cara; mais collada dels Gesos; j'ai dans ma base catalane un problème de méconnaissance tiotale d'une autre base: t/T a r b a; quelle relation avec Tarbézou (Pays d'Olmes) etc.; une seule hypothèse à tester; j'ai comme l'intuition qu'une telle base GESOS pourrait être rapprochée d'une base ethnique (V. Gésitains; dans un dossier d'ailleurs fort mal connu: celui de la classe des cagots pyrénéens) ??? que ne pensatz, vos?


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 2 messages ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 1 invité


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr