Descriptif des documents occitans disponibles pour le CD_ROM OC, avec engagement du Centre de Linguistique et de Dialectologie (UMR 5610: opération N° 6 responsable J-L. Fossat) dans un programme de recherche pédagogique coordonné par Jacques Fijalkow, professeur à l'UTM (Sciences de l'Education, Equipe EURED)
ATLAS
TEXTES
CORPUS_PAROLE
DICTIONNAIRES
ARCHIVE SONORE
ICONOGRAPHIE
ETUDES
Avertissement.
Un système-auteur couplé à un didacticiel, - ou tout équivalent défini en termes de systèmes d'apprentissage - doit accéder, de manière souple, à un ensemble de données écrites et orales structuré.
Tout apprentissage suppose clairement définis, en termes de grammaire et analyse linguistique préalables, - vaste programme - ce qu'on appelle catégories de données élémentaires, leurs instances ou occurrences et leurs valeurs associées.
Les documents occitans dont on présente ici un état représentatif provisoire, concernent la mise en place d'un projet pédagogique multi-cibles pour l'apprentissage de l'occitan (précoce et avancé), déjà présenté en direction du Ministère de l'Education nationale et de la CEE en avant-projet (OC_0011995).
Ils sont immédiatement disponibles, à date de démarrage du projet, à l'intention des correcteurs qualifiés et formateurs mis à disposition par le Rectorat de l'Académie de Toulouse, du CRDP de l'Académie de Toulouse (Centre de Ressources), du Centre de Ressources de l'Université Paul Sabatier.
Certains d'entre eux se présentent à l'état brut, en tant que documents écrits ou sonores; ce sont soit des textes; soit des matériaux lexicographiques sous formes de dictionnaires, glossaires, listes, brutes ou étiquetées: ce sont alors des listes catégorielles initiales, destinées à faciliter l'apprentissage de la partie du lexique dite grammaticalisée.
Certains documents constituent les données (fichiers "data") de bases de données accessibles immédiatement, par tranches: ce sont les données à caractère dialectal, disponibles au fur-et-à-mesure de leur diffusion par tranches, en rapport avec le projet de Thesaurus occitan: ce sont les données rendues disponibles et accessibles par la méthode DRAWCARTE_003 juin 1996), développé par DRAWCARTE_004 (Drawcarte.base) qui constitue l'étape de développement ultime de deux programmes de recherche scientifique financés par le Conseil Régional de Midi-Pyrénées.
La méthode DRAWCARTE_004.base peut accueillir tout type de texte; tout type de dictionnaire, élément d'un dictionnaire général occitan unifié doté d'une structure "régulière", évolutive; toute production sonore associée au texte ou indépendante; toute production iconographique (information image), associée ou libre; elle peut permettre aux maîtres comme à des élèves avancés de construire eux-mêmes, s'ils le souhaitent, leurs index, leurs dictionnaires personnels simplifiés comportant une grammaire minimale, la possibilité d'établir des relations minimales entre normes de prononciation et normes d'écriture.Il est aisé d'importer touyt document de la base en direction du CD_ROM (LAVAC, PLS, etc...)
Certains documents ( base de textes occitans; dictionnaire unifié, et index général unifié , sont accompagnés d'exercices types qui se présentent sous forme de séquences pédagogiques d'enseignement des langues: cours, exercices et jeux pour l'enseignement; il s'agit d'exercices facilitant la prononciation localisée, tout en facilitant une translitération ou transcription relativement unifiée d'une part; d'autre part de jeux pour l'apprentissage de régularités morphologiques et syntaxiques; par exemple les recueils de chants occitans; les sous-ensembles de récits, contes, légendes sont précédés d'une présentation de leurs caractéristiques et d'indications pour la construction des exercices au gré de la mise en place de structures de travail pédagogique en domaine occitan. Il s'agit de de propositions en vue d'une méthode.
Ces indications d'exercices sont conçues pour le maître, en leur état; pour faciliter une exploration plus systématique des besoins d'assistance des élèves mis en situation de solution de problèmes. On les a conçus de manière simplifiée, dans la perspective suivante: ces exercices peuvent d'une part être traduits en termes de programmation logique, et couplés, pour certains d'entre eux, avec un conjugueur occitan, dans le même environnement logique; le but est alors de créer une représentation syntaxique immédiatement affichée de tout texte occitan écrit ou oral transcrit, segmenté en unités de décompte de type phrase ou ensemble de phrases faisant énoncé cohérent; un chant; une fable etc...
Ces documents bruts peuvent, par ailleurs être "interrogés" par les maîtres comme par les élèves, et manipulés avec des outils généraux, dont l'utilisation est devenue classique désormais dans les expérimentations d'apprentissage linguistique; de telles méthodes, au prix de quelques précautions, développements, permettent aux maîtres et aux élèves de construire eux-mêmes leurs dictionnaires de textes, leurs index, leurs concordances, voire, pour les maîtres, d'explorer, selon des méthodes de calcul, le poids de régularités ou de formes récurrentes dont l'impact pour l'apprentissage est démontré crucial: par exemple les bandes verbales en far/fèr/har/hèr/faire/héser dans les dictionnaires personnels occitans que se construit l'élève ou le maître, pour une phase donnée d'apprentissage: dictionnaires temporaires Prolexis; de tels dictionnaires temporaires permettent à l'élève de rechercher dans le dictionnaire bilingue (par exemple Lagarde-1996) les données utiles pour la compréhension, la traduction, quand la liste apparaît insuffisante.
On ne pourra pas comprendre l'intérêt à accorder à cet état de la question très fragmentaire, en dehors de la perspective de collaboration entre projets scientifiques et pédagogiques, connus non seulement par des maquettes et prototypes, mais des états d'avancement permettent une réutilisation de matériaux linguistiques électroniques à des fins pédagogiques:
- Etat documentaire des équipes pédagogiques académiques (Toulouse, Bordeaux, Limoges, Paca, Montpellier, Nice, Clermont-Ferrand etc...)
- Projet GIDILOC: textes et dictionnaires électroniques occitans
- Projet CATALOC (J. VERONIS), Université d'Aix-en-Provence: Bases de textes et de dictionnaires électroniques occitans et catalans
- Projet de bases de textes occitans (1. Base de Textes 2 Dictionnaire Unifié exploitant des collections de dictionnaires locaux 3 Atlas linguistique occitan Unifié par accès à un Index général: version des maîtres; version des élèves) du Centre de Linguistique et de Dialectologie (UTM: programme n° 6 d'une Unité Mixte de Recherche C.N.R.S et Université) en rapport avec l'état d'avancement du projet de Thesaurus Occitan, projet distinct à structure de base de données relationnelles piloté par J.Ph. Dalbéra (U. Nice).
- Projets symétriques ou parallèles existant à présent sous forme institutionnelle, pour un ensemble de langues régionales européennes: basque; ladin, corse (BDLC), pour nous en tenir à trois exemples significatifs et connus pour leur état d'avancement.
Publics ciblés
Initialement, nous avons préparé une préédition des textes dans une double perspective:
- formation des étudiants de l'enseignement supérieur (cours de langue des 3ème et 4ème années; licence; maîtrise; DEA; thèses))
-formation des maîtres des écoles, en pensant plus spécifiquement à la fin du cursus académique secondaire; 3ème et 4ème année des lycées. Toutefois, la mise en place, modeste, mais précise, d'écoles bilingues du service public ou du niveau associatif peut conduire à, infléchir la méthodologie proposée, qui doit être souple.
PLAN GÉNÉRAL
SECTION 1.- LES DOCUMENTS
1.- BASE DE TEXTES ÉCRITS ET TEXTES SONORES (ensemble ouvert)
2.- DICTIONNAIRE UNIFIE ET OUVERT ( ÉCRIT ET SONORE) ACCÉDANT A DES DICTIONNAIRES LOCAUX (ensemble ouvert, et non fini)
3. INDEX GÉNÉRAL UNIFIE ET OUVERT DE FORMES SONORES DATÉES, ASSOCIÉES A UNE LOCALITÉ, UNE PRODUCTION PAR UN SUJET (élève, informateur)
Cet index général accède aux données de l'atlas linguistique occitan électronique (base DRAWCARTE_003)
4.- DOCUMENTS ICONOGRAPHIQUES
SECTION 2 OUTILS ET MÉTHODES: MAQUETTE DE COURS ET EXERCICES DU SYSTÈME-AUTEUR OC.
SECTION 1 LES DOCUMENTS
1.1 TEXTES DIALECTAUX (prumèra causida)
Synopse et mots-clés: contes; proverbes; chants; récits de vie et récits techniques; documentation sonore disponible (atlas sonore)
Le principe de base retenu est que l'on ne retient que des textes localisés, datés, dont les caractéristiques relatives aux sources (informateurs) soient explicitées.
Quand les textes ne sont pas normés, ils sont présentés dans une forme graphique temporaire qui facilite simultanément la lecture et la représentation d'une prononciation "locale". De telles versions ne se conçoivent que comme versions pédagogiques, elles-mêmes bases d'expérimentation didactique. E aucun cas on ne doit les considérer comme des éditions en textes en machine de textes édités, protégés par copyright d'auteurs.
1.2 CONTES ET HISTOIRES
(textes écrits/archive sonore numérisée)
• Fabre (Daniel), Lacroix (Jacques).- Contes languedociens audois.- 2 volumes (saisie sous contrôle du C.Li.D)
- volume 1
- volume 2
• Arnaudin (Félix) Contes de la Grande-Lande (éditeurs: Boisgontier, Dupin et alii): 3 volumes saisis sous contrôle du C.Li.D
- volume 1
- volume 2
- volume 3
• Bladé.- Contes de Gasconha (prumèra causida) saisie sous contrôle du C.Li.D
• Loddo/La Talvera.- Contes et légendes
• Sacaze.- Légende de Tantugue
• Extraits de la collection Catinou et Jacouti ( © La Dépêche du Midi)
• Roumanille 1927: 11 contes en occitan alpin (provençal): texte manipulé pour faire apparaître
- les règles de pluralisation
- les contraintes relevant de l'analyse énonciative (incise)
1.3 PROVERBES (prumèra causida)
Textes électroniques sous contrôle du C.Li.D
• Vol. 1 Proverbes de Perbosc (Lomagne) primièra causida
• Vol. 2 Proverbes de Cayré
• Vol. 3 Proverbes gascons de la Grande-Lande (F. Arnaudin)
• Vol. 4. Proverbes gascons-pyrénéens
• Vol. 5 Proverbes d'occitan alpin (provençal)
• Vol. 6 Proverbes languedociens du Lot (primièira causida)
• Vol. 7 état des proverbes dans les dictionnaires occitans (primièra causida)
Les proverbes relevés dans le dictionnaire du Félibrige (Trésor de Frédéric Mistral) sont portés en liste accessible à un dictionnaire occitan des Proverbes (type PROLEXIS.PROV.OC)
1.4 CHANTS (prumèra causida)
• Félix Arnaudin.- Cants de la Grana-Lana.- 1 volume
• Poueigh.- Chansons populaires des Pyrénées Françaises.- Paris, Bossuet, 1933
Cette collection est plus spécialement accompagnée d'exercices pédagogiques "avancés" de type "Jeux pour l'apprentissage de la syntaxe en grammaire occitane énonciative, méthode "Pragma", pour la Calandreta de Castanet notamment (M. Bras; et pour discussion-extension avec une série d'éditeurs régionaux: Vent Terral, etc...)
Ces jeux syntaxiques sont des jeux fondés sur les principes de l'analyse combinatoire; il est à noter qu'ils ne s'adressent qu'aux maîtres; les versions "pour l'élève" restent à concevoir.
1.5 PARABOLES ET LÉGENDES
Il s'agit d'une collection de textes pour la comparaison de versions, en enseignement mulilingue:
- espagnol
- italien
- portugais
- catalan
- occitan
- basque etc...
L'extension de la collection dépend essentiellement de J. Allières, L. Rabassa, J.-L. Fossat, G. Aurrekoetxea et X. Videgain pour les collections de Bayonne (basque et gascon de contact).
• Vol.1 Paraulas: prumèra causida
• Vol. 2 Paraulas de lenguedocian et gascon de l'Ariège: TANTUGA: prumèra causida (octobre 1996): J. Allières, J.L. Fossat, L. Rabassa, B. Arrous et alii.
• Vol. 3 (en préparation): B. Besche-Commenges 09 St-Girons: Paraulas de Massat (avec Chantal Sutra, Massat 09F)
1.6 RÉCITS DE VIES, RÉCITS TECHNIQUES: (prumèra causida per l'escòla) CORPUS_parole dialectaux
Direction de la collection (J.L. Fossat, Lidia Rabassa)
Il s'agit ici d'une partie projetée de mise à disposition sous forme sonore et écrite les minutes d'enquêtes linguistiques dont les résultats sont des récits de vie et des récits techniques (collecte CNRS 1978-1990)
Prototype proposé
• N. ROUX.- Aucas, aucats dins lo païs de Miranda- Trie
(1) texte occitan (65 Trie F)
(2) index occitan lemmatisé
(3) didacticiel d'aide au dialogue
• Fonds Gonzalez L'occitan parlat jos tèrra (CARMAUX)
• Fonds Grimault (Causses et Segalars du Lot)
• Fonds Jagueneau (occitan parlé à Lespignan
Les textes sont édités et accompagnés de leurs cassettes, permettant une sonorisation des collections de textes électroniques à éditer et à exploiter par une documentation pédagogique éditée.
Le principe documentaire de la constitution de collections sonores sur CD_ROM a été présenté aux sociétés Axisa et Image (Toulouse), au CNRS "audiovisuel", à l'INA Régional (Toulouse), au Conseil Régional de Midi-Pyrénées, à la Communauté de Travail Pyrénéenne.
Collection L'agach del pastre (Fonds sonore C.Li.D: ERA 352 1970-96)
• Fonds B. Besche-Commenge.- Paraulas de Biert (textes gascons)
• Fonds D. Gonzalez.- L'occitan parlat jos tèrra a Carmaus (1 vol.): textes languedociens
• Fonds Dominique Decomps: L'agach del pastre (causida de texts per l'occitan lemosin) - responsable de l'insertion de la collection "Delpastre"
• Fonds Maurice Romieu.- L'agach del pastre ( prumèra causida de texts per lo lenguedocian aveironés).
On renvoie aussi aux textes transcrits des collectes de MM. Viau, Fabre (EPHESS et UMR Etudes Méridionales de l'UTM)
Par ailleurs, une association 1901 a été créée pour la collecte et le traitement de données sonores dès 1970 (ERCV): collection occitane: collection français régionaux; collection hispanique etc...; certains de ces textes, prépubliés en version pré-éditée, sont destinés à entrer dans la collection de textes électroniques, sous forme de morceaux choisis, ou tels quels, au gré de la demande.
On peut aussi penser à l'exploitation, sous forme de morceaux choisis, de textes électroniques témoignant des états de langue ancien de l'occitan: on dispose pour cela du fonds documentaire du corpus des troubadours (TELMOO, Université de Limoges, coordinateur Gérard GONFROY)
2.- DICTIONNAIRE UNIFIE ACCÉDANT A DES DICTIONNAIRES LOCAUX
Les dictionnaires électroniques disponibles pour l'exploitation des textes et pour l'élaboration collective du dictionnaire unifié sont les suivants, dans le cadre d'une recherche conventionnée, qui aura nécessairement un cadre trans-régional
2.1.- COLLECTION GIDILOC
• ALIBERT-machine (dictionnaire unifié provisoire: nomenclature bilingue)
2.2.- COLLECTION DIGAM(Joan Lafitte): dictionnaires locaux numérisés
• PALAY-machine
• BAZADÉS-machine (révision C.Li.D)
• GEVAUDANÉS-machine (GABAL)
2.3.- COLLLECTION DES DICTIONNAIRES LOCAUX CLID : COLLECTION DEL_OCC (diccionaris electronics per l'occitan a l'escòla)
Direction de la collection: Jean-Louis Fossat
• ESTALENX-machine (base: Palay électronique de DiGam J. Laffite)
• VAYSSIER-machine (Aveyron; Cantal) saisie C.Li.D
• GARY-machine (Tarn): saisie C.Li.D avec éléments de Sauvages
• GASC-PYR-machine (G. Rohlfs) pour la comparaison du haut-gascon, de l'aragonais et du catalan occidental pyrénéen: saisie C.Li.D
• DICCIONARI LEMOSIN-machina ( G. Gonfroy): saisie C.Li.D
• Dictionnaires PROLEXIS_OCC: 6000 unités catégorielles pour la correction orthographique avancée de textes occitans: saisie C.Li.D
• Dictionnaires DICO2_Oc (CEGOS) Expressions idiomatiques de l'occitan. Saisie C.Li.D
Le principe proposé est celui d'associer à ces nomenclatures électroniques hétérogènes, des outils didacticiels, construits, entre autres, selon le principe de construction d'un dictionnaire unifié utilisant un outillage adéquat robuste et ouvert, dont la caractéristique essentielle soit l'interactivité réelle: un jeu d'essais a été simulé à partir de divers dictionnaires bilingues locaux, dont le dictionnaire occitan-français de COUPIER (occitan alpin).
Cette collection de textes de dictionnaires en machine ne prend de sens que dans la perspective de
- la standardisation du dictionnaire unifié
- la normalisation de ce dictionnaire
- la constitution des dictionnaires personnels et temporaires en machine
- l'assistance à l'élève en situation de traduction, avec suivi des sessions de travail
Nom du projet lexicographique occitan déposé: PROLEXIS_version occitane
Directeur de la collection: Jean-Louis Fossat, Lidia Rabassa (projet N° 6 UMR CNRS/UTM)
Outils de traitement utilisés en mode exploratoire, pour la constitution des exercices didactiques:
• TACT
• NATUREL
• WORDPERFECT
• OLMES
• PROLEXIS (dictionnaires grammaticaux et orthographiques)
• LEXICO
• HYPERBASE (E. Brunet)
• Système expert ouvert (question étudiée avec le Centre de Ressources de l'Université Sabatier, Toulouse): LAVAC; PLS etc...
3.- DICTIONNAIRE ÉLECTRONIQUE OCCITAN UNIFIÉ SONORE/ÉCRIT UTILISANT LA DOCUMENTATION EXTRAITE DES ATLAS LINGUISTIQUES DU DOMAINE OCCITAN
DATA GASCON: Prumèra causida au 30/12/96
Disponible: échantillon du dictionnaire unifié pour 180 dictionnaires de localités formant 180 bases de données fusionnées en une base de données unique, avec opération de normalisation conduite sous DRAWCARTE_3 dans le cadre d'une base de données relationnelles.
L'accès peut se faire en réseau interne, en réseau Internet.
1° les data bruts sont dépêchés d'une part en direction de l'opération internationale du THESAURUS OCCITAN, pour exploitation dans un standard européen (coordinateur J.-Ph. Dalbéra Université de Nice)
2° les data sont disponibles dans le projet pédagogique concerté "OC", en réseau.
3° les datas sont disponibles en réseau:
- en tant que tels
- avec un ensemble d'outils et méthodes présentés ci-dessous pour la première fois: l'avant projet a été présenté en tant que tel au Conseil Régional de la région de Midi-Pyrénées (CCRD Programmes de recherche et transfert de technologie) et en direction du Ministère de l'Education nationale.
SECTION 2. OUTILS ET MÉTHODES
2.1 Présentation d'outils généraux d'exploitation didactique des bases de textes occitans
• TEXTGRAMM_OC couplé à LECGRAM_OCC (leçons et exercices) directeur de la collection: J.L. Fossat
Il s'agit d'une première anthologie de textes occitans, catalans, espagnols, italiens, etc... présentés avec des clés d'interrogation permettant l'utilisation d'exempliers insérés dans les leçons et exercices à concevoir dans un ordre souple..
• JEUXGRAMM_OC (J.-L. Fossat)
Il s'agit d'une première collection de jeux syntaxiques exploitant
- un conjugueur (en cours d'élaboration): phase préalable (1996)
- un dictionnaire d'expressions idiomatiques et figées (500O entrées)
- une méthode de représentation par jeux de graphes (jeux de représentation de la variation phonétique pertinente: -ADOR/-ADEIR)
- jeux de construction (morphologie nominale)
- jeux de conjugaison
- jeux d'exploration syntaxique pour la compréhension (randonnées syntaxiques)
- jeux d'écriture/prononciation
- jeux pour l'apprentissage de repères toponymiques: lecture de cartes à échelle XXX, sous la conduite du professeur de géographie, de Sciences naturelles, de Physique, de français (activités d'éveil):
Exemple: anar (X) a (Y, La Montelarié) en passar per (Z, La Bessonié) etc...; jeu de La Condamine; jeu du Chambon; le matériau de base utilisé est celui des documents historiques disponibles; jeu des bastidas, castèths etc... répondant à, une demande sociale etc ... (exemple jeu "Robes de bure et cottes de mailles Occitan Haute-Loire: J.L. Fossat 1996, avec révision à partir de Nauton 1974)
- jeux pour la correction "intelligente" des copies d'élèves: du CE au thème de CAPES Occitan: qui a commis le crime? Quelles sont ses caractéristiques (d'où est-il?): on fait ainsi appel aux connaissances, régulières ou à structure de données irrégulières (SDI), de l'élève expert.
OUTILS GÉNÉRAUX
• TACT
• NATUREL
• OLMES (B. HABERT): analyse syntaxique en grammaire locale
• ANALYSEZ (P. Bonnefois)
• ALCESTE (Max Reinert) et outils de même type facilitant l'indexation et la classification: STABLEX (A. Camlong Société Teknea Toulouse), par exemple
• DRAWCARTE_004.base (J.L. Fossat, J. M. Peytavi, Ch. Zafar, Th. Bousqué, Patrick Lescure)
• DBASE Prumèras causidas (J.L. Fossat, 1986); dictionnaires; atlas
• SYLLEX (Patrick Constant): analyseur syntaxique (grammaires locales)
• HYPERBASE (Etienne Brunet, U. Nice)
• DICO_2 (CEGOS): dictionnaire occitan, espagnol, portugais, italien etc... des s wagons passent 574 2 11nul ne connait les conditions du pauvre, que le pauvre lui meme 575 2 01 les conseils sont des cadeaux gratuits qui coûtent très cher a leurs bénéficiaires 577 2 81mieux vaut condamnation de médecin que de juge 578 2 01rien ne se donne si libéralement que les conseils 579 2 01les diamants ont leur prix, les conseils n'en ont pas 580 0 01ne consulte pas le médecin mais celui qui a été malade 581 0 01"pardon" ne guérit pas la bosse 582 0 01on ne trouve jamais meilleure convivialité.
On souligne que la constitution d'une équipe de recherche pédagogique implique l'acquisition par l'Établissement, de l'outillage pédagogique jugé opportun, adéquat, et approprié, trois conditions auxquelles doit satisfaire tout projet.
2.2 VERSION DIDACTICIEL COUPLÉ A DRAWCARTE_003: DRAWCARTE_004.base août 1996)
On décrira plus en détail en direction du groupe de formateurs la méthode DRAWCARTE_4 (juin-août 1996); cette méthode est issue de la recherche fondamentale sur contrat avec le CCRD de la Région Midi-Pyrénées (1991-1995): nous en sommes, en 1996, à la version DRAWCARTE_003, qui permet à toute équipe d'entrer en phase d'exploitation, avec sécurité (standard du Thesaurus occitan CEE DG XIII). On se référera, pour cela, au manuel d'utilisation écrit sous la co-responsabilité de C.Li.D (J.-L. Fossat) et Société Image, constructeur de DRAWCARTE, sur la base du cahier de charges écrit sous la responsabilité de C.Li.D (CLID/ENSICA 1991) cg. site
occiton@free.fr directoire ATLAS.
3. ATLAS GÉNÉRAL OCCITAN sous DRAWCARTE.BASE 004
4.- BASE ICONOGRAPHIQUE sous
occiton@free.fr CARTES FERIA
4.1. Documentation iconographique occitane générale
Elle est réalisée sous ADOBE_PHOTOSHOP ; les documents sont indexés en "grammaire de scènes" (textes descriptifs (Alsandouk 1990) et de format jpeg pour W3
4.2 L'ensemble de la documentation peut être importée dans la base drawcarte.base sous format PICT/JPEG ; sous format jpeg pour toutes applications générales (collection FERIA ercvox 2008/CLID et site
occiton@free.fr /2017)