ERCVOX

Forum du CLiD
Nous sommes actuellement le 28 Mars 2024, 21:36

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 12 Jan 2019, 10:13 
Hors-ligne
Administrateur

Inscrit(e) le : 26 Jan 2009, 15:06
Message(s) : 137
Vous trouverez ci-dessous Herment-1398.doc le texte annoté de la base de données juridiques HERMENT 1398 (scripta cantalienne); ce texte annoté vient enrichir, pour analyse comparative, la base de textes juridiques gascons et languedociens accessibles aux opérations de fouille de données sur le site occiton.free.fr
LA BASE DE TEXTES JURIDIQUE OCCITANS HERMENT [1398-1399] T01A/T01B

RESUME
Le projet pensé et formulé dès les années 1980 consiste à explorer la documentation juridique ancienne des territoires méridionaux (Aquitaine, Midi-Pyrénées, Languedoc-Roussillon, Massif Central), avec priorité accordée à la scripta occitane, interrogée à l'aide de clés de requête d'ordre linguistique et historique.
Le projet est centré sur l'acquisition de connaissances à partir de la fouille systématique de données annotées aussi systématiquement que possible, et ne consiste absolument pas une pratique d'éddition numérique exhaustive de textes juridiques anciens non annotés linguistiquement.
On considère les faits de langue comme produits géolocalisés, soumis à représentation par cartographie décisionnelle, à partir d'une fouille de connées facilitée par les opérations de multiindexation
Responsables de la base:
Linguistique: Jean-Louis Fossat (annotation, clés de requête, traitement, analyse exploratoire de données, cartographie, ade l a la représentation cartographique/géodécisionnelle)_
Informatique/ A. Meqqori.

1.- LA SCRIPTA ET LA PHONONOLOGIE DE L'ORAL OCCITAN DE TYPE CANTALIEN REGIME LANGAGIER
Le texte atteste le croisement de plusieurs plans de scripta en situation de coexistence, avec faits de dominance analysables par les calculs classiques de probabilité sur des données étendues: le calcul sur 100 items n'offre pas nécessairement la garantie d'étendue suffisante; Hermenc n'est qu'une des pièces de la base de données de l'occitan de type cantalien:
- scripta de Clermont-Ferrand (métropolitaine)
- scripta de Limagne
- Scripta de Combrailles
- scripta de Bourbonnais
- scripta limousine aux frontières de l'Auvergne et du Limousin
Ce seul fait saillant, - organisation en plusieurs plans simultanés de la phonologie, de la morphosyntaxe, en rapport avec les théories et modèles de marquage et les théories des traits délimités marqués/non marqués dans l'organisation du lexique, mérite à lui seul toute notre attention.
Comparatisme
Pour la dimension comparative, on confrontera ces fonds avec le fonds d'ALBI, REQUISTA, BIOULE, CAHORS, ST-PONS, RISCLE, OSSAU, MARMANDE etc., la documentation occitane de Meyer (diverses scripta du domaine méridional: Pau, Bordeaux, Cahors etc.) ainsi que la documentation de Luchaire; comment ne pas voir, en 2019, dans la figure de Ake Grafström, l'ancêtre prototypique d'une telle base de données de l'ancien occitan juridique?
Les sources textuelles à consulter pour l'analyse linguistique sont les Chartes de Basse-Auvergne, publiées par Paul Porteau (12ème et 13ème s.). ; les journaux de Guillem de Mérol, publies par A. Charbonnier (début du 15ème s.)

LE DISPOSITF OCCITON-2018 PAR RAPPORT A LA BASE GALLICA de la BNF 2018
Un linguiste qui consulte dans la base GALLICA de la BNF des textes d'ancien occitan, se trouve confronté à deux catégories de documents:
1° les documents bruts, pour accès historique: c'est le cas du Petit Thalamus de Montpellier.
2° les documentx textuels associés à un dictionnaire des entrées de langue occitane, référencées: c'est le cas des Comptes Consulaires d'Albi ou des Comptes Consulaires de Riscle (1441-1447).
Dans ces conditions dès les années 8O (1980) nous avons pensé et décidé un programme d'annotation systématique de ces corpus, afin de répondre aux exigences de l'analyse linguistique proprement dite, incluant les axes Phonétique/Phonologie/Morphologie/Syntaxe et Sémantique/analyse énonciativiste.
Ces clés de requête viennent enrichir l'accès par index lexicaux et l'accès par catégories historiques et juridiques.
Un des premiers documents retenus pour cette analyse en mode exploratoire fut le corpus cantalienn occitan d'HERMENT.l.
L'intérêt du dispositif OCCITON2018, fruit d'une lente évolution (1980-2018), réside dans son caractère unificateur: il traite aussi bien la matière des atlas linguistiques que des dictionnaires, des textes anciens et modernes: ainsi la base CHAVANAT (nord_occitan CREUSE, base de textes modernes et contemporains de caractère ethnographique.

2.- METHODES DE TRAITEMENT EN LINGUISTIQUE DE CORPUS.
Rappel.
S'agissant des outils de l'analyse comparative, on aura recours aux outils classiques d'indexation et concordance, à des fins d'exploration statistique aux différents plans de l'organisation. On regardera avec l'oeil "du pauvre" les outils des nouveaux riches de la science contemporaine (bases de données CORPUS_textes, outils classificatoires, y compris réseaux neuronaux, outils de la recherche nucléaire etc..
Autrement dit l'objectif initial était et reste la création, en mode exploratoire d'une base de données de textes occitans anciens ou moderne. 1° mettre un module de FRANTEXT au service des textes occitans sur le modèle du travail jadis effectué par Jean-Louis ARTIS, puis Y. HAMON (INaLF, URL8) 2° exporter les textes occitans de la base en direction des divers outils d'exploration statistique en local 3° créer l'interface INTERNET: ceci constitua un programme de travail important, à financer à hauteur des résultats acquis, pour le compte de l'opération 6 (ERSS_CliD) du laboratoire ERSS. lors sa création . Le laboratoire InaLF pouvait contribuer à cette opération dans la mesure où, de fait, la documentation ancienne à traiter était multilingue: latin (Gimont), occitan, puis français des institutions (langue formelle).

3.- LES MANUSCRITS
Il n'entre pas dans notre projet de collationner tous les manuscrits; en revanche tout projet sérieux d'envergure, est, à terme, appelé à produire, par texte, une sélection de folios attestant des habitudes graphiques qui caractérisent le texte en question, à raison de 1/10 f°; c'est la proportion suivie par Cantalausa dans son édition des textes d'ancien occitan de REQUISTA (base REQUISTA); c'est une des missions des équipes de recherche scientifique en linguistique de corpus, à terme, que de faciliter ainsi l'accès à des documents anciens de la France méridionale d'une fiabilité maximale, sous forme réutilisable, avec annotation minimale. Les textes explorés à première phase exploratoire furent les textes occitans de nature juridique édités par François Baby (Montsaunès), P. Tucoo-Chala (Ossau, Orthez), et Ourliac (Chartes de l'Agenais) ; Bioule ( M.T; Morlet, éd. Jean-Claude Dinguirard (Via Domitia). Le développement ultérieur a porté sur les chartes de MARMANDE, ST_GAUDENS, ALBI, REQUISTA , RISCLE, ST-PONS etc.
On tient à spécifier que le recours aus manuscrits à partir des textes édités constitue une obligation d'ordre historique et juridique sine qua non, pour les historiens, et linguistes.

4._ LANGUE FORMELLE: COMPTABILITE ET ARITHMETIQUE FINANCIERE INSTITUTIONNELLES: REGIME D'EXPERIENCE/REGIME POLITIQUE
Cette rubrique est, en principe du ressort de l'historien des institutions financières; le philologue linguiste se limite à l'établissement de l'analyse grammaticale des unités telles que restas=Vn_restar " ce qui reste de" et du rapport de restas à reyratges "arriéré" (ce qui reste à payer de); l'analyse historique facilite la compréhension , donc la traduction exigible.
Pour explorer ce champ on a proposé le recours à un index de clés de requête propres à ce domaine; par exemple: (dépenses/recettes/arriérages).

5.- INTÉRÊT DIALECTAL/REGIME LANGAGIER
L'analyse dialectale concerne la description phonologique, la phonétique historique, la morpholohie catégorielle et la syntaxe. A cela s'ajoute la tâche lexicographique exigée par la traduction.
Exemple: agro, begro, formes oxytoniques de PT6 témoignent d'un mouvement de réduction des structures syllabiques par rapport aux formes antérieures trisyllabiques attendues: aver_aguero, beure_beguero, despendre_deypendero.
Les clés de requête de caractère linguistique sont indexées sur le format sui suit:
*ph requêtes phonétiques/phonologiques
*m requêtes morphologiques
*s requêtes syntaxiques
*l lexique
Nous ne faisons ici que suivre les méthodes de travail des linguistes et juristes romanistes de Clovis Brunel à Cierbide, en passant par A. Graafstrom, Montfrin etc...
Le projet a pour objectif de répondre aux demandes les plus simples de xeux qui veumlent accéder aux textes électtroniques valides, et en même temps aux requêtes plus analytiques de ceux qui veulent accéder aux ressources par clés de requêye analytiques, ce qui suppose une annotation de type HTML simplifié.
Le texte annoté est traité dans le contexte des applications occiton.free.fr, ans un répertoire ancien occitan/textes juridiques.

6 LES INDEX

INDEX LEXIQUE
IDEX CLES REGIME D(EXPERIENCE ()
INDEX_REGIME LANGAGIER []
INDEX DECICOGRAPHIQUE $.....$
INDEX CONTEXTES/FRAGMENTS /...../ suites synbtaxiques ( pour requêtes sur concordancier

REFERENCE BIBLOOGRAPHIQUE
*d 1398-1399 *loc HERMENT AUVERGNE *t Livre des comptes des consuls d'Herment (1398-1399), publié dans AM 1902 (A. Dauzat et Ambroise Tardieu); reprint par Cercle occitan d'Auvergne 63037 Clermont-Ferrand collection Notre Patrimoine 3, 1976, 42 pp. (texte, traduction, glossaire).- 100 items (langue: ancien occitan); annotation J.L. Fossat 2018

FORMAT DES INDEX DE CLES
*ph CONTROL_ej/er/ier DIPHTONGUE -eyrz = eir + s < -ARIU VA premeyrament VA Rocgeyrs VA Boeyr (Boyer NP) VA Relheyr NP VA maneyra VA Bergeyrs NP VA papeyr VA Blancheyrs NP VA Faugeyras NP *ph viala=vila VPONT
*m sec=IP3_seguir
*ph CONTROL_jt meyter, fayta
*ph CONTROL_js traysa, creyser
*ph CONTROL_ers meyters
*l mescabar se méprendre
*ph CONTROL_sk/_jts meychabar
*ph CONTROL_stj meyters (mestiers) VA notre (nostre)
*ph CONTROL_di (dyta dyt = dita / dit; soit pure enjolivure; soit plutôt annotation de l'amorce de trace palatalisante de suite [di] en occitan cantalien ( V. èga blanca LJ 1977, 1978)
*m mezarat=PPm_meserrar
*ph CONTROL_palatalité/dz/ts/Pongibaus
*ph CONTROL_[a+rfort]
*ph CONTROL_t mearat, meychabat
*ph CONTROL_aw Audebrant, Pongibaus
*ph CONTROL_ay traysa, fayta
*ph CONTROL_ej creyser, meyters
*s CONTROL annotation syntaxique et sémantique
*l lexique


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 1 invité


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr