SCHÉMA GÉNÉRAL ET OBJECTIFS
LINGUISTIQUES D’ANALYSE DE CORPUS DIALECTAUX OLR DATÉS ET LOCALISÉS
PROJET TEXTES SONORES
Cadre de projet occiton2 2010
Jean-Louis Fossat
Projet ERCVOX 2010 pour OCCITON2 2014_révision 2024
Une linguistique de corpus qui se constituerait « à l’écart du monde, des mondes », n’aurait à nos yeux aucun intérêt. Nous ne concevons de linguistiques de corpora qu’au service de la société, des sociétés. Que nos juges et évaluateurs soient rassurés sur ce point, de manière définitive.
OPERATION CLLE_erss axe OLR 2009 CORPUS DIALECTAUX MODERNES ET CONTEMPORAINS
Contribution sur axe du programme ERCVOX
ercvox.free.fr et
ercvox@free.fr*** *t 001 Que i èran quate maquinhons d’Auloron qui’us me volèn crompar. Que m’i ganhavi cent pistolas ! A. Peyroutet. Miratges, Reclams 1996, p. 38.
Ce fragment de corpus n’est pas numérisé. Il est court, mais représentatif.
*** *t002*t La pichona vielha. *o (origine) Miqueu Prat *t La pichona vielha *d 16 / 05 / 009
Una pechona vielha chaminava per charrièra tirassant doas sachas de bordilha gròssas, una dins chasca man.
L'una de las sachas èra traucaa e, de temps en quora, un bilhet de cent euros se'n eschapava e tombava au mitan de la charrièra.
Veient aquò, un policier l'aresta e li dis :
- "O, Dòna, bilhets de cent euros tomban d'aquèla sacha !
- "Mercé de me'n avisar, dis la pechona vielha. Me chau tornar recuperar aquestos bilhets. Encara mercé !
- "Un momenton, pas tant lèu !" fai lo policier : "D'onte sortissetz tot aquest argent ? L'avetz volat ! ?
- "O non !" responde la pechona vielha. "Vaquí ! lo terren qu'es darrier l'ostau serve d'estacionament a l'estadi de foot e, chasque còp que se joa e que los espectators vòlon eschampar d'aiga davant de dintrar o en sortissent de l'estadi, s'arestan davant aquestos aubrilhons que bordan ma maison e eschampan d'aiga sus las flors qu'avieu semenaas. Alora, m'escondo darrier los aubrilhons amb un parèu de cisèus e chasque còp que quauqu'un sorte son instrument per eschampar d'aiga, li diso : Dona-me cent euros o te lo copo !
- "Es pas una marria idea, d'aquela !" dis lo policier. "Alora, bòn astre !... Mas, disetz-me... que i a dins l'autra sacha ?
- "A ben !" responde la vielha, "sabetz, paian pas totes !"
Très court, ce fragment, à présent numérisé, est un fragment représentatif de script (et frame) de texte dialectal court.
*** *t003 corpus occitan alpin felibrenc *r J-Marc Courbet
FELIBRIGE - Lou Baile (Secrétaire Général) - Jan-Marc Courbet - "la Respelido" - camin de la rèino - 84500 Bollène - Tel : 04 90 30 41 39 -
http://www.felibrige.orgCars ami [ ],
Troubarés eici, en doucumen[] estaca[], lou resumi[] de la revisto “Le Felibrige” - numerò 252. Vous la mandan perqué dins aquesto revisto i’a d’enfourmacioun que troubarés pas aiours.
Se recebès dous cop[] o ... meme tres cop[] aquéu message, digas-me lou, moudificarai ma tiero d’adreisso[].
Se sias segur qu’aquéstis enfourmacioun[] vous interesson pas du tout, digas-me lou tambèn.
Emé mis amista[]
Dans sa brièveté, ce fragment est représentatif, sur objectif de détection d’indicateurs de localisation, de grammaire de propriétés.
CORPUS ÉCRITS D’ANCIEN OCCITAN EN PROSE
TEXTES JURIDIQUES
L’analyse des textes dialectaux romans (OLR) écrits en prose et diffusés, ou transcrits à partir d’une archive orale annotée et éditée, relève des méthodes utilisées en linguistique computationnelle (Chiari 2007).
Les méthodes utilisées sont les mêmes, qu’il s’agissent de textes anciens en prose (textes juridiques, cartulaires urbains et de communautés villageoises) ou de textes écrits modernes et contemporains. Seuls les corpus élaborés à partir d’une source orale et dialectale posent des problèmes spécifiques au traitement de l’oralité dans nos applications « particulières » ou « singulières ».
RECUEIL ET ACQUISITION DE CORPUS OLR REPRÉSENTATIFS
PREPARATION DU CORPUS
SEGMENTATION
- Séparateurs
- graphie
- phonétique
- phonologie
- morphologie
- syntaxe
- analyse énonciative de contextes organisés
INTERROGATION ÉLÉMENTAIRE
LISTE DE FREQUENCE, DENSITE
CONCORDANCES
ÉTIQUETAGE, PARSING
===
INTERROGATION AVANCÉE EDA
==
RÉSULTATS D’ANALYSE EXPLORATOIRE DE CORPUS DIALECTAL TRAITÉ EN ENVIRONNEMENT EDA
Représentation statistique
Représentation cartographique
OBJECTIFS
- analyse linguistique de corpora dialectaux
- analyse socio-historique des réseaux de sociabilité reliée à la problématique de la dialectalité et de l’interdialectalité
On observera que le schéma général d’exploitation de corpus étendus, représentatifs, ne diffère pas fondamentalement du schéma général de traitement de l’information dialectale recueillie sous format des atlas géolinguistiques.
Pour cette raison on ne pourra que s’étonner cependant de l’absence totale de mention aux instrumentations de caractère dialectal et géolinguistique dans les états de la question qui font le point sur la linguistique de corpus : linguistique à l’instrument et linguistes à l’instrument (Chiari 20007, Habert, TGE Adonis).
OBJECTIF : ANALYSE LINGUISTIQUE
CONCORDANCE d’unité lexicale OLR
BUGIA /BUGIARDO PROVERBES ITAL. Standard et dialectes
1. CONCORDANCE ELEMENTAIRE
• A forza di dire una bugia, si finisce col crederla una verità.
• Al bugiardo non è creduto il vero.
• Chi è bugiardo, è ladro e... goloso.
• Chi alle bugie, con le bugie fa scudo, copre con sottil rete un corpo ignudo.
• Chi comincia col mentire, finisce con l'ingannare.
• Chi mente ruba; e chi ruba, mente.
• Chi non sa dire bugie crede che tutti dicano la verità.
• Chi sempre mente, vergogna non sente.
• Chi si fida in bugia, col ver perisce.
• Chi tollera il mentire, insegna a rubare.
• Costa poco prometter con parole, a chi promesse mantener non vuole.
• Credesi il falso al verace, negasi il vero al mendace.
• Dal bugiardo mi guardi Iddio, perché non me ne posso guardar io.
• Dio ti guardi da bugia d'uomo per bene.
• E meglio il vero rusticamente dire, che civilmente mentire.
• E più facile acchiappare un bugiardo che uno zoppo.
• Fai parlare un bugiardo e l'hai colto.
• I bugiardi giurano più volentieri che gli altri.
• I bugiardi non sono creduti neanche quando dicono la verità.
• Il diavolo è il padre della menzogna.
• La bugia è come la valanga: più rotola e più s'ingrossa.
• La bugia è madre dell'inganno.
2 CONCORDANCE AVANCEE DE TYPE ITER VISTA
1 Chi è bugiardo in una cosa, è bugiardo in tutte.
2 Chi è bugiardo è ladro.
3 Da principe bugiardo libera nos, Domine.
4 Il bugiardo conosciuto (o chi per bugiardo è conosciuto), da nessuno è mai creduto.
5 Il bugiardo deve avere buona memoria.
6 Quand'uno per bugiardo è conosciuto, anche se dice il ver non è creduto.
3. CONCORDANCE AVEC THESAURUS RELATIONNELSans analyse phonétique, phonologique, morphologique, syntaxique, sémantique, énonciative, ni traduction.
PAROLE PROVERBI (In blu le parole cliccabili)
BOVI 1 Natale in venerdì, vale due poderi: se viene in domenica, vendi i bovi e compa la melica.
2 Quando piove alla buon'ora, prendi i bovi, va e lavora.
BRACCIA 1 Donna che ti stringe e le braccia al collo ti cinge, poco t'ama e molto finge, e nel fine ti abbrucia e tinge.
2 I poveri hanno le braccia corte.
3 Quando le braccia lavorano assai, l'immaginazione riposa.
4 Quattrini e amicizia rompon le braccia alla giustizia.
BRACCIO 1 Chi non ha amico o germano, non ha forza in braccio né in mano.
2 Si presta l'armi, ma non il braccio.
BRACCO 1 Chi non può esser levriero, s'ingannò d'esser bracco.
BRACE 1 Sotto la bianca cenere, sta la brace ardente.
BRACHE 1 A' sottili cascan le brache.
2 All'escita, brache e camicia; e all'entrata, la rocca è inconocchiata.
3 Brache, tela e meloni,di settembre non son più buoni.
4 Chi ha paura, si guardi le brache.
5 Chi non è uso a portar le brache, le costure gli danno noja.
6 I denari son come le brache degli stufaioli; cuoprono le vergogne.
7 Le brache all'uomo, e alla donna il camiciotto.
BRACHETTA 1 Il buono ufficiale vuol aver due cose, mano larga e brachetta stretta.
BRAMA 1 Chi ha buona fama, ha ciò che brama.
2 Chi non dà quello che ama, non riceve quello che brama.
3 Chi più brama, più s'affanna.
4 Mamma, mamma, chi l'ha la chiama e chi non l'ha la brama.
BRAMARE 1 Giammai col bramare, il sacco puoi colmare.
BRAMATO 1 Più da noi è bramato, chè più ci vien negato.
BRAME 1 Il solo cibo può appagar le brame, di chi per lunga inedia ha molta fame.
BRAMEGGIA 1 Chi signoreggia, brameggia.
L’intérêt de cette base (xeb sémantique, interrogation avancée) sur site référencé en source ouverte est de pouvoir accéder à la base étendue en totalité et procéder à une interrogation systématique élémentaire ou avancée de la banque numérique accédée.