ETAT DES LIEUX AU 10 juillet 2021 DESCRIPTION DOCUMENTAIRE DES FONDS D'ARCHIVES SONORES NUMERISEES DU CENTRE DE LINGUISTIQUE ET DIALECTOLOGIE (CliD) DE L'UNIVERSITE DE TOULOUSE II LE MIRAIL (1963-2001)
Dernière version: 10 juillet 2021
Les documents d'enquêtes linguistiques ont déjà fait l'objet d'un catalogage documentaire préalable qui permet d'accéder aux fonds auteurs. Notre description documentaire actuelle a pour premier objectif de cataloguer les fonds numériques, déposés ou non, en spécifiant la nature des identifiants, pour les fonds documentaires accessible sous forme brute dans un dispositif analytique qui prend en compte la nature des données. Les fonds ont été numérisés par la société MIDIS, Toulouse et A. Meqquri de 1990 à 2020 LES IDENTIFIANTS DE DONNEES SONORES NUMERIQUES - clé domaine linguistique - clé de localisation - clé de datation - clé auteur de l'enregistrement - clé témoins.informateurs/région_localités - clé type d'information - clé méthode de recueil de données - clé méthodes d'analyse de données.
CLE DOMAINE LINGUISTIQUE DE DONNEES SONORES NUMERIQUES - domaine occitan (partition spécifiée) - domaine français (partition spécifiée) - domaine de contact de langues - domaine des parlers français ,d'oïl - domaine ibéro-roman et Amérique Latine - domaine créolistique (Cabo Verdo, ...)
CLE METHODES DE RECUEIL DE DONNEES SONORES NUMERISEES 1.- questionnaire dialectal de type atlas (Q/R lexique/morphosyntaxe) - données brutes (carnets, minutes) - données transcrites (minutes de transcription) - données analysées - données cartographiées
2 Type corpus-parole bruts ou fragmentés, transcrits ou non, édités ou non - traduction français-occitan - lecture de document occitan - enregistrement en laboratoire - conversation dirigée, semi-dirigiée, dialogues, récits, communication parlée, corpus_parole. Ce dernier type permet alors une observation des propriétés prosodiques, rythmiques et intonatives de la parole ordinaire ou graduellement élaborée (hauteur, durée, débit, intensité etc.)
CLE METHODES D'ANALYSE LINGUISTIQUE DE DONNEES SONORES NUMERIQUES Le second objectif est de construire un dispositif d'écoute (station d'écoute du son associé à une transcription graphique et partiellement phonétique, avec annotation par clés; l'objectif est ici de faciliter la reconnaissance des formes et la compréhension de l'oralité. 1 Analyse de données de type 1 (atlas linguistique NALF) - fouille de données carnets/minutes - fouille de données cartes primaires - méthodes d'analyse exploratoire de données (ADA/AED) - classification hiérarchique non floue/floue - analyse de variabilité/dictionnaire de variables - cartographie distributionnelle - cartographie de classes non floues/floues 2 Analyse exploratoire de données brutes du type2 CORPUS_PAROLE - notice documentaire - écoute systématique - perception et reconnaissance des formes exactes (%apories:?????) - compréhension - traduction - transcription - imitation/reproduction - apprentissage Exemple 3GZ01 face 1 81 Carmaux (Annexe 1)
3 Dispositif d'analyse linguistique de formes sonores reconnues - dictionnaire de variables phonétiques - dictionnaire de variables phonologiques - dictionnaire de variables syntaxiques - dictionnaire de variables morphologiques - dictionnaire de variables lexicales, lemmatisées ou non
4 Dispositif d'analyse prosodique, rythmique, intonative - +praat - +winpitch - +toby
5 DONNEES SONORES NUMERIQUES ET VISUALISATION DE SCENE - fichier son N°001 - image N°001
Il ne sera pas ici question des méthodes d'analyse sémiotique, pragmatique, praxématique, stylistique, et pas davantage des méthodes d'analyse du discours, et pas davantage des méthodes d'analyse quaititative des textes écrits indexés Exemple: archive sonore LESPIGNAN (occitan médirerranéen; texte édité indexé, mais non classifié (L. Jagueneau). Dans cette perspective, tout texte écritt indexé peut être traité en analyse exploratoire soit des formes, soit des contenus, dans le cas où le recours à ces méthodes paraît fondé. +hyperbase +stablex +alceste Exemple: iconographie GZ81/01 CARMAUX Exemple: collection FERIA (CliD) Exemple Bruno-Besche Commenge.- La création du Biur (à paraître)
ANNEXES
ANNEXE 1 FICHIER_TEXTE TYPE POUR BASE_DONNEES ARCHIVE NUM SON_wave INDEX_LOC INDEX_DATE INDEX CLES THEMATIQUES INDEX_TEXTE001 fragment correspondant à fragment sonore 001 INDEX CLES GRAMMAIRE IDENTIFIANT DOCUMENTAIRE Ordre référence LOC datation MCL CONTEXTE MLC grammaire/lex_gram Identifiant 001 81 CARMAUX Commune de Rosières 27.12 1975 HISTOIRE SOCIALE_MINE LANGUE: occitan/languedocien du Carmausin 00:01-00:26 txt001 @enquista sus lo trabalh del cròs entre 1920 e 1950, ont se contunha mas non s'acaba la discutida; enregistrament fach a Las Bascanhas , comuna de Rosièiras lo 22 de dezembre de 1975@ coefficient_dépatalisation_L/coda/trabalh coefficient_rhotacisme/SB/rB/Las_Bascanhas coefficient_palatalité/TS/enregistrar/fach coefficient_palatalité/λ/Cadilhac coefficient_voisement/decembre coefficient_gémination/sus lo coefficient_palatalité/ts/t∫/fait/fach S_implosif/las bascanhas/dos de Noyau_lourd/jèj/Rosièiras déassociation_palatalité/coda/trabalh/trabal désassociation/T/NT/ont Feature Geometrie Prosodie
&Las Bascanhas& &Rosièiras& &trabalh del cròs& 3GZ face2 Fragment 001 annonce DUREE 00:01 - 00:26 Fonds Daniel Gonzalez [C81 01 face 2 vitesse-19] NUM_archive_sonore/CliD/UTM2 Enregistrement: Daniel Gonzalez Vi_19 UHER Témoins: 1 M. Cadilhac; 2 M. Castanhièr Dépôt: AM_CARMAUX mars 2017 0002 81 CARMAUX Commune de Rosières 1975 Entre bornes@ et @ on a saisi le texte tel que saisi par D.Gonzalez 1977 Tome 1 @textes sul trabalh del cròs@ voire modifié le cas échéant Le tout sera déposé au 30 mars 2017 aux archives municipales de Carmaux par TRANSFER pour accès totament libre sur site AM Carmaux 1° le fichier son total exemple 3GZ face1/face 2 tel quel sans annotation aucune 2° un fichier fragments longs annotés selon le schéma ci-dessus qui se compose de deux fichiers - fichierSON001 = fragment son N° 001 – de taille MIN/MED/MAX) exemeple 001-026 - fichier texte001 correspondant au fichier son001 _ de taille MIN/MED/MAX zone balisée &&&&& index lexical &pè-dret & / &Las_Bascanhas& / &Rosièiras& zone balisée @@@ index de fragments CONTEXTES de durée MAX_n minutes ( de longueur variable en fonction du contenu: ni trop court, ni trop long) Exemple fragment lexical indexable &pè-dret/pèdre(ch)& &vena_A& &bèla& &Las_Bascanhas& &Rosièiras& &trabalh del cròs&
Exempe de fragment CONTEXTE sonore transcrit (non traduit/traduit) @enquista sus lo trabalh del cròs entre(datas), ont se contunha mes non s'acaba la discutida; enregistrament fach a Las Bascanhas , comuna de Rosièiras lo 22 de dezembre de 1975@ ZONE INSECABLE
ANNEXE 2
FICHIER_TEXTE TYPE POUR BASE_DONNEES IMAGES CARNETS/CARTES +/-forme sonore en parallèle
Ordre référence LOC DATATION MCL Origine juridique 0001 Atlas_Landes/Lalanne-1950 1950 LEXIQUE questionnaire_DAUZAT carnets_num/Lalanne-1950 Q_293 borne bòrna bonda tèrmi/termièra néologie_FRA/limita coefficient_RN/ND/ METHODES_recueil_données IMPORT_data EXPLOR_data/carnets/cartes_Lalanne EXPLOR_archive_sonore/numérique/Lalanne SPECIMEN_cartes Humanistic data collection and interpretation Data pre-processing Fouille_données/Data_Miner classification techniques treillis Fuzzy modeling Linguistic Data Mining Data visualisation techniques Speech ans Audio Data Processing 0002 Atlas_Landes/Lalanne-1950 1950 NALF_ALG/CNRS fonds_JeanSEGUY/ALG123/carnets/maquettes/cartes REF_base_données/carnets/4Dquadra/ALG123 archive_num_carnets/CliD SPECIMEN
|