ERCVOX

Forum du CLiD
Nous sommes actuellement le 20 Jan 2022, 02:32

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 12 Juil 2021, 15:26 
Hors-ligne
Administrateur

Inscrit(e) le : 26 Jan 2009, 15:06
Message(s) : 131
ETAT DES LIEUX AU 10 juillet 2021
DESCRIPTION DOCUMENTAIRE DES FONDS D'ARCHIVES SONORES NUMERISEES DU CENTRE DE LINGUISTIQUE ET DIALECTOLOGIE (CliD) DE L'UNIVERSITE DE TOULOUSE II LE MIRAIL (1963-2001)

Dernière version: 10 juillet 2021

Les documents d'enquêtes linguistiques ont déjà fait l'objet d'un catalogage documentaire préalable qui permet d'accéder aux fonds auteurs.
Notre description documentaire actuelle a pour premier objectif de cataloguer les fonds numériques, déposés ou non, en spécifiant la nature des identifiants, pour les fonds documentaires accessible sous forme brute dans un dispositif analytique qui prend en compte la nature des données.
Les fonds ont été numérisés par la société MIDIS, Toulouse et A. Meqquri de 1990 à 2020
LES IDENTIFIANTS DE DONNEES SONORES NUMERIQUES
- clé domaine linguistique
- clé de localisation
- clé de datation
- clé auteur de l'enregistrement
- clé témoins.informateurs/région_localités
- clé type d'information
- clé méthode de recueil de données
- clé méthodes d'analyse de données.

CLE DOMAINE LINGUISTIQUE DE DONNEES SONORES NUMERIQUES
- domaine occitan (partition spécifiée)
- domaine français (partition spécifiée)
- domaine de contact de langues
- domaine des parlers français ,d'oïl
- domaine ibéro-roman et Amérique Latine
- domaine créolistique (Cabo Verdo, ...)

CLE METHODES DE RECUEIL DE DONNEES SONORES NUMERISEES
1.- questionnaire dialectal de type atlas (Q/R lexique/morphosyntaxe)
- données brutes (carnets, minutes)
- données transcrites (minutes de transcription)
- données analysées
- données cartographiées

2 Type corpus-parole bruts ou fragmentés, transcrits ou non, édités ou non
- traduction français-occitan
- lecture de document occitan
- enregistrement en laboratoire
- conversation dirigée, semi-dirigiée, dialogues, récits, communication parlée, corpus_parole.
Ce dernier type permet alors une observation des propriétés prosodiques, rythmiques et intonatives de la parole ordinaire ou graduellement élaborée (hauteur, durée, débit, intensité etc.)

CLE METHODES D'ANALYSE LINGUISTIQUE DE DONNEES SONORES NUMERIQUES
Le second objectif est de construire un dispositif d'écoute (station d'écoute du son associé à une transcription graphique et partiellement phonétique, avec annotation par clés; l'objectif est ici de faciliter la reconnaissance des formes et la compréhension de l'oralité.
1 Analyse de données de type 1 (atlas linguistique NALF)
- fouille de données carnets/minutes
- fouille de données cartes primaires
- méthodes d'analyse exploratoire de données (ADA/AED)
- classification hiérarchique non floue/floue
- analyse de variabilité/dictionnaire de variables
- cartographie distributionnelle
- cartographie de classes non floues/floues
2 Analyse exploratoire de données brutes du type2 CORPUS_PAROLE
- notice documentaire
- écoute systématique
- perception et reconnaissance des formes exactes (%apories:?????)
- compréhension
- traduction
- transcription
- imitation/reproduction
- apprentissage
Exemple 3GZ01 face 1 81 Carmaux (Annexe 1)

3 Dispositif d'analyse linguistique de formes sonores reconnues
- dictionnaire de variables phonétiques
- dictionnaire de variables phonologiques
- dictionnaire de variables syntaxiques
- dictionnaire de variables morphologiques
- dictionnaire de variables lexicales, lemmatisées ou non

4 Dispositif d'analyse prosodique, rythmique, intonative
- +praat
- +winpitch
- +toby

5 DONNEES SONORES NUMERIQUES ET VISUALISATION DE SCENE
- fichier son N°001
- image N°001

Il ne sera pas ici question des méthodes d'analyse sémiotique, pragmatique, praxématique, stylistique, et pas davantage des méthodes d'analyse du discours, et pas davantage des méthodes d'analyse quaititative des textes écrits indexés
Exemple: archive sonore LESPIGNAN (occitan médirerranéen; texte édité indexé, mais non classifié (L. Jagueneau).
Dans cette perspective, tout texte écritt indexé peut être traité en analyse exploratoire soit des formes, soit des contenus, dans le cas où le recours à ces méthodes paraît fondé.
+hyperbase
+stablex
+alceste
Exemple: iconographie GZ81/01 CARMAUX
Exemple: collection FERIA (CliD)
Exemple Bruno-Besche Commenge.- La création du Biur (à paraître)

ANNEXES

ANNEXE 1
FICHIER_TEXTE TYPE POUR BASE_DONNEES ARCHIVE NUM SON_wave
INDEX_LOC
INDEX_DATE
INDEX CLES THEMATIQUES
INDEX_TEXTE001 fragment correspondant à fragment sonore 001
INDEX CLES GRAMMAIRE
IDENTIFIANT DOCUMENTAIRE
Ordre référence LOC datation MCL CONTEXTE MLC grammaire/lex_gram Identifiant
001 81 CARMAUX
Commune de Rosières
27.12
1975 HISTOIRE SOCIALE_MINE
LANGUE: occitan/languedocien du Carmausin
00:01-00:26 txt001
@enquista sus lo trabalh del cròs entre 1920 e 1950,
ont se contunha mas non s'acaba la discutida;
enregistrament fach a Las Bascanhas ,
comuna de Rosièiras lo 22 de dezembre
de 1975@
coefficient_dépatalisation_L/coda/trabalh
coefficient_rhotacisme/SB/rB/Las_Bascanhas
coefficient_palatalité/TS/enregistrar/fach
coefficient_palatalité/λ/Cadilhac
coefficient_voisement/decembre
coefficient_gémination/sus lo
coefficient_palatalité/ts/t∫/fait/fach
S_implosif/las bascanhas/dos de
Noyau_lourd/jèj/Rosièiras
déassociation_palatalité/coda/trabalh/trabal
désassociation/T/NT/ont
Feature Geometrie
Prosodie

&Las Bascanhas&
&Rosièiras&
&trabalh del cròs& 3GZ face2
Fragment 001 annonce
DUREE 00:01 - 00:26
Fonds Daniel Gonzalez [C81 01 face 2 vitesse-19]
NUM_archive_sonore/CliD/UTM2
Enregistrement: Daniel Gonzalez Vi_19 UHER
Témoins: 1 M. Cadilhac; 2 M. Castanhièr
Dépôt: AM_CARMAUX mars 2017
0002 81 CARMAUX
Commune de Rosières
1975
Entre bornes@ et @ on a saisi le texte tel que saisi par D.Gonzalez 1977 Tome 1 @textes sul trabalh del cròs@ voire modifié le cas échéant
Le tout sera déposé au 30 mars 2017 aux archives municipales de Carmaux par TRANSFER pour accès totament libre sur site AM Carmaux
1° le fichier son total exemple 3GZ face1/face 2 tel quel sans annotation aucune
2° un fichier fragments longs annotés selon le schéma ci-dessus qui se compose de deux fichiers
- fichierSON001 = fragment son N° 001 – de taille MIN/MED/MAX) exemeple 001-026
- fichier texte001 correspondant au fichier son001 _ de taille MIN/MED/MAX
zone balisée &&&&& index lexical &pè-dret & / &Las_Bascanhas& / &Rosièiras&
zone balisée @@@ index de fragments CONTEXTES de durée MAX_n minutes ( de longueur variable en fonction du contenu: ni trop court, ni trop long)
Exemple fragment lexical indexable
&pè-dret/pèdre(ch)&
&vena_A&
&bèla&
&Las_Bascanhas&
&Rosièiras&
&trabalh del cròs&

Exempe de fragment CONTEXTE sonore transcrit (non traduit/traduit)
@enquista sus lo trabalh del cròs entre(datas), ont se contunha mes non s'acaba la discutida; enregistrament fach a Las Bascanhas , comuna de Rosièiras lo 22 de dezembre de 1975@ ZONE INSECABLE

ANNEXE 2

FICHIER_TEXTE TYPE POUR BASE_DONNEES IMAGES CARNETS/CARTES +/-forme sonore en parallèle

Ordre référence LOC DATATION MCL Origine juridique
0001 Atlas_Landes/Lalanne-1950 1950 LEXIQUE
questionnaire_DAUZAT
carnets_num/Lalanne-1950
Q_293 borne
bòrna
bonda
tèrmi/termièra
néologie_FRA/limita
coefficient_RN/ND/
METHODES_recueil_données
IMPORT_data
EXPLOR_data/carnets/cartes_Lalanne
EXPLOR_archive_sonore/numérique/Lalanne SPECIMEN_cartes
Humanistic data collection and interpretation
Data pre-processing
Fouille_données/Data_Miner
classification techniques
treillis
Fuzzy modeling
Linguistic Data Mining
Data visualisation techniques
Speech ans Audio Data Processing
0002 Atlas_Landes/Lalanne-1950 1950 NALF_ALG/CNRS
fonds_JeanSEGUY/ALG123/carnets/maquettes/cartes
REF_base_données/carnets/4Dquadra/ALG123
archive_num_carnets/CliD
SPECIMEN


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 1 invité


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr