ERCVOX

Forum du CLiD
Nous sommes actuellement le 20 Avr 2024, 10:40

Le fuseau horaire est UTC+1 heure




Publier un nouveau sujet Répondre au sujet  [ 1 message ] 
Auteur Message
MessagePublié: 10 Oct 2007, 14:01 
Hors-ligne
Administrateur

Inscrit(e) le : 14 Avr 2005, 17:44
Message(s) : 373
NUMERISATION 2000 IRELF:THESOC + MSH
HERITAGE CULTUREL DIGI_CULT
LIBRAIRIES DIGITALES
COLLECTIONS INVENTORIEES

Envoyé par: FOSSAT JL ERSS PATRIMOINE LANGAGIER (stci-hurvois.univ-tlse2.fr)
Date: Lundi, 3 Juillet 2000, ˆ 6:04

THESOC_IRELF_2000 NUMERISATION

DOMAINE CONCERNE : OCCITAN LANGUES CONCERNEES: OCCITAN, FRANÇAIS REGIONAUX DE CE DOMAINE GENESE DU PRE_PROJET (1997-2000)
ETAT DE LA QUESTION THESOC (septembre 2000, Journées ERSS d'Aspet, L. Molinu, Guilaine Brun Trigaut, Lidia Rabassa, JL Fossat et alii) OBJECTIFS: PATRIMOINE LANGAGIER, IDENTITES LANGAGIERES, IDENTITES LOCALES PREREQUIS: NUMERISATION DE L'EXISTANT (DIFFUSION, SERVEUR)
INSTITUTIONS IMPLIQUEES UTM CNRS (IRELF: THESOC) MSH REGION (CR_MIP, atlas patrimonial Midi-Pyrénées, identités locales) CEE: Société de l'Information Conviviale

CATEGORISATION ET SUB_CATEGORISATION DES OPERATIONS DU PROGRAMME THESOC IMPLIQUANT PRIORITE, ET SELECTION PAR ORDRE DE PIORITE

THESOC est une banque de données dialectales, qui a vocation à regrouper, centraliser des bases éparses, voire centrifuges, par méthode d'importation-exportation, avec cahier de charges opérationnel (base 4D version 4, 5, 6, 7 entre 1997 et 2000, avec évolutivité, agilité, souplesse, flexibilita, comme on le dit). Ces données sont toutes des données localisées, à numériser, pour poursuivre l'exploration du rapport entre LANGUE (niveau supra-local) et PRODUCTION DES IDENTITES LOCALES (contrastes de surface, notamment)

OPERATION DE NUMERISATION N° 1 SAISIE DU POLYMORPHISME LOCAL, CLASSES DE DENSITE, RESIDUS - SAISIE FRAGMENT "TABLES" [JL Fossat 2000]
Origine du document électronique créé: alg6_tables Crédit auteur @ Jean Séguy, dans le cadre d'une opération demandée de VERIFICATION, en méthode descendante (on peut aussi opter pour une méthode ascendante, en place de cette méthode descendante)
• Création des Enregistrement des tableaux de données binaires (1978) ALG6C P1 P2 M3 V4 L5 crédit auteur : @ J.-L. Fossat, N. Beauchemin (avec les services informatiques des Uiversités de Toulouse et Sherbrooke)
• création des DICTIONNAIRES de VARIABLES (1978-1986) sur site CICT THESOC (URL8, clid) P1 P2 M3 V4 L5
• création des fichiers LOCALITE, INFORMATEURS, ENQUETEURS crédit-auteur des fichiers électroniques: J.-L. Fossat et N. Beauchemin (+ Services Informatiques UTM)
• création des Enregistrements Tableaux de données statistiques relatives au Polymorphisme (ALG6A) 2000 : 100 tables phonologiques crédit auteur des fichiers électroniques : J.-L. Fossat • création du fonds K de données visualitées sous forme de K_cartes géolinguistiques: à un fichier K_carte est associé un ensemble de clés de requête (exemple PLEN: clé catégorielle phonologique [pl]-; clé catégorielle phonologique [n] etc.) Responsable des fichiers électroniques constitués avec indexation catégorielle : J.L. Fossat
• création des Enregistrements de données correspondant aux enquêtes d'ALG 1,2,3 : SAISIE DES ENQUETES pour THESOC et transfert à THESOC crédit-auteur (alimentation des bases de données DRAWCARTE et THESOC): J.-L. FOSSAT (1997-2000) Nombre de BASES saisies à ce jour 5/6/00 (data numérisé, indexé, accessible sous THESOC, sur CD_DRAWCARTE (intranet) BASE 1: cartes 1_6 PROTOTYPE (1997) BASE 2: cartes 7-26 MAQUETTE (1998) BASE 3: 27-42: PRODUIT version ZERO BASE 4 : 43-54BIS PRODUIT (1999) BASE 5 : 55-87 : ETAT au 12 mai 2000 (indexation (septembre 2000) Avec ces enregistrements, on repart à zéro, en méthode ascendante, avec les outils créés transférés à THESOC depuis 1997, annuellement. Data et outils ont été transférés à J-Ph. Dalbéra, L. Molinu, et L. Rabassa, ainsi qu'a Mme. Brun-Trigault (GBT)

Les enregistrements saisis sont alors transférés à THESOC dans le dispositif électronique défini par l'atelier du 22 mars 2000. Ils sont par ailleurs mis en exploitation dans le dispositin ERSS (phonologie, morphologie, syntaxe, sémantique, BASES, CORPUS, LANGAGE) et sont disponibles à demande, avec la méthode quqi les a générés et permet de métamorphoser les données dans un dispositif cohérent

• Création du catalogue SONORITE [NUMERISATION 2000] Tranche 1 CATSON 0001 - 1001 : LES MILLE PREMIERS DOCUMENTS SONORES (accessible sur Internet à ce jour) Les documents sont catégorisés selon une grille documentaire normée et interrogeables dès le 1/1/00 par INDEX (index LOCALITES, REGIONS; INDEX AUTEURS-ENQUETEURS (droits); INDEX INFORMATEURS (droits); INDEX THEMATIQUES etc.)

• NUMERISAT ION D'ARCHIVE SONORE - Les 100 premiers documents numérisés (1999) M. MEKKORI M. TEXIER J._L. FOSSAT SOCIETE MIDIS Cahier de charges de l'opération SERVEUR GEOGRAPHIQUE DE SONORITES - lancement de la collection ATLAS SONORE (J.-L. FOSSAT, 1999), avec CR_MIP (responsabale du projet CR_MIP J. AZEMA, avec L. Rabassa, Lucia Molinu, GBT)

• MAQUETTE DE SERVEUR DE SONORITES (PREPROJET) - préprojet (J.-L. Fossat, Pr. émérite) - projet de cahier de charges (ARCHIVES SONORES DIFFUSEES, INDEXEES, EXPLOITEES)

• Création du CONJUGUEUR OCCITAN CONJUG_02 (système expert): Sami Ouanès 2000 J.-L. Fossat 2000 (rapport séparé)

OPERATION DE NUMERISATION N° 2
ENREGISTREMENT DE DONNEES DIALECTALES DU PLAN "APRES NALF" (rubrique du THESOC)
• création des enregistrements: PROTOTYPE 1986 (Fossat 1986, TRIER) ([ base de données PC DBASE (Junior Entreprise ECOLIA)
• J. Dendien , Y. HAMON, FOSSAT (analyse et développement)
• Etat de la question en 1986 (1996-1996; 1997-2000)
• reprise de la SAISIE ENQUETES (2000-2001) dans le plan THESOC(cadre contractuel IRELF 2000) • mise à disposition de toute la documentation sonore et transcrite • constitution de ressources lexicales (textes, bases, corpus) - ressources lexicales ATLAS_NALF et POST_NALF (type NALF, en provenance de GDR O09 CNRS: J. Séguy, X. Ravier, J. Allières, J. Boisgontier, E. Companys, Lalanne, Fossat et collaborateurs "post_NALF_VERIF" etc.) - ressources lexicales post_NALF (ERA 352, URL8, CLID 1973-2000)

II. CE QUI RESTE A FAIRE dans un NOUVEAU PROJET DIALECTOLOGIE IRELF

• ALG, ALLOC et ALLOR (G Brun-Trigaut, Lucia Molinu, L. Rabassa) - numérisation du fonds: 24 mois sur cahier de charges, avec exécution de la numérisation par des organismes privés (MIDIS, TOULOUSE, INFODIP PARIS etc.) - saisie cartes: 4 ans - saisie minutes alg 1,2,3, en logique THESOC_DRAWCARTE (JLF) - saisie carnets alg4,5,6 (verbe, pronom, grammaire, lexique) : vérification (GBT, Lucia Molinu, Lidia Rabassa, diverses contributions auxiliaires) - alignement Réponses transcrites et SIGNAL (constitution des fichiers SON) Responsables de projet THESOC à Toulouse devant IRELF (opération THESOC) Lucia Molinu Lidia Rabassa GBT

• ALLOC (Nègre, Ravier, Boisgontier): GBT

• ALLOR (Boisgontier, après Louis Michel, M. Petit): GBT

• CROISSANT Mme. Brun-Trigault GBT

• CORPUS DE TEXTES en logique THESOC, ALAR, ALE Nouveau projet "linguistiques de corpus dialectaux localisés" (ECRIT DE L'ORAL, nécessitant de nouvelles ressources, et la mise en place d'un cadre de travail renouvelé, avec renouvellent du cadre, des objectifs, des stratégies

On trouvera sur site ERSS_clid état de textes en machine disponibles, avant toute métamorphose Exemple 1 textes graphiques (Chants Pyrénéens X. Ravier et Jean Séguy) textes phonétiques ( """"""""""""""""""""""""""""""""""""""""""""""") Exemple 2 textes phonétiques Recueil Sacaze Projet Haut-Comminges, Projet Haut-Couserans

• FONDS HORS NALF - collections sonores (exemple collections URL8 INALF CAT_SON 2000) - archive écrite correspondante (transcription)

• CONSTITUTION DE RESSOURCES LEXICALES: dictionnaires de prononciation (dictionnaires phonétisés) - catégorisation grammaticale - catégorisation syntaxique et sémantique - catégorisation phonologique - catégorisation morphologique Suppose l'existence d'un CORPUS de dictionnaires en machine

• CONSTITUTION DE RESSOURCES MULTILINGUES - corpus espagnol parlé (V. CAT_SON); c'est un exemple d'archive sonore constitutive d'une opération ATLAS SONORE DE LANGUES ROMANES PAR REGIONS dans le cadre MSH (ne peut concerner IRELF qui s'intéresse aux seules langues de France)

III.- La question des ressources

• PERSONNES PORTEURS DE PROJETS NOUVEAUX CHERCHEURS ERSS IMPLIQUES - Renouvellement Lucia Molinu Lidia Rabassa Guilaine BRUN TRIGAUT - actions d'appoint J.-L. Fossat MM. Azéma, Lamuela, paraissent moins impliqués directement aux tâches -, mais J. Azéma s'est engagé personnellement dans une tâche collective de numérisation en 1998 devant CR_MIP (rapporteur JLF en 1999).

CHERCHEURS NOUVEAUX Mme Brun-Trigault PLAN 2000 : nouveau recrutement sur concours CNRS, dans le cadre des opérations du THESOC/THESOC_IRELF ?

PERSONNELS (?] - support adminstratif - support technique - support documentaire - administration de SERVEUR

• Centre de Ressources Midi-Pyrénées [???] (contrat Etat-Région MIDI-PYRENEES) - constitution des ressources - constitution des fonds - constitution de l'archive Condition: recrutement des personnels et création du projet SERVEUR (réseau académique cohérent, évoqué par la circulaire rectorale 2000)

• Ressources du plan IRELF, sur définition de préprojet nouveau à objectif scientifique clairement défini Pour moi, les mesures prises sur le seul sous-ensemble gascon depuis 1978 me ramènentà cette hypothèse de départ que le langage est, entre autres choses, mais avant toute autre chose, "un produit social, un produit de la vie sociale et de l'histoire des sociétés", ce qui nous conduit à rechercher une meilleure définition des facteurs sociaux facilitant l'émergence de la compétence individuelle des locuteurs. - langage et communication - grammaire - énoncés portant sur la connaissance des mondes - contextes de la communcation dialectale - dialectologie et fonctions sociales: contextes de la communication multilingue
• RESSOURCES DU PLAN MSH 2000
- axe 1 GEOGRAPHIE (V. GEODE)
- axe 2 DOCUMENTATION
- axe 3 TRAVAIL
- axe 4 PATRIMOINE (erss est impliqué à ce titre) PATRIMOINE LANGAGIER IDENTITES LOCALES NUMERISATION
Calendrier juin 2000: approbation du projet de cahier de charges (plan IRELF) septembre 2000: présentation du projet global avec échéancier (MSH)

Les résultats de la discussion seront portés à connaissance des instances compétentes THESOC REGION Commission des Finnances Assemblée Nationale AFAS BnF INATHEQUE IRELF quand il sera juridiquement constitué (en 2000) MSH TOULOUSE ELUS (REGIONS, DEPARTEMENTS, ASSEMBLEE NATIONALE, SENAT, COLLECTIVITES LOCALES le cas échéant).


Haut
 Profil Envoyer un message privé  
 
Afficher les messages publiés depuis :  Trier par  
Publier un nouveau sujet Répondre au sujet  [ 1 message ] 

Le fuseau horaire est UTC+1 heure


Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 1 invité


Vous ne pouvez pas publier de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous pouvez insérer des pièces jointes dans ce forum

Recherche de:
Aller vers :  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduit par Maël Soucaze et Elglobo © phpBB.fr