NUMERISATION: DICTIONNAIRE OCCITAN
Envoyé par: FOSSAT JL ERSS NUMERISATION <fossat@univ-tlse2.fr> (stci-hurvois.univ-tlse2.fr)
Date: Mardi, 4 Juillet 2000, ˆ 7:45
L'opération de NUMERISATION affecte toute l'information occitane (romane) accessible:
(1) ATLAS LINGUISTIQUE (2)
CORPUS DE TEXTES (ECRIT/ORAL)
(3) ARCHIVE SONORE (transcrite); le tout alimente le DICTIONNAIRE GENERAL NUMERIQUE.
EXEMPLE: l'échantillon actuel du module DICTIONNAIRE [OCCITAN] comporte une possibilité d'accès par FORMES GRAPHIQUES, VOCABLES, FORMES PHONETIQUES (dictionnaire phonétisé), FORMES MORPHOLOGIQUEMENT SEGMENTEES, ETYMONS, CONTEXTES, CONCORDANCES; pour les seuls VOCABLES définis en NORME DE LANGUE UNIFIEE (vocable ou lemme), l'échantillon actuellement au banc d'essai porte sur 17668 vocables; livrée sur CD_ROM avec l'outil DRAWCARTE, l'application peut être manipulée et augmentée à sa guise par tout type d'utilisateur, qui, de surcroît a tout loisir de construire à sa guise son application personnelle.
L'application se comporte comme une aide à la compréhension des mécanismes de productin des objets spatialisés de LANGUE, sans privilégier à tout prix la LOCALISATION, la territorialité, la production de formes lexicales LOCALES, mais sans neutraliser ce mode d'accès, prioritaire dans la logique des atlas numérisés.
La seconde application (dictionnaire aragonais-espagnol-occitan, catalan) a porté l'investigation à un total de plus de 100.000 vocables pour 4 langues, avec attention spéciale à la LOCALISATION, pour les données pyrénéennes aragonaises.
La prévision du nombre total de VOCABLES du DICTIONNAIRE OCCITAN est de 400.000 lemmes pour la fin 2001. On notera que chaque VOCABLE, et chaque CONTEXTE syntaxique, peuvent être sonorisés, en environnement MAC, avec des équipements de sonorisation tout à fait triviaux (carte audiomedia, entre autres possibilités). C'est le principe du dictionnaire sonore; chaque vocable, chaque syntagme, chaque fragment devient alors lieu d'observation du signal vocal observable avec les méthodes et outils de l'analyse du signal (ondes, ondelettes, courbes). Le dictionnaire numérique est DISTRIBUE, et accessible à tous, manipulable avec un ensemble d'outils d'extraction de l'information.
Réponses à ce message
* Re: NUMERISATION: DICTIONNAIRE OCCITAN (views: 14)
FOSSAT-J.-L. ERSS ANALYSE DE CORPUS (stci-hurvois.univ-tlse2.fr) -- Mercredi, 5 Juillet 2000, ˆ 4:12
|