PHONETISEUR
PHONOLOGISEUR
ORIT
RECONNAISSANCE DE LA PAROLE
SYNTHESE VOCALE
INDEXATION DE MOT PHONOLOGIQUE (OCC.)
Envoyé par: FOSSAT J.-L erss/clid PHONOLOGIE <fossat@univ-tlse2.fr> (193.55.175.20)
Date: Vendredi, 29 Octobre 1999, ˆ 11:50
L'indexation de mots phonologiques (pour une langue quelconque (langues du monde entier, unissez-vous) pose des problèmes de sélection des unités, de sélection des traits, d'identifications des mouvements intervenant entre ENTREE et SORTIE (output si vous tenez à parler FRAENGLISH), identification prosodique par rapport à la syllabation. etc. EXEMPLE: la base de données lexicales des mots monosyllabiques commençant par le diphone BR (br-), dont le prototype est bronc "noeud" réalisé à l'ENTREE [br 'uVNAS nVEL k]
Si le mot idéal est de 2 pieds (en phonologie métrique, alors le mouvement d'insertion de VOC (anaptyx) répare le malheur : c'est donc une stratégie de réparation, facilitée par l'attaque en groupe combiné BR- Sa graphie phonologisante serait automatiquement bourrounk serait bu1ru4n2k si b = b en attaque si u1 : u de miroir (voyelle secondaire d'anaptyx (termin. venue du grec) si 1r = [r:] long dans la SORTIE disyllabique, ou [r] dans le groupe combiné de l'ENTREE su u~ : u nasalisé ou nasalisable (gradient vocalique de nasalité complète/incomplète si n2 : nasale vélaire si k : k si diphone en CODA est [nVEL k] mais si u est EFFACE bourrounc est brounk Enfin si BRONC (lemme bronc, s. m. sg.) grapopulaire brounc est francisé NOTATION (POLICES) Nous traduisons dans l'application THESOC à partir d'un APINEW qui est la pratique de la notation des phonéticiens de terrain c'est BRO~NK qui est la forme reconnue.
ANNOTATION DANS UNE LOGIQUE SAMPA (PSOLA, MBROLA) dans la perspective INDEXING MULTIMEDIA, CARTE_SON (Elan Informatique, IRIT, etc): préciser les conventions d'annotation.
COLLABORATIONS POTENTIELLES A DEFINIR erss_clid est ouvert à toute forme de coopération, pourvu que nous puissions bien préciser comment s'articuleraientles travaux et ressources existantes, limitées.
PROGRAMMATION THESOC 1999
le groupe de travail THESOC a écrit (sous 4D, DALBERA) un traducteur de transcription phonique APINEW en graphie phonologisante (ainsi une chaine SAMPA correspondant à APINEW XXXXXXXXX est automatiquement affichée en version graphie phonologisante bourrounc; ceci peut intéresser le problème d'indexation multimedia des sons digitalisés.
LISTE DES PHONEMES ET ALLOPHONES POUR APPLICATION OCCITAN: 37 annotations
INSTRUCTIONS pour MODE SAMPA si vous voulez etre dans l'esprit de SAMPA, vous devez coder vos phonemes par ds codes ascii, (lettres de l'alphabet, chiffres, symboles simples &,@,",~, etc...)
COGNITION pour les COGNITIVISTES: qui est bourrounc, c'est le fils de qui ? il faut trouver le père; quelle ENTREE minimale est reconnue sous cette SORTIE ? les alternances qui sont ici constatées affecteraient-elles une attaque en [r:] déclaré mauvaise attaque: La réponse est OUI: V. les sortie en [gr] de raspa, avec voyelle d'anaptyx, effet induit de la traduction en [gr] "dernière grappe du pied de vigne, laissée par les vendangeurs"; VA rampa traduit et perçu garrampa "crampe": recherche par graphes de proximité, discrimination, calcul de voisinage.
>--
ierre LARREY Doctorant IRIT groupe IHM-PT
:Universite Paul Sabatier 31062 TOULOUSE cedex
:larrey@irit.fr
http://www.irit.fr/~Pierre.Larrey
:Telephone 05 61 55 88 35 Fax 05 61 55 62 58