Diapositive 1

Download Report

Transcript Diapositive 1

Traitement des sons de parole
(5)
Catégorisation
et
Accès au lexique
1
Segmentation du flux acoustique
La parole forme un flux
sonore continu qu’il est
nécessaire de segmenter
en phonèmes, en syllabes,
en mots
2
Catégorisation des sons de parole
•
La langue française comporte environ 37 phonèmes (15 voyelles, 19
consonnes et 3 semi-consonnes). La réalisation acoustique de ces
phonèmes est très variable d’où la nécessité pour le système auditif
de catégoriser, c’est-à-dire de ramener une grande variation de
productions vocales à un nombre de classes restreint.
•
On appelle phones ou allophones les réalisations acoustiques des
sons de parole (phonétique). Les paramètres acoustiques et
phonétiques des sons de paroles sont continus.
•
On appelle phonèmes les catégories distinctives d’une langue
(phonologie). Dans le domaine de la phonologie, les sons de paroles
constituent des catégories discrètes.
•
Catégoriser c’est donc introduire une discontinuité perceptive dans un
continuum physique.
3
Lieux d’articulation
4
Développement de la perception des
sons de parole
Eimas et al. (1971) paradigme d’habituation.
Comme celle de l’adulte, la perception des
bébés est catégorielle. A 6 mois, les bébés
catégorisent correctement un contraste
phonétique anglais ou hindi. A 11-13 mois (ou
adulte) ils catégorisent correctement le
contraste de leur langue.
anglais
hindi
5
Parole et apprentissage
•
L'apprentissage du langage par les nourrissons est grandement
facilité par leurs remarquables capacités perceptives : par exemple, ils
sont capables de distinguer dès la naissance un grand nombre de
contrastes phonétiques (comme /ba/ et /pa/), et sont également
capables de distinguer.différentes langues, si elles ont des structures
rythmiques différentes.
•
Des singes (tamarins) manifestent les mêmes performances
discriminatives des sons de parole Language discrimination by
human newborns and by cotton-top tamarin monkeys, Franck Ramus,
Marc D.Hauser, Cory Miller, Dylan Morris, Jacques Mehler, Science,
2000, 288(5464), 349-351.
Cependant, il n’est pas attesté que les discrimination des deux
espèces se font sur les mêmes indices acoustiques.
•
•
Le traitement des sons de parole se spécifie par la familiarisation avec
la langue maternelle qui affecte déjà le babillage (de Boysson-Bardies
B. (1996) Comment la parole vient aux enfants. Paris, Ed. Odile Jacob.
6
Le Temps d’Attaque vocal
Voice Onset Time = VOT
Lorsque on prononce des syllabes (CV) contrastant un son voisé et un son non voisé comme
/ba/ vs. /pa/ on peut, avec des sons synthétiques faire varier de manière continue le délai de
voisement de la voyelle.
"En pil"
"En bil"
Le VOT est l’intervalle temporel séparant le
relâchement de l’air lors de la prononciation
de la consonne et le début du voisement de
la voyelle
http://www.ac.wwu.edu/~mseilo/c573/unit7/VOT.PDF
ba
da
pa
ta
ga
ka
http://www1.ldc.lu.se/logopedi/department/andy/Perturbations/VOT.html
7
Le contraste /ba/ - /pa/
en anglais
8
•
•
•
•
Le VOT peut être négatif, nul ou positif.
Il est nul quand le début de la vibration des cordes vocales est synchrone avec
l’explosion consonantique
Il est positif quand la vibration commence après le relâchement des articulateurs
Il est négatif quand la vibration commence avant le relâchement des articulateurs
Anglais
Français
/pa/
/ba/
9
voyelle
10
consonne
http://www.bsos.umd.edu/hesp/newman/Newman_classes/Newman300/webpages/categperc.htm
11
12
Catégorisation dans la langue
seconde
Comparaison de la catégorisation d’un contraste phonétique existant en catalan et pas en
espagnol
Ces données indiquent que l'exposition même précoce à une seconde langue n'est pas
suffisante pour en maîtriser parfaitement le système phonologique. Elles révèlent que les
représentations phonologiques, une fois mises en place, sont peu plastiques même à un très
jeune âge.
/é/
/è/
Pallier, C., Bosch, L., &
Sebastian-Gallés, N.
(1997) A limit on
behavioral plasticity in
speech perception.
Cognition, 64(3), B9-B17.
13
La syllabe
•
•
Les mots ne sont une somme de phonèmes, ils ont, au moins dans
certaines langues comme le français, une structure syllabique.
Tâche de détection d’un phonème avec mesure des temps de réaction.
Le mot contient-il (oui ou non) le phonème /p/ ?
capture
caprice
Le TR sera plus court dans le cas de capture que dans le cas de
caprice car dans le premier cas le phonème cible appartient à la
première syllabe et dans le second à la seconde syllabe
14
Le lexique mental
• Définition : c’est l’ensemble des mots d’une langue possédé
par un individu
• Plusieurs questions :
Format : phonologique, orthographique ?
Structure : alphabétique, fréquentielle, multidimensionnel ?
Accès : différentes théories
Paradigme expérimental : la décision lexicale
présentation écrite pour un bon contrôle de la durée de
présentation. Elle suppose transcodage graphème-phonème
15
Décision lexicale
Des chaînes de caractères sont présentées
brièvement sur l’écran. Le sujet doit décider le
plus rapidement possible s’il s’agit de mots de
sa langue ou de non-mots. Le pourcentage de
réponses correctes et le temps de réaction sont
mesurés.
ctoh
chat
chet
Les mots sont sélectionnés de manière à tester
une hypothèse spécifique, par exemple l’effet
de la fréquence de ces mots dans la langue.
Les non-mots sont fabriqués selon des règles
précises :
- tirage au hasard des lettres
- respect de la fréquence des digrammes
- prononciabilité
- etc.
16
http://grove.ufl.edu/~tomomi/Intro/Lecture27/sld005.htm
Rôle des non-mots
Lettres au hasard : TRmot > TRnon-mot
baton - tbonw
Non-mot prononçables : TRmot < TRnon-mot
baton - badon
Pour des présentations auditives, les non-mots sont nécessairement
prononçables !
Lexical Decision
de Réaction
Temps
reaction
time (ms)(ms)
•
740
720
700
680
660
640
620
600
580
mot
Word
non-mot
NonWord
High Prob
Low Prob
17
babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt
Effet de la fréquence des mots
Temps de Réaction « mots »
Temps de Réaction (ms)
Catégories de fréquences des mots
18
babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt
Modèles d’accès au lexique
• Modèle LAFS de Klatt (1988) lexical access from
spectra
• Modèle de cohorte Marslen-Wilson
• Modèle de Trace de McClelland et Elman
19
LAFS Klatt
•
•
•
Le lexique mental serait constitué
des traces des spectres de
fréquence des mots prononcés
La procédure de reconnaissance
consisterait en un appariement du
spectre actuel du mot entendu
avec la trace mnésique du spectre
Il y aurait accès direct au lexique
sans segmentation ni
catégorisation
« four scores and seven years ago »
20
Modèle de Cohorte
Marslen-Wilson
Lexique Mental
L'information acoustique et phonétique arrive
séquentiellement. Un mot isolé ne peut être identifié
qu'à partir du moment où il est seul compatible avec
l'information déjà disponible.
table chaise
moineau
Les premières syllabes activent la cohorte des mots
candidats les comprenant. Plus il y a de syllabes
prononcées, plus la cohorte se rétrécit. Le mot peut
être reconnu avant qu’il ait fini d’être prononcé. Le
point d’identification est la fin de la syllabe qui ne
laisse plus qu’un seul candidat.
éléphant
vocable vote
vocal
vocalise
volage
vocation
volant
vocabulaire
chien
Exemple : le mot « vocabulaire »
« vo-ca-bu-laire
vovo-ca
vo-ca-bu
Point d’identification
21
Modèle Trace
McClelland et Elman (1986)
C’est un modèle de type connexionniste qui distingue trois grandes étapes
de traitement : les traits (graphiques ou acoustiques), les lettres ou les
phonèmes et enfin les mots. Il s’agit d’un modèle interactif, à la fois
ascendant et descendant.
Exemple avec mot : « MOVE »
Etape 1: activation des traits graphiques ou
acoustiques contenus dans le stimulus et
inhibition des autres
Etape 2 : activation des lettres ou des
phonèmes contenus dans le mot et inhibition
des autres
Etape 3 : activation des mots contenant les
mêmes lettres ou les mêmes phonèmes et
inhibition des autres
22
Conclusions
La perception des sons de parole est un exemple des mécanismes de
traitement de l’information. Ceci implique une série d’étapes de
traitements:
- traitements acoustiques
- traitements phonétiques (surtout articulatoires )
- traitements phonémiques
- accès au lexique
A chaque étape, divers traitements peuvent s’effectuer en parallèle
23