Acquisition de la parole: production, du babillage aux premiers mots L7PHO (CM2)

Download Report

Transcript Acquisition de la parole: production, du babillage aux premiers mots L7PHO (CM2)

L7PHO (CM2)
Acquisition de la parole: production, du
babillage aux premiers mots
(P. Hallé, LPP)
8 Octobre 2008
CM2: Acquisition 1 :
Description des différentes étapes observées pour les
productions vocales des jeunes enfants, de 0 à 2 ans ; aspects
segmentaux (consonnes, voyelles, syllabes) et prosodiques ;
l’accent est mis sur la “spécialisation” des enfants pour leur langue
maternelle (quels aspects de leurs productions vocales deviennent
typiques de leur langue maternelle), en dehors des contraintes
universelles (maturation anatomique et contrôle moteur).
La première partie du cours est centrée sur les caractéristiques
phonétiques du babillage ; dans la seconde, on aborde l’émergence
des mots produits, y compris celle des mots ou proto-mots de
fonction.
=> savoir décrire les différentes étapes, en particulier le babillage
=> savoir distinguer/expliquer les aspects spécifiques et les aspects
universels
ENJEUX THÉORIQUES
(1) CAPACITÉS/CONNAISSANCES INNÉES versus APPRISES
• inné vs. acquis / organe du langage vs. “tabula rasa”
Grammaire Universelle (GU) vs. apprentissage ex nihilo
en tout cas, interactions complexes entre organisme et
environnement.
• moyen terme : mécanismes innés pour l’acquisition du
langage ?
(2) PHYLOGENÈSE / SPÉCIFICITÉ DE LA PAROLE
• Evolution progressive (incrémentale) vs. mutation ?
singes apprenants, enfants privés d'input
• Etapes intermédiaires, proto-langages ?
• Spécificité des diverses langues
• Spécificité du traitement de la parole (vs. autres sons)
connaissances innées vs. acquises par apprentissage ?
Question dépassée ?
Non, le débat est vif et l’enjeu important : l’esprit de l’enfant at-il un contenu indépendant de l’expérience ?
=> Points de vue empiriste vs. innéiste
Elizabeth Spelke: théorie des “core knowledge” innés
(géométrie, numérosité, physique, balistique, orientation dans
l’espace…).
Ces core knowledges, peuvent être communs à plusieurs
espèces animales.
C’est leur utilisation en combinaison qui peut être spécifique à
telle ou telle espèce animale.
“Core Knowledge of Geometry in an Amazonian Indigene Group”
Dehaene, Izard, Pica, & Spelke (2006), Science, 311, 381-384
Does geometry constitute a core set of intuitions present in all humans,
regardless of their language or schooling? ... Mundurukú children and adults
spontaneously made use of basic geometric concepts such as points, lines,
parallelism, or right angles to detect intruders in simple pictures ... evidence
for geometrical intuitions in the absence of schooling, experience with
graphic symbols or maps, or a rich language of geometrical terms.
organe du langage vs. apprentissage non spécifique
arguments pour l'organe :
• Idiots parlant; e.g., syndrome de Williams
• Dysphasiques surdoués ; Autistes Asperger qui ne parlent pas
(ne peut s'expliquer par apprentissage ou défaut d'apprentissage)
• Malgré la pauvreté de l'input les enfants apprennent à parler sans effort :
(re)création d'une langue structurée sans langue maternelle véritable
- créoles à partir des pidgins
- langues signées à partir de "pidgins" signés (Nicaragua: LSN  ISN)
- cas d'enfants développant seuls une langue signée
• combinatoire infinie, production de nouvelles phrases jamais apprises…
Compromis entre organe et apprentissage général
Ce qui est inné n'est pas la GU, mais un programme d'acquisition
(innately guided learning) : cf. Darwin qui parlait déjà de
“… tendance instinctive à acquérir l'art du langage”
Question des singes
'30s: Gua (Kellog's) couldn't speak
'40s: Vicki (Hayes') said 'cup', 'up', 'mama',
'papa' (?)
'60s: Washoe (Gardner's) (adapted) ASL:
130 signs, 2-3 w-sentences?
'70s: Loulis, son of Washoe (Fouts') learned
signs from mother?
——: Lana (Savage-Rumbaugh) keys on
electronic keyboard
——: Nim Chimsky (Terrace) ASL
——: Sarah (Premack's) magnetic tokens:
learned "colour" concept
——: Koko (Patterson) ASL, created new
words: 'eye-hat' ≈ 'mask' …
'90s: Kanzi (Greenfield) ASL/keyboard
learned some syntax?
Chomsky: why would chimps need us?
language faculty is so advantageous...
Enfants privés d'input
légendes: Psamtik I (600 BC): selon
Hérodote, 1er mot becos (Phrygien);
autres: Jean IV d'Ecosse: l'hébreu…
Victor de l'Aveyron (Sicard puis Itard): never
could speak (only "Oh Dieu") but could
write.
'Genie': enfant placard '70s (!) at 13: only
learned telegraphic speech.
'Isabelle': isolée avec mère muette -> 6:
good language level after 2 years!
Helen Keller: sourde/aveugle à 19 mois:
apprend par le toucher (w-a-t-e-r), puis à
parler (-> méthode Tadoma), à lire/écrire
le Braille…
Suggère: l’âge est critique surtout pour le
langage parlé (Victor); implications pour
un "organe du langage" ?
PLAN
◊ production: spécialisation vers la langue maternelle
• aspects généraux (liés à la prosodie)
- exemples de babillages anglais, français …
• caractéristiques segmentales
- voyelles, consonnes, cooccurrences
- vers le modèle adulte
• premiers mots
• mots de fonction
Productions vocales enfantines: les stades "classiques"
(1) 0–2mois : sons "végétatifs" ou "réflexifs"
(2) 2–5 mois : 'cooing' (arheu, agueu …); 16 semaines : rire
vers 4–5 mois : contrôle phonation, premières voyelles
(Koopmans van Beinum & van der Stelt, 1979)
(3) 3–7 mois : vocalisations "volontaires", (qques protosyllabes)
(4) 7–10 mois : babillage canonique (syllabes répétées et jargon)
(5) 9-11 mois : 'variegated' babbling et jargon
Variantes terminologiques
- "Goo" stage (Oller, 1980), "Cooing" (Stark, 1980), "Glottal" and
"Velar" stage (Roug et al., 1989).
- "Expansion stage" (O), "Vocal Play" (S), "Vocalic stage" (R)
- Koopmans van Beinum (1979): uninterrupted/interrupted phonation (1/2)
single/reduplicated articulatory movements (2/4), phonatory variations (3)
Positions théoriques sur le statut du babillage
• exercices sans rapport avec le stade linguistique des 1ers mots
Jakobson (1941: Langage enfantin et aphasie)
Chomsky (1959: A review of Skinner's Verbal Behavior, Language)
Lenneberg (1967: Biological foundations of language)
(pts communs: 1. caractère universel, 2. input peu (pas) important,
3. discontinuité entre babillage et 1ers mots)
• continuité entre babillage et 1ers mots, modèle "biomécanique"
MacNeilage (1980-2006: Frames then Contents)
Lindblom (1992: phonological units as adaptive emergents)
(base = cycle mandibulaire; contraintes perception/production ; on reste
dans l'universel mais la continuité observée est expliquée)
• interaction entre contraintes universelles et "expérience" de l'input
de Boysson-Bardies et col. (1989: babbling drift, cf. Brown '50s)
(sélection des formes phonétiques et prosodiques pertinentes)
importance de l'input auditif et visuel; convergence vers le
modèle adulte (hypothèse de l'interaction)
• orientation "spéciale" des enfants pour la parole:
détection des accents étrangers (Grégoire, 1937: anecdotes;
Mehler et al., 1988: données expérimentales)
• capacités d'imitation des expressions/gestes, e.g. du visage:
Meltzoff & Moore (1977), Science.
• enfants sourds: des vocalisations jusqu'à 6 mois, mais babillage
retardé (~4-6 mois), et surtout des [ba, ma, pa] "visibles"
babillage manuel
• données empiriques des études inter-langues => convergence
- jugements par adultes des productions enfantines
- analyses acoustiques
- comptages basés sur transcriptions larges
• parallélisme production / perception
Facial imitation at 2-3 weeks
Meltzoff, A. N., & Moore, M. K. (1977). Imitation of facial and manual
gestures by human neonates. Science, 198, 75-78.
babillage manuel
Petitto & Marentette, 1991,
Science
Petitto et al., 2001, Nature
Les enfants exposés à l'ASL ont, en
plus du beat "rapide" (2.5 Hz), un
rythme lent (~1.5 Hz) : ce serait la
base du babillage manuel.
Base du "babillage manuel" : Petitto et al. (2001), Nature
QuickTime™ et un
décompresseur Cinepak
sont requis pour visionner cette image.
Les bébés utiliseraient le côté droit de la bouche (plus ouvert)
pour le babillage, mais pas pour les sourires ou autres sons de
"non-babillage"
(Holowka et Pettito, 2002, Science: 10 5-12-mos Fr/Eng babies)
smiling
BABBling
Fig. 1. Consecutive frames from video recordings showing a baby's left mouth
opening while smiling (left) and right mouth opening while babbling (right).
Mean Laterality Index (LI) scores for all of the babies were as follows:
babble = +0.88 (red), nonbabble = -0.08 (yellow), and smile = -0.82 (blue).
Les babillages commencent à se différencier dès 8 mois
Expériences de jugement subjectif (de Boysson-Bardies et al., 1984) :
Ss adultes français ; paires d'échantillons babillage [fr. , autre]
échantillons de babillage
comparaison
8 mois
10 mois
français vs. tunisien
français vs. cantonais
75.8
69.4
74.4
31.9
pourcentages d'identifications correctes (lequel des deux est français ?)
critères possibles: intonation, qualité de voix …
bébés tunisiens: attaques dures, friction dans relâchements, accentuation.
bébés français: allongements, modulations plus douces.
bébés cantonais: entering tones –> glottal stop
exemples adultes : 合 [hap], 一 [yat], 國 [kok] => [ha?, yat?, ko?]
extrait de babillage "cantonais"
Typique du cantonais ? [la.a˘E) ta?] ton "entrant" sur [ta] (≈ [taë])
extrait de babillage "algérien"
Typique d'une langue arabe? [?ajze ajE˘] (glottal stop en initiale)
extrait de babillage "british"
No comment … On croit reconnaître "sandwich" (+ pattern F0 !)
extrait de babillage "français"
Un échantillon moins exotique (bien français ?) [bujeojae˘]
A coté de ces impressions qualitatives, y a-t-il des
différences que l'on pourrait quantifier ?
• prosodie, patterns métriques (Levitt & Wang,1991) :
différences entre bébés français et américains dès 5 mois
• propriétés spectrales : spectres LTS (long term spectra),
reflétant positionnements supralaryngaux spécifiques ?
• timbre et distribution des voyelles : "espaces vocaliques"
influencés par l'environnement linguistique ?
• distribution des consonnes
• cooccurences CV
• aspects "coarse grain" (squelettes syllabiques, patterns
syllabiques …)
Espaces vocaliques pour 4 communautés (10 mois)
British English
Algerian
French
Cantonese
Ellipses à 75% de confiance (de Boysson-Bardies et al., 1989, JCL)
Indice de compacité F2/F1 pour 4 communautés
(adultes vs.10 mois)
4.0
Adultes
Enfants
F2/F1
3.5
3.0
2.5
2.0
Anglais
Français
Algérien
Cantonais
CommunautЋ linguistique
Exemples: /a, O/ compactes ; /i/, /e/ diffuses
Distributions des voyelles
(~ 18 mois: français vs. japonais)
30
high back
[u, ¨]
30
mid front
[e, E]
30
high front
[i, y]
observed %
Japanese
French
20
20
10
10
10
0
0
0
20
g
lin
bb
ba
ds
or
tw
1s
ds
or
w
et
rg
ta
ge
ua
ng
la
g
lin
bb
ba
ds
or
tw
1s
ds
or
w
et
rg
ta
ge
ua
ng
la
g
lin
bb
ba
ds
or
tw
1s
ds
or
w
et
rg
ta
ge
ua
ng
la
Tendances: beaucoup plus de HB (très net) et HF en japonais qu'en
français; davantage de MF en français. Tendances pour les langues en
général (language), les mots adultes "visés" par les enfants, les premiers
mots et le babillage.
Distributions des consonnes
(français, anglais, japonais, suédois)
% labiales
% occlusives
60
80
Swedish
50
AE
70
% stop consonants
% labial consonants
French
40
AE
30
Japanese
20
Swedish
10
60
50
French
40
30
0W
4W
15 W
Recording Session
25 W
0W
4W
15 W
Recording Session
25 W
0-25 Words :10 mois à 16-20 mois
Tendances stables : les français ont (a) le plus de labiales et (b) le
moins de stops; les % n’évoluent pas beaucoup, mais les SDs
diminuent de façon marquée (de ~24% à ~8%)
Affinités "biomécaniques"
(MacNeilage & Davis, 2000, Science)
[ma, dæ, go]
adult
infant
Fig 1. A schematic view … [with] the three intrasyllabic CV co-occurrence patterns
… [mama, dædæ, gogo] by an American adult and babbling episodes … can be heard
at Science Online: www.sciencemag.org/feature/data/1047897.shl
mais est-ce bien un [æ] plutôt qu'un [a] ?
mama
taetae
adulte : mama, tætæ
mama
taetae
enfant : mama, tætæ ?
F2 pour [æ] vs. [a] :
F2 pour [æ] vs. [a] :
~1900 > ~1200 Hz
~1450 < ~1750 Hz
Tendances universelles ?
MacNeilage & Davis (2000), Science
1. AJA mother, older female relative
2. BU(N)KA knee, to bend
3. BUR ashes, dust
4. CHUN(G)A nose, to smell
5. KAMA hold (in the hand)
6. KANO arm
7. KATI bone
8. K'OLO hole
9. KUAN dog
10. KU(N) who?
11. KUNA woman
12. MAKO child
13. MALIQ'A to suck(le), nurse, breast
14. MANA to stay (in a place)
Affinités CV
Front
Coronal 1.94
Consonant Labial 0.83
Dorsal —
Vowel
Central
0.90
1.31
0.82
15. MANO man
16. MENA to think (about)
17. MI(N) what?
18. PAL the number 2
19. PAR to fly
20. POKO arm
21. PUTI vulva
22. TEKU leg, foot
23. TIK finger, the number 1
24. TIKA earth
25. TSAKU leg, foot
26. TSUMA hair
27. ?AQ'WA* water
Biais "LabCor"
Back
0.70
0.72
1.63
C1
C2
Labial Coronal
Labial
—
8
Coronal 1
1
Dorsal 1
5
Dorsal
3
4
—
CV affinities in the first & second syllabes of CVCVs
(interaction…)
Adult reference
10-12-month-olds
blue: 'biomechanic' (8 et 8); brown: 'unpredicted' (10 et 14)
(only data for at least 5% of total CV productions are presented)
(de Boysson-Bardies, 1993, "Ontogeny of language-specific syllabic productions")
Conclusion sur les productions précoces
• Convergence nette vers la langue maternelle dès 10 mois
• Aspects les plus saillants :
- D'abord des aspects larges, plutôt prosodiques
- Puis les voyelles
- Ensuite, consonnes et patterns syllabiques
• L'appartenance linguistique d'un enfant est reconnaissable vers
8-10 mois.
quelques données de prosodie
• communication par l'intonation (vers 4-5 mois ?)
- d'Odorico (1984), JCL : corrélations 'type de cris' x 'signifié'
- Huttenlocher (1984) : compréhension 'no!' ≈ 'yes!'
• imitation des contours F0 dès 4 mois
- Kuhl & Meltzoff (1982), Science : observation 'anecdotique'
• effets positifs du registre "motherese" (intonation exagérée)
• différences inter-langues pour énoncés bi-/tri-syllabiques dès
7 mois (Whalen et al., 1991 ; Levitt & Wang, 1991) : reliés aux
patterns prosodiques adultes globaux.
• pas de convergence vers le modèle adulte avant ~20 mois
pour les tons chinois et thai (Li & Thompson, 1977; Clumeck,
1980; Tuaychaoren, 1977), ou pour l'accent de mot en japonais
(Hallé et al., 1991: émergence vers 18 mois).
babillage tardif ca. 16-18 mois
[ÔQÔç] (japonais, 18.6)
Hallé et al., 1991, L&S
Accent de mot reproduit par les 18 mois japonais ?
Taro
Emi
=> Tendance émergente à la conformité au modèle adulte
Point sur le babillage
• les voyelles produites dans le babillage s'orientent vers le
modèle adulte vers 10 mois.
• pour les consonnes, ce serait un peu plus tard (12 mois)
(à partir de comptages ; données acoustiques non fiables.)
• c'est l'ordre observé pour la spécialisation en perception.
Le retard de la production sur la réception est une
constante en acquisition du langage (e.g., acquisition
lexicale).
◊ Situation moins claire pour la prosodie selon intonation vs.
ton/accent lexical (cf. Chao 1969: 'ripples and waves'):
- jeu sur l'intonation précoce en communication
- patterns accentuels moins précoces (e.g., tons)
EXTRAS: premiers mots
Les premiers mots en production
Stratégies pré-phonologiques
(1) “Squelette mélodique” = mise à un gabarit standard
Exemple : gabarit CVLV (consonne-voyelle-/l/-voyelle)
ballon  bala
cuillère  kola
canard  kala
(2) “Pattern harmonique” = simplification par
harmonisation des consonnes (ou des voyelles)
Exemples :
chapeau  papo
gâteau  tato
Systématisation proto-phonologique
Exemple : “Henri” (cf. de Boysson-Bardies, 1996) modifie
les mots de structure mVCV (/m/-voyelle-consonne-voyelle)
en remplaçant /m/ par /b/ ou par /p/:
/b/ si C voisé
/m/ 
Exemples :
/p/ si C non voisé
C non voisé (/s/):
C non voisé (/S/):
C voisé (/z/):
monsieur  peusieu
méchant  pécha
musique  bizik
Capacités grammaticales précoces
Nous nous limitons ici à des opérations relativement simples
de traitement syntaxique, et même, au seul cas des
syntagmes du type
déterminant + nom.
- les déterminants ont une charge sémantique faible,
pas de référent clair, ne contribuent pas à l’affectation des
rôles thématiques.
- pauvreté phonétique/phonologique (formes réduites,
acoustiquement peu saillantes,)
point de vue empiriste : formules apprises
• l’enfant extrait peu à peu de l’input des séquences qui ne
sont d’abord pas analysées (mots globaux); il acquiert
d’abord — par des mécanismes statistiques d’apprentissage
général — des “formules lexicales”.
Par exemple, “petit suisse”, “la moto” …
• les catégories grammaticales émergeraient plus tard, pas
avant le stade “combinatoire”, vers 2-3 ans. (Cette
“émergence” reste mystérieuse...)
Il y a donc pour l’acquisition de la catégorie déterminant:
(a) non-précocité (> 2-3 ans)
(b) discontinuité (système non structuré  structuré)
(d’une mosaïque de formules à une grammaire)
• les formules sont spécifiés phonétiquement pour tous les
éléments qui les composent. (“petit suisse”,
“mon biberon”). D’où une 3ème propriété :
(c) spécification (la formule est totalement spécifiée
phonétiquement)
Enfin, (d) peu ou pas de combinatoire => peu d’overlap (de
“recouvrement”) entre les formules acquises.
test de l’overlap pour des séquences det.+N :
Overlap si N produit après de nombreux déterminants
(ex. mon canard, le canard, ces canards …)
pas d’overlap si N n’est produit qu’après tel déterminant
exemple: canard après le => la formule le canard
point de vue innéiste : décomposition-recomposition
L’enfant a des concepts innés sur des catégories latentes.
L’input permettra de “remplir” les catégories.
• le remplissage des catégories est possible très tôt pour les
mots de fonction fréquents (ex. déterminants).
• la capacité innée à segmenter en groupes syntaxiqueprosodiques aide à découvrir les déterminants, et s’ils sont
avant ou après les noms (bord gauche ou droit).
Les mots de fonction (ex. déterminants), conjugués au
découpage prosodique, fournissent le squelette grammatical
des énoncés.
• le remplissage des catégories est incrémental; pour les
déterminants, l’enfant en “code” de plus en plus, et les
représente d’une façon de plus en plus détaillée.
Tous ces aspects correspondent à des propriétés à peu près
opposées à celles prédites par la vision empiriste:
(a) précocité (déterminants reconnus/traités tôt)
(b) continuité (enrichissement incrémental)
(c) sous-spécification initiale (phonétique, morpho-syntaxique)
(d) combinatoire (=> overlap)
Données de productions précoces (2-3 ans)
• les enfants de 2 ans omettent les déterminants…
=> Ils n’en ont pas de représentations ? (pt de vue
empiriste)
Une conclusion opposée est tirée d’une analyse plus fine:
(a) tâches d’imitation (Gerken et al., 1990: 26 mois):
Pete pushes the ball —> Pete pushes ball
Pete pushes na ball —> Pete pushes naball
Les enfants font donc bien la différence entre the et na…
“…les 2-ans analysent the comme un morphème et na comme
début du mot naball…” (Gerken et al., 1990)
(b) études de corpus (Valian et coll., 1986-2008):
à 2 ans, les enfants (MLU≈3-4) omettent les déterminants ~9
fois sur 10. Mais lorsqu’ils les produisent:
• pas de confusion avec les adjectifs (det.≠ modificateur)
the red truck, jamais *red the truck
the green green truck, jamais *the the truck
the tiny green truck, jamais *the my truck
• positifs au test d’overlap (e.g., ball apparaît dans the ball, a
ball, my ball, etc.);
si on tient compte du nbre de fois où chaque N apparaît avec
un déterminant, pas de différence enfant-adulte.
(c) “filler syllables” (FS)
• produites en général avant un mot; souvent réduites à une
voyelle non-accentuée; variabilité inter-enfants; documenté
pour langues européennes (à déterminants); disparaissent vers
3-4 ans (deviennent déterminants).
• modèle de la sous-spécification initiale: les FS sont des
formes sous-spécifies de déterminants; leur existence même
est difficile à expliquer par la théories des “formules lexicales”
bien spécifiées: une forme FS+nom est toujours qqch que
l’enfant n’a jamais entendu.