No Slide Title

Download Report

Transcript No Slide Title

College: Geluid Lezen
1
Outline
•
•
•
•
•
•
•
Wat is geluid?
Parameters Geluid
Enkelvoudige en Samengestelde Golven
Oscillogrammen lezen
Klankkleur: spectrum – spectrogram
Bron filter-theorie
Spectrogrammen lezen
2
Geluid
• Geluid: trillingen van voorwerpen die door een
medium (meestal lucht) worden voortgeplant en
m.b.v. het gehoororgaan kunnen worden
waargenomen
3
Geluid
• Geluid manifesteert zich als verstoringen van
de barometrische (lucht)druk
• Een zuivere (of enkelvoudige) toon is periodiek,
d.w.z. na T sec (een vaste tijd) is de verstoring
van de barometrische druk exact hetzelfde; na
T sec voert het trillende punt precies dezelfde
beweging uit (periodieke trilling)
• zuivere toon komt nauwelijks voor (stemapparaat)
4
Golfvormen
Lucht gaat trillen door periodieke variatie van de
luchtdruk in het spraakkanaal (door het periodieke
open en dicht gaan van de glottis)
5
6
7
enkelvoudige golven
8
Oscillogram
Een oscillogram is een registratie
van de luchtdeeltjestrilling als een
functie van de tijd
9
Parameters Geluid
Fysische grootheden
Psychofysische grootheden
meetbaar
sensatie
amplitude (A) (dB)
luidheid
max.waarde die de geluidsdruk aanneemt (max.uitwijking)
periode (T) (sec)
duur
de tijd waarin het patroon zich herhaalt
frequentie (F) (Hz)
toonhoogte
aantal trillingen per seconde
10
trillingstijd & amplitude
amplitude
grondperiode
11
Decibel (dB)
• Eenheid van geluidsterkte. De amplitude of het
volume of het niveau van een signaal wordt
weergegeven in dB.
• 0 dB geeft de grens van het hoorbare aan.
• 130 dB is de pijngrens.
• Een normale spreekstem zit op 65-70 dB.
12
13
Hertz (Hz)
• Meeteenheid voor frequenties, gemeten in
trillingen per seconde.
• 1 Hertz is 1 trilling per seconde
• vaker gebruikt: eenheid Kilohertz (kHz): veelvouden
van 1000 Hz
Hoog: > 5 k; Laag: < 100 Hz
14
Waarneming geluid
• Gebied waarbinnen mensen geluid kunnen
waarnemen is grofweg tussen 20 Hz - 20 kHz
• Het ‘klankspectrum’ neemt met het ouder
worden af: een gemiddelde is ongeveer 40 Hz 15 kHz
15
Waarneming geluid
• In frequentie toenemende sinusgolf
•
•
•
•
•
50-500 Hz
500 Hz - 5k
5 - 10k
10 - 15k
> 15k
16
17
Geluid
Infrasoon
F < 20 Hz
Geluid
20 Hz < F < 20 kHz
ultrasoon
F > 20 kHz
18
Geluid
Infrasoon
F < 20 Hz
puls (< 1/20 sec)
Geluid
20 Hz < F < 20 kHz
ultrasoon
F > 20 kHz
stationair geluid
• voorbeeld puls: plofklanken: [p,t,k,b,d,]
19
Geluid
Infrasoon
F < 20 Hz
Geluid
20 Hz < F < 20 kHz
puls
ultrasoon
F > 20 kHz
stationair geluid
enkelvoudige toon
samengestelde trillingen
(bevat 1 frequentie)
(gelijktijdig meerdere frequenties)
• voorbeeld enkelvoudige toon: sinustoon
• hier: 440 Hz (A)
20
Geluid
Infrasoon
F < 20 Hz
Geluid
20 Hz < F < 20 kHz
puls
ultrasoon
F > 20 kHz
stationair geluid
enkelvoudige toon
samengestelde toon
(bevat grondtoon + boventonen)
F0 + boventonen 2F0;3F0 …
samengestelde trillingen
ruis
(alle mogelijke frequenties komen voor)
onregelmatig trillingspatroon
• voorbeeld ruis: fricatieven: []
21
Golfvormen
• Periodieke golven: herhaling van zichzelf na een periode T
- stemhebbende klanken
vocalen, halfvocalen, nasalen, liquidae,
stemhebbende obstruenten
• Niet-periodieke golven: onregelmatig
fricatieven, ruis, na obstruenten
22
Golfvormen
Vocalen
•
•
•
periodiek signaal (samengesteld)
locaal maximum in de amplitude van het signaal
duur tussen 50 ms (schwa) en 100 (korte
vocalen) en 300 ms (lange vocalen)
[a]
23
Golfvormen
Obstruenten
•
•
•
stilte (stemloze obstruenten)
spraakbuis gesloten, drukopbouw
stemhebbend gemurmel ‘voice bar / pre-voicing’
met lage amplitude (stemhebbende obstruenten)
gevolgd door een explosie (release), een zeer
kort stukje ruis
stemhebbend: kort (< 10 ms)
stemloos: langer (tussen 10 en 30 ms)
24
Golfvormen
Stemloze obstuenten
0.9292
0
-1
0
0.0704762
Time (s)
[p]: sluiting + explosie (en stukje van [a])
25
Golfvormen
Stemhebbende obstuenten
1
[b]
0
[b]
-0.8748
0
0.565261
Time (s)
Periodiek signaal met lage amplitude: pre-voicing
26
Golfvormen
Fricatieven
•
ruis (niet-periodieke golf)
door turbulentie in de mond-keelholte of in de
glottis
stemloos: ruis
stemhebbend: ruis op een periodiek
signaal
27
Golfvormen
Stemloze fricatief: ruis
0.1527
0
-0.148
0
0.275964
Time (s)
[f]
28
Golfvormen
Stemhebbende fricatief: ruis op een periodiek signaal
0.357
0
-0.2389
0
0.105488
Time (s)
[z]
29
Golfvormen
Nasalen
•
•
•
•
periodiek signaal
gladde, sinusachtige golf
constante amplitude
kleinere amplitude dan vocalen
0.8591
[n]
0
-0.7752
0
0.0748753
Time (s)
30
Golfvormen
Lateralen
•/l/: moeilijk te onderscheiden van nasalen
(iets scherpere vormen)
•/r/: verschillende verschijningsvormen:
- verglijding van de vocaal (ə), of approximant
(‘Kinderen voor Kinderen’)
- één enkel contactmoment (uvulair of flap)
- periodieke trilling met lage amplitude (rollende r)
31
Golfvormen
Lateralen
•
/l/: moeilijk te onderscheiden van nasalen
(iets scherpere vormen)
0.6682
0
[l]
-0.4455
0
0.129841
Time (s)
32
Golfvormen
/r/: verglijding van vocaal
0.377
0
-0.5964
0
/r/: approximant (Kinderen voor Kinderen)
0.089932
Time (s)
0.2802
0
-0.2509
0
0.105079
Time (s)
33
Golfvormen
/r/: uvulair
0.1249
0
-0.2051
0
0.0962358
Time (s)
34
Golfvormen
/r/: alveolair (rollende r)
0.2949
0
-0.4474
0
0.259546
Time (s)
35
Klankkleur
36
Grondtoon
• De laagste frequentie in een samengestelde
golfvorm
37
Boventonen
• Trillingen van frequenties die een meervoud
zijn van de grondtoon
38
golf & golfspectrum
39
samengestelde golven
40
Golfvormen
Luchttrillingen
Enkelvoudige golven
Samengestelde golven
41
Spectrum
• Spectrum geluid: opbouw van de
basisfrequenties (bepaalt klankkleur)
• Iedere samengestelde trilling met een
frequentie F is te beschouwen als een som van
harmonische trillingen met frequenties F, 2F, 3F,
etc.
• F=grondtoon (1e harmonische)
• 2F = 1e boventoon (2e harmonische)
• 3F= 2e boventoon (3e harmonische)
42
Spectrum
De grondtoon F0 heeft de hoogste amplitude en is de
eerste harmonische (H1); de andere componenten
zijn meervouden (oktaven) van H1:
- H1 = 100, H2 = 200, H3 = 300, etc.
- Intensiteit van de harmonischen neemt
af met 12 dB per oktaaf, door de mond
gecorrigeerd naar -6 dB per oktaaf
43
Spectrum
• opbouw van de basisfrequenties (momentopname); een
plaatje waarin de frequentie en de amplitude tegen
elkaar worden uitgezet
Ampl
Freq
grondtoon (F0)
44
Klankkleur
• Het spraakkanaal boven de glottis filtert het
brongeluid zodanig dat bepaalde harmonischen
gedempt worden, terwijl andere juist versterkt worden
• Deze filterfunctie is een resultaat van de resonanties
van het spraakkanaal
45
Klankkast
46
Plaats van de constrictie
47
Bron - Filter
Functie van drie systemen: het bron-filter model
anatomie
functie
subglottale
structuren
glottale
structuren
supraglottale
structuren
energiebron
geluidsbron
filter
48
Spectrum
Spectrum:
bronfiltermodel
49
Resonantie
Formanten
• Sommige componenten van de geluidsbron hebben dezelfde
resonantiefrequenties als het filter (mond-keelholte), waardoor
ze versterkt worden
• Deze resonantiefrequenties veranderen wanneer de vorm van
het spraakkanaal verandert, wat leidt tot verschillende
geluidskwaliteiten / timbres
• In vocalen (en sonorante consonanten) manifesteren deze
resonanties zichzelf als brede pieken in het spectrum:
formanten
50
Spectrogrammen
Spectrogrammen
• Omdat de spectrale eigenschappen van spraak zeer dynamisch
zijn, kan het belangrijk zijn spectrale veranderingen in de tijd te
representeren: spectrogram
• Spectrogrammen:
y-as: frequentie
x-as: tijd
grijstinten: relatieve amplitude (hoe zwarter, hoe hoger de
intensiteit)
51
Articulatie
Spectrogram
52
[a]
53
Vocaal - Fricatief - Vocaal
54
Formanten: vocalen
resonantie: veroorzaakt door de gezamenlijke volumes van de
achterholte, de voorholte en het volume van de constrictie zelf
F1 van vocalen (eerste formant)
• voor-vocalen: lage resonantiefrequentie achterholte, F3
hogere resonantiefrequentie voorholte, F2
F2 en F3 dicht bij elkaar
• achter-vocalen: hogere resonantiefrequentie van achterholte, F3
lagere resonantiefrequentie van voorholte, F2
F2 en F3 ver uit elkaar
55
Formanten: vocalen
• F1: - 300 – 1000 Hz
- hoe dichter de tong tegen het palatum, des te lager
de F1 dus: [i] = lage F1, [a] = hoge F1
• F2: - 850 – 2500 Hz
• F3: - 2000 – 3150 Hz
56
Formanten: vocalen
• F1 correspondeert met (het omgekeerde van) vocaalhoogte: hoge vocalen hebben een lage F1
• F2 correspondeert met (het omgekeerde van) voor –
achter: achtervocalen hebben een lage F2
• Lipronding verlaagt zowel de F2 als de F3
57
Formanten: vocalen
58
Articulatie
Vocalen
59
Formanten: vocalen
Klinkerdriehoek
60
Formanten: vocalen
61
Categoriale
Perceptie
Wij horen akoestisch verschillende klanken vaak als
dezelfde klank
Afhankelijk van de fonemen en allofonen van de taal
uitgebreid in Tools college
62
Formanten: vocalen
Formanten (in Hz) neutrale stand van spraakbuis:
[ə]
F1
500
F2
1500
F3
2500
63
Formanten: vocalen
Formanten (in Hz)
[i]
[a]
[u]
F1
300
800
300
F2
2500
1500
900
F3
3000
2700
2500
64
Formanten: Vocalen
[a]
[e]
[i]
a e
i
o u
636
368
273
382
459
F2 1439
2012
2134
881
1999
F3 1974
3656
3187
2568
3063
F1
[u]
[o]
65
Formanten: vocalen
Diftongen:
66
Formanten: vocalen
F1 Frequentie
􀁺 Verlaagd:
constrictie in voorste helft (voor het midpalatum)
- /i/
􀁺 Verhoogd:
constrictie in achterste helft (pharynx)
- /a/
67
Formanten: vocalen
F2 Frequentie
􀁺 Verlaagd:
constrictie bij lippen of achterste of orale
holte boven de pharynx
- /u/
􀁺 Verhoogd:
constrictie in voorste orale holte achter de
lippen en tanden
- /i/
68
Formanten
F3 Frequentie
􀁺 Verlaagd:
constrictie bij de lippen, mid-palatum of de
pharynx
- rhotics
Verhoogd:
constrictie bij de voorste orale holte of het
voorste palatum
- /j/
69
Articulatie
Consonanten
70
Formanten: consonanten
Formanttransities
Frequentie
Richting van transities:
• afhankelijk van de combinatie van
consonanten en vocalen
• het punt waarnaar de F2-transitie wijst is
de locus-frequentie van de consonant
Locusfrequenties:
labiaal:
alveolair:
velair:
700 Hz
1700 Hz
71
2700
Hz
Gestileerd
72
Formanten: consonanten
[ba] [da] en [ga]. Welk plaatje is welke consonant?
73
Formanten: consonanten
Obstruenten
Stemloze:
1. Een periode zonder spectrale energie die
correspondeert met de periode van algehele
constrictie
2. (vaak) gevolgd door een ‘release burst’
Stemhebbende:
Het gesloten interval wordt gekarakteriseerd door een
laag-frequent periodieke component (voice-bar) in
het spectrogram
74
Formanten: consonanten
Stemloze obstruenten: spectral zero + korte periode
van frictie-ruis
[k]
75
Formanten: consonanten
Stemhebbende obstruenten: pre-voicing voice bar
[aba]
76
Vocaal - Plosief - Vocaal
77
Formanten: consonanten
Fricatieven
• Stemloze fricatieven bestaan uit een periode van frictie,
geproduceerd in de orale constrictie
• De spectrale eigenschappen van deze frictie-ruis worden
bepaald door de precieze manier waarin de ruisbron wordt
gegenereerd, plus de filter-functie van het deel van het deel van
de spraakbuis vóór de constrictie
[s]: concentratie energie rond 5500 Hz
[f]: gelijkmatiger verdeling energie, vlak spectrum
[x]: concentratie rond 1500 Hz
• Stemhebbende fricatieven bevatten een bijkomende laagfrequente component (voice-bar) in het spectrogram
78
Formanten: consonanten
79
Formanten: consonanten
Stemloze fricatieven: hoge ‘formanten’
[asa]
80
Formanten: consonanten
Stemhebbende fricatieven: naast hoge ‘formanten’ een lage
periodieke component
[aza]
81
Vocaal - Fricatief - Vocaal
82
Formanten: consonanten
Nasalen en Lateralen
• Zowel nasalen als lateralen hebben een lagere
intensiteit dan vocalen
• Nasalen hebben een lage, brede eerste formant:
‘nasal murmur’
• Zowel nasalen als lateralen hebben spectrale ‘dalen’
die onstaan doordat de spraakbuis (grotendeels bij l)
gesloten is tijdens de articulatie: antiformanten (ca.
400, 1200 en 2000 Hz voor nasalen, 2125 voor
lateralen)
83
Formanten: consonanten
Nasalen en Lateralen: antiformanten
84
Liquids & Glides
(Ainsworth and Paliwal, 1984)
typical set of responses obtained from listening to
glide/liquid-vowel synthetic stimuli (simplified)
3160 Hz
w w w l
l
l
l

w w w l
l
l
l
F3 loc. freq. w w w r r
r
l

w w w r r
r
j
1540 Hz
w w r
r r
r
r
760 Hz 
F2 locus freq. 
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
2380 Hz
85
Geluid zichtbaar maken
86
Geluid zichtbaar maken
Oscillogram:
weergave van de
luchtdrukverstoringen (dB)
Intensiteitscontour:
Spectrogram:
weergave van de intensiteit
(dB) van iedere frequentie
(Hz), op kort opeenvolgende
momenten in de tijd
zwarte ‘balken’: formanten
luidheid (dB)
Toonhoogtecontour (F0):
grondfrequentie (Hz),
intonatiecontour
Duur (Sec):
de duur van segmenten
87
Geluid lezen
88
Geluid lezen
89
Vocalen  4 lettergrepen
Geluid lezen
- hoge F1: open
- lage F2: achter
- 1e iets hogere F2: voor
- lage F1: gesloten
- hoge F2: voor
- F2 en F3 dicht bij elkaar: voor
- 1e hogere F1: opener
- 2e hogere F2: voor
- 1e lange duur: beklemtoond
90
Geluid lezen
- hoge F1: open
- lage F2: achter
- 1e iets hogere F2: voor
[a]
[]
- lage F1: gesloten
- hoge F2: voor
- F2 en F3 dicht bij elkaar: voor
- 1e hogere F1: opener
- 2e hogere F2: voor
- 1e lange duur: beklemtoond
[e]
[i]
91
Geluid lezen
92
Glottisslag
Consonanten
Geluid lezen
- ruis
- stemloos
- hoog
stemloze fricatief,
alveolair
- sluiting
- release-ruis
locus freq. 2700 Hz
stemloze obstruent,
velair
- sluiting
- voice bar
- korte release
- locus freq. 1700 Hz
stemhebbende
obstruent, alveolair
- vocaalachtig
- lagere amplitude
- voice bar
- locus freq. 700 Hz
- antiformanten?
nasaal, labiaal
93
Geluid lezen
- ruis
- stemloos
- hoog
stemloze fricatief,
alveolair
- sluiting
- release-ruis
locus freq. 2700 Hz
stemloze obstruent,
velair
-sluiting
- voice bar
- korte release
- locus freq. 1700 Hz
stemhebbende
obstruent, alveolair
- vocaalachtig
- lagere amplitude
- voice bar
- locus freq. 700 Hz
- antiformanten?
nasaal, labiaal
[s]
[k]
[d]
[m]
94
Geluid lezen
[ a
k

d
e
m
i
s
95
]
Literatuur
Rietveld en Van Heuven (1997). Algemene Fonetiek.
Coutinho.
Ladefoged, Peter (2001). Vowels and Consonants. An
Introduction to the Sounds of Languages. Blackwell
Publishing.
Website bij Ladefoged's boek, met geluiden en
filmpjes ed.
Ladefoged, Peter and Ian Maddieson (1996). The
sounds of the world’s languages. Blackwell Publishing.
96
Extra
1.
SH-tweeling (verklaar substituties op basis van
articulatie en akoestiek)
2.
‘Endlessly rising’ en ‘falling’
3.
Boventoonzingen
4.
The singer’s formant
5.
Resonantie (uitgebreid)
97
Tweeling
zomer (2e X)
voorbij
tik tik tik
vallen
grond
geel
/z/  [t]
/b/  [m]
//  []
/l/  [n]
//  [t]
/l/  [w]
• fronting, gliding, l-n substitutie
• (vgl. first language acquisition data)
98
The sounds of IPA
Front
Close

Central


Back


 
Close-mid
Open-mid








 

 

Open
 

 
99
‘Endlessly rising’
• Open in CoolEdit en zet in een loop
Rising?
100
Endlessly rising?
101
Endlessly rising?
102
Boventoonzangers
103
Extra
Singer’s formant
• (opera-)zangers kunnen over een groot orkest heen
zingen
• concentratie van energie rond 3000 Hz (Sundberg,
1972) om er bovenuit te komen
• orkest: rond 500 Hz
• F3, F4 en F5 vormen een cluster
104
Resonantie
105
Resonantie
106