Analyse der Intonation in der forensischen Phonetik

Download Report

Transcript Analyse der Intonation in der forensischen Phonetik

Sprecherdiskrimination
anhand der Intonation
Ludwig-Maximilians-Universität München (LMU)
Seminar: Forensische Phonetik
Professor: Prof. Dr. Jonathan Harrington
Referentin: Clara Tillmanns
Datum: 15.11.2007
• Inwiefern kann eine Analyse der
Intonation für die forensische
Phonetik nützlich sein?
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
2
Pensum
1. Grundlagen und Einführung
2. Experiment
3. Diskussion der Ergebnisse
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
3
Pensum
1.
1.1
1.2
1.3
2.
2.1
2.2
2.2.1
2.2.2
2.2.3
2.2.4
2.2.5
3.
Grundlagen und Einführung
Intonation und Sprechererkennung
Die phonologische Struktur der Intonation
Phonologische und phonetische Unterschiede
zwischen Sprechern
Experiment
Argumentation und Hypothese
Prozedere
Sprachdaten
Versuchspersonen
Ablauf der Aufnahmen
Analysen
Ergebnisse
Diskussion der Ergebnisse
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
4
Grundlagen und Einführung
1. Intonation und Sprechererkennung
2. Die phonologische Struktur der
Intonation
3. Phonologische und phonetische
Unterschiede zwischen Sprechern
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
5
Grundlagen und Einführung
1.1 Intonation und Sprechererkennung
Intonation:
Suprasegmentelles System, das dazu dient:
Strukturen abzugrenzen
Informationen hervorzuheben
Semantische Unterschiede zu unterstreichen
Turn-Taking zu regulieren
Erzielt durch:
hauptsächlich die Variation der Glottalschwingung,
wahrgenommen als Tonhöhe
Längung des betonten Wortes (Silbe, Vokals)
Auffällige Tonhöhenbewegungen
Höhere Lautheit (Amplitude; stark beeinflusst von F0)
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
6
Grundlagen und Einführung
1.1 Intonation und Sprechererkennung
Intonation innerhalb der Sprechererkennung:
Statistiken auf der Grundlage von F0
Und globale Vergleiche von F0-Konturen in
bestimmten Äußerungen zeigten sich als hilfreich
Solche Langzeitstatistiken verschleiern den Einfluss von
Ereignissen, die mit lexikalischen und segmentellen
Ereignissen verknüpft sind.
-> hier Nolan (2002) die Untersuchung der Nützlichkeit
für die Sprechererkennung von Merkmalen, die von
einer linguistischen Analyse der Intonation definiert
sind.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
7
Grundlagen und Einführung
1.2 Die phonologische Struktur der Intonation
Die linguistische Struktur der Intonation ist nicht eindeutig.
Zur Erfassung gibt es drei konkurrierende Modelle:
•
•
•
Die „britische“ Tradition (z.B. Crystal 1969)
Das IPO-Modell (z.B. `t Hart, Collier & Cohen 1990)
Der autosegmentell-metrische Ansatz (Ladd 1996)
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
8
Grundlagen und Einführung
1.2 Die phonologische Struktur der Intonation
Die „britische“ Tradition konzentriert sich auf
dynamische Ereignisse wie falls und rises.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
9
Grundlagen und Einführung
1.2 Die phonologische Struktur der Intonation
Der autosegmentell-metrische Ansatz
Metrisch prominenten (betonten) Silben werden Töne
(H, L) zugeordnet (pitch accents):
- einzelne Töne: H*, L* (single tones)
- Kombinationstöne: z.B. H*L
Benannt wird der Ausgangspunkt und das Ziel,
nicht die Bewegung selbst.
Intonationsgrenzen werden Grenztöne zugeordnet:
- H%, L%
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
10
Grundlagen und Einführung
1.3 Phonologische und phonetische Unterschiede
zwischen Sprechern
Intonatorische Variabilität
Beispiel: Ja-oder-Nein-Frage
H* L H%
L* H%
H* H%
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
11
Grundlagen und Einführung
1.3 Phonologische und phonetische Unterschiede
zwischen Sprechern
Phonetische Variabilität
[SlIm] / [Slym]
Es besteht ein
Auditiver Unterschied
Akustischer Unterschied
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
12
Grundlagen und Einführung
1.3 Phonologische und phonetische Unterschiede
zwischen Sprechern
Übertragbar auf die Intonation:
Auditiver Unterschied:
Welcher Silbe wird ein Akzent zugeordnet?
Akustischer Unterschied:
An welcher Position (auf der Zeitachse) wird dieser
Akzent tatsächlich realisiert?
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
13
2. Experiment
1.
Argumentation und Hypothese
2.
Prozedere
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
14
2. Experiment
2.1 Argumentation und Hypothese
Argumentation und Hypothese
Nolan und Ferres (1999) zeigten, dass Sprecher vierer
britischer Dialekte das Maximum der
Tonhöhenbewegung zur Akzentuierung je nach
Dialekt an unterschiedlichen Stellen realisierten.
Nämlich während der betonten Silbe,
der folgenden Silbe oder
der darauf folgenden Silbe.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
15
2. Experiment
2.1 Argumentation und Hypothese
-> zwei Hypothesen:
•
•
Die Zuordnung der intonatorischen Tonhöhe zu
einer Silbe ist zeitlich unterschiedlich zwischen
Sprechern.
Die Zuordnung bleibt trotz Änderungen des
Tonhöhenumfangs konstant.
Betrachtet wird also nicht die Grundfrequenz in Hz sondern
die (zeitliche) Position der Maxi- und Minima in Bezug auf
die ihnen zugeordneten linguistischen Einheiten.
(Deshalb: Zuordnungs-Merkmal (alignment feature) nicht
Tonhöhen-Merkmal (pitch feature))
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
16
2. Experiment
2.2 Prozedere
1.
Sprachdaten
2.
Versuchspersonen
3.
Ablauf der Aufnahmen
4.
Analysen
5.
Ergebnisse
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
17
2. Experiment
2.2 Prozedere
1. Sprachdaten:
•
Zum Testen von subphonologischen Ereignissen, muss die
phonologische Struktur identisch sein.
•
Jede Äußerung muss abgrenzbare Tonhöhenumfänge darstellen.
A: We were re - lying on a milliner.
H
L*
H* L - L%
B: A milliner?
H* L - H%
Mit drei Tonhöhenumfängen: neutral, gestaucht, gedehnt.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
18
2. Experiment
2.2 Prozedere
2. Versuchspersonen
8 Teilnehmerinnen mit intonatorischer Vorbildung
Alle Sprecherinnen des Southern British Dialekts
3. Aufnahmen
Orientierungsaufnahmen sollten mit „der eigenen Stimme“ imitiert
werden
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
19
2. Experiment
2.2 Prozedere
4. Analyse
Breitbandsonagramm und Oszillogramm:
Zeitliche Lage und F0 in Hz von einigen intonatorischen Ereignissen
Meist Maxima (H*) und Minima (L*) sowie der Zeitpunkt, zu der die
Mitte des Frequenzbereichs zwischen H* und L* erreicht wurde
(mid-fall).
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
20
2. Experiment
2.2 Prozedere
Nicht notwendigerweise äquidistant im Zeitbereich
Fig.1: F0-Verlauf der Äußerung „We were relying on a milliner.“ mit gedehntem Tonhöhenumfang (aus Nolan 2002)
L* relying
H* milliner
L milliner
mid Mittfrequenz
zwischen H* und L
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
21
2. Experiment
2.2 Prozedere
Fig.2: F0-Verlauf der Äußerung „A milliner?“ mit neutralem Tonhöhenumfang (aus Nolan 2002).
H* milliner
L2 milliner
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
22
2. Experiment
2.2 Prozedere
Zuordnung der intonatorischen Ereignisse zu
Segmenten:
A: L* als % von [rIlaIIN On]
(von Lösung des /l/ bis Beginn des velaren Nasals)
A: H* und mid-fall als % von [mIlIn@]
B: H*, mid-fall und L2 (Beginn final rise) je als ein
Prozentsatz von [mIlIn@]
A: H* to mid-fall (absolute duration in ms)
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
23
2. Experiment
2.2 Prozedere
Evaluation der Aussagekraft der Merkmale über die
Diskrimination: F-ratio
Wie stark variieren die Merkmale zwischen und innerhalb der
Sprecherinnen?
F=
Varianz der Sprecherdurchschnitte (1)
Durchschnitt der Sprechervarianzen (2)
zwischen
innerhalb
Wenn (1) groß: Große Unterschiede zwischen den Sprechern ->
F-ratio > 1
Wenn (1) klein: kaum ein Unterschied zwischen den Sprechern ->
F-ratio < 1
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
24
2. Experiment
2.2 Prozedere
5. Ergebnisse
F-ratio-Werte der Merkmale dieser Studie werden mit den F-ratio-Werten
der ersten drei Formanten von /l/ und /r/ verglichen:
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
25
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
2. Experiment
2.2 Prozedere
Ergebnis 1/7:
Kein Merkmal hat einen so großen Effekt auf die Sprecheridentifikation wie
F3 von /r/ (denn es gibt mehrere Allophone im britischen Englisch).
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
26
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
2. Experiment
2.2 Prozedere
Ergebnis 2/7:
Die schlechtesten Werte der Zuordnungsmerkmale sind schlechter als der
schlechteste Wert der Formanten.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
27
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
2. Experiment
2.2 Prozedere
Ergebnis 3/7:
1, 2, 5 sind < 1 und zeigen, dass die Varianz der einzelnen Sprecherinnen (intra)
sogar größer ist, als die Varianz der Durchschnitte der Sprecherinnen (inter).
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
28
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
2. Experiment
2.2 Prozedere
Ergebnis 4/7:
Bester Wert: mid-fall in A (Unterschiedliche Stellung in 6, fall-rise, statt fall L%)
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
29
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
2. Experiment
2.2 Prozedere
Ergebnis 5/7:
2t bester Wert: Beginn des final-rise in B.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
30
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
2. Experiment
2.2 Prozedere
Ergebnis 6/7:
4: der einzige absolute Wert liegt auch nur knapp über 1.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
31
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
2. Experiment
2.2 Prozedere
Ergebnis 7/7: Vergleich von Tonhöhen-Merkmalen mit Zuordnungs-Merkmalen
L* in A als absoluter Frequenzwert hat einen F-ratio von 4,16, im Vergleich zum
besten Zuordnungs-Merkmal mit 3,76.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
32
Fig.3: Vergleich der F-ratio-Werte der Intonation-Zuordnung dieser Studie mit denen von Nolan 1983 von den FormantFrequenzen von /l/ und /r/.
3. Diskussion
Warum sind die guten Merkmale so gut?
Warum sind die schlechten Merkmale so schlecht?
Was heißt das für die Wahrnehmung von Intonation zur Sprechererkennung?
Was heißt das für den Nutzen der Analyse der Intonation in der forensischen
Phonetik?
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
33
3. Diskussion
Warum sind die guten Merkmale so gut?
Warum sind die schlechten Merkmale so schlecht?
Schon frühere Studien haben gezeigt, dass L* ein relativ stabiler Wert eines
Sprechers für Äußerungen die mit fallender Tonhöhe enden, ist (Liberman
& Pierrehumbert 1984).
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
Fig.4: Diagramm der Positionen: mif-fall in A auf der x-, mid-fall in B auf der y-Achse.
34
3. Diskussion
Warum sind die guten Merkmale so gut?
Warum sind die schlechten Merkmale so schlecht?
Hohe Variabilität innerhalb der Sprecher, geringe Variabilität zwischen den
Sprechern, eine Kombination aus beidem?
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
35
Fig. 5: Vergleich der Varianzen zwischen und innerhalb der Sprecher für zwei Zuordnungs-Merkmale: H* und mid-fall aus A.
3. Diskussion
Warum sind die guten Merkmale so gut?
Warum sind die schlechten Merkmale so schlecht?
Heißt das nun, dass doch dynamische intonatorische Ereignisse
bedeutungsvoller sind als die Extrempunkte (innerhalb der
Sprechererkennung)?
Achten Sprecher während der Produktion stärker darauf, wann ein mittlerer Wert
erreicht sein soll, als auf die Zielpunkte?
Nicht so schnell, die berühmten Messschwierigkeiten...
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
36
3. Diskussion
Warum sind die guten Merkmale so gut?
Warum sind die schlechten Merkmale so schlecht?
Messfehlerquellen:
- Der Verlauf der Grundfrequenz ist nie eine glatte Kurve sondern unruhig:
Dellen oder Beulen können von Messgeräten als Maxima interpretiert
werden obwohl für die Wahrnehmung der „gröbere“ Verlauf der wichtigere
ist .
- Maxima und Minima zeigen sich selten in ^ - oder v - Form.
D.h.: Es ist schwer (wenn nicht nahe unmöglich) den richtigen Punkt auf
einem Plateau zu finden.
- ...
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
37
3. Diskussion
Warum sind die guten Merkmale so gut?
Warum sind die schlechten Merkmale so schlecht?
Um die Frage wenigstens etwas zu klären, ob die schlechten Merkmale wirklich
schlechter sind als die Guten, wurde der Einfluss der enormen
Tonhöhenunterschiede dieser Äußerungen auf die Varianz der H*- und
mid-fall- Werte berechnet.
Siehe da:
mid-fall ist mit einer Korrelation von 0.26 weniger beeinflusst als
H* mit einer Korrelation von 0.40.
Schön, aber das nur am Rande.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
38
3. Diskussion
Zurück zur Frage:
Ziel oder Bewegung?
Und auch:
Was heißt das für die Wahrnehmung von Intonation zur Sprechererkennung?
Da über die zeitlichen Aspekte der Maxima und Minima in dieser Studie fast
nichts ausgesagt werden kann,
nun noch ein kurzer Blick auf die Bewegung von einem Ziel zum nächsten.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
39
Fig. 6: Schematische Repräsentation von zwei möglichen „koartikulatorischen“ Transitionen von unterschiedlichen
Personen zwischen phonologischen benannten H und L Zielen.
3. Diskussion
Zurück zur Frage:
Ziel oder Bewegung?
Und auch:
Was heißt das für die Wahrnehmung von Intonation zur Sprechererkennung?
Nolan (1983) fand, dass unterschiedliche Bewegungsbahnen
der Artikulatoren zwischen den gleichen Zielen zur
Sprechererkennung beitragen.
Hiervon die These für weitere Forschung:
Sprecher wählen „ihren eigenen Weg“ innerhalb der Freiheit
zwischen zwei Zielen; Hörer nutzen diesen zur
Sprechererkennung.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
40
Fig. 6: Schematische Repräsentation von zwei möglichen „koartikulatorischen“ Transitionen von unterschiedlichen
Personen zwischen phonologischen benannten H und L Zielen.
3. Diskussion
Was heißt das für den Nutzen der Analyse der Intonation in der forensischen
Phonetik?
Von dieser Studie ist kein direkter Nutzen ableitbar da:
1.
Vergleiche auf der Basis des gleichen Textes
2.
In gleicher intonatorischer Realisation
3.
Mit vorsichtig ausgewähltem Phoneminventar (Sonoranten und Vokale) um
Störungen des F0-Verlaufs zu vermeiden.
4.
Aufnahmen entstanden in einem schallarmen Raum.
Aber
Die Zuordnungs-Merkmale zeigten auch bei extremen Tonhöhenunterschieden
die Möglichkeit Sprecher zu diskriminieren.
An deren Robustheit muss weiter gearbeitet werden.
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
41
Fig. 6: Schematische Repräsentation von zwei möglichen „koartikulatorischen“ Transitionen von unterschiedlichen
Personen zwischen phonologischen benannten H und L Zielen.
Quellen
Crystal. D. (1969) Prosodic Systems and Intonation in English, London:
Cambridge University Press
Ladd, D. R. (1996) Intonational Phonology, Cambridge: Cambridge
University Press
Liberman, M. und Pierrehumbert, J. (1984)Intonational invariance under
changes in pitch range and length, in M. Aronoff and R. Oerhle (Hrg.),
Language Sound Structure, Cambridge, Mass.: MIT Press, S. 157-233
Nolan, F. (2002) Intonation in speaker identification: an experiment on pitch
alignment features. INTERNATIONAL JOURNAL SPEECH
LANGUAGE AND THE LAW, 9, 1-21
`t Hart, J., Collier, R. und Cohen, A. (1990) A Perceptual Study of
Intonation: an Experimental-Phonetic Approach to Speech Melody,
Cambridge: Cambridge University Press
Clara Tillmanns: Sprecherdiskrimination anhand der Intonation
42