Modul H2 – Prosodie und Intonation SoSe 2008 - Benno Peters • Einführung und Auffrischung • Historie und wichtige Literatur der Prosodieforschug • Der Kieler.

Download Report

Transcript Modul H2 – Prosodie und Intonation SoSe 2008 - Benno Peters • Einführung und Auffrischung • Historie und wichtige Literatur der Prosodieforschug • Der Kieler.

Modul H2 – Prosodie und Intonation
SoSe 2008 - Benno Peters
• Einführung und Auffrischung
• Historie und wichtige Literatur der
Prosodieforschug
• Der Kieler Ansatz zu Form und Funktion der
Prosodie
• Referate
• Diskussionen
• Experimente
• Wünsche?
Einführung in Anlehnung an Astrid
Paeschke
• Begriffe
– Prosodie, Intonation, Suprasegementalia ...
– Unterschiede im Verständnis von Phonetik, Phonologie
und Sprechwissenschaft
• Funktionen
– linguistische
– paralinguistische
• prosodische Merkmale und ihre akustischen Korrelate
• Modelle
– Pierrehumbert, ToBI, GToBI
– IPO, KIM
– Fujisaki
Begriffe
•
•
•
•
Suprasegmentalia
Prosodie
Intonation
Betonung
– Satzakzent, Phrasenakzent
– Wortakzent, lexikalischer Akzent
• Betonungsgruppe, Takt, Fuß
• Deklination:
–
–
–
–
declination line
top (head) line
base line
range
Begriffe: Prosodie
• Gesamtheit aller phonetischen Eigenschaften
des Sprechaktes, deren Domäne über das
Segment hinausgeht = suprasegmentale
Merkmale
– willkürlich
• Intonation, Dauerstruktur, Sprechgeschwindigkeit Lautstärkeänderungen,
Reduktionsgrad
• > Akzent, Prominenz, Sprechrhythmus, Phrasierung
– unwillkürlich
• Mikroprosodie
• theoretisch auch alle willkürlich änderbaren Merkmale, wenn sie den
unwillkürlichen Ausdruck von Emotionen, Alter, Geschlecht,
Gesundheitszustand u.ä. erzeugen
• Segmentelle Merkmale?
Prosodie - Begriffsverwirrung
• Ursache: verschiedene Sichtweisen, wobei
– unterschiedliche Aspekte im Vordergrund stehen
– unterschiedliche Begriffe für die gleiche Sache
verwendet werden
– gleiche Begriffe unterschiedlich interpretiert werden
Prosodie
strukturell
Linguistik,
Phonologie
funktional
Semantik,
Psychologie,
Kommunikationsforschung
akustisch
Phonetik,
Akustik
Funktionen der Prosodie
Linguistische Funktionen
vs
paralinguistische Funktionen
Funktionen der Prosodie
• Linguistische Funktionen:
– Hervorhebung von Silben bzw. Wörtern
– Strukturierung von Äußerungen
• Phrasengrenzen
– Bedeutungsunterscheidung durch Betonung
– Anzeige des Satzmodus:
• Aussage, Frage, Progredienz
> Beziehungen zur Morphologie, Syntax,
Semantik und Pragmatik
Funktionen der Prosodie
Die Morphologie ist der Teilbereich der Linguistik,
der die Erforschung der bedeutungs- oder
funktionstragenden Elemente einer Sprache, der
Morpheme, zum Gegenstand hat. Viele Morpheme
werden in unterschiedlichen Formen, Allomorphen
verwendet. Morpheme setzen sich aus Phonemen
zusammen und bilden ihrerseits Wörter. Die
Prinzipien bzw. Regularitäten der inneren Struktur
von Wörtern gehören ebenfalls zum Gebiet der
Morphologie.
Bezug zur Prosodie?
Funktionen der Prosodie
Bezogen auf natürliche Sprachen ist Syntax Teil
der Grammatik. Im herkömmlichen Sinn
bedeutet Syntax dann die Lehre vom
(korrekten) Satzbau bzw. Satzbau selbst. Die
Syntax als Teil der Grammatik behandelt die
Muster und Regeln, nach denen Wörter zu
größeren funktionellen Einheiten wie Phrasen
(Teilsätze) und Sätzen zusammengestellt und
Beziehungen wie Teil-Ganzes, Abhängigkeit etc.
zwischen diesen formuliert werden.
Bezug zur Prosodie?
Funktionen der Prosodie
Die linguistische Semantik untersucht die
Bedeutung sprachlicher Zeichen. Die
kleinsten Zeichen sind in diesem Sinne die
Morpheme, die nächstgrößeren die Wörter
bzw. Lexeme; es folgen die Satzglieder,
Teilsätze, Sätze und Texte.
Bezug zur Prosodie?
Funktionen der Prosodie
Da sich die Pragmatik ebenfalls mit der "Bedeutung"
von Zeichen befasst, erscheint aber eine klare
Trennung nur schwer möglich. Unterscheidet man
Satzbedeutung und Äußerungsbedeutung sowie
Sprecherbedeutung, so befasst sich die Semantik
mit der Satzbedeutung, Semantik und Pragmatik mit
der Äußerungsbedeutung und allein die Pragmatik
mit der Sprecherbedeutung. Die Sprecherbedeutung
ist das, was der Sprecher mit einer Äußerung meint.
Bezug zur Prosodie?
Funktionen der Prosodie
• Paralinguistische Funktionen:
– Informationen über den Sprecher
• Geschlecht, Alter, Gesundheitszustand
• Emotionen, Einstellungen, Haltungen, Persönlichkeitseigenschaften
– Informationen über den Sprechstil (z.B.
spontan, gelesen, dialogisch)
– Informationen über den situativen Kontext (z.B.
formell, intim)
– Dialekt / Soziolekt ?
Prosodische Merkmale
• Klassifikation prosodischer Merkmale hinsichtlich
ihrer Funktionen
• Welche suprasegmentellen Merkmale könnten
bestimmten funktionalen Bereichen zugewiesen
werden?
• Problem: keine Trennung der Merkmale für
linguistische und paralinguistische Information
möglich
–  erschwert die systematische Analyse
Sinn der Trennung in linguistische und paralinguistische
Funktionen ?
Akustische Korrelate prosodischer
Merkmale
• Sprechmelodie 
Grundfrequenzverlauf
(Intonation)
• Sprechtempo

Laut- und Pausendauer
• Lautstärke

Signalenergie
• Stimmklang

spektrale Eigenschaften
Beispiel: Sprechmelodie als F0-Verlauf
Begriffe: Intonation
• bezeichnet den Tonhöhenverlauf innerhalb einer
Silbe, eines Wortes, Satzes oder Sprechaktes
• gleichbedeutend sind:
– Stimmführung
– Satzmelodie
– Sprachmelodie/Sprechmelodie
• im weiteren Sinne: Gesamtheit aller prosodischen
lautsprachlichen Merkmale (>
Intonationsforschung, Intonologen)
Begriffe: Akzent / Betonung
• Akzent und Betonung sind gleichbedeutend
– oft auch: Betonung ist die akustische Realisierung eines
lexikalischen Akzentes
• Linguistisch:
– Satzakzent
– Wortakzent (lexikalischer Akzent): hauptbetont,
nebenbetont, unbetont
• weitere Begriffe
– Prominenz, Hervorhebung
– Kontrastakzent, Emphase
• Wahrnehmung: graduell, stufenweise oder binär?
Konzept des Wortakzents (lexikalischer
Akzent)
• lexikalischer/phonologischer Ansatz:
– Wortakzent im Deutschen ist ein binäres
phonologisches Merkmal (nicht im Französischen)
– Silbe ist betont oder unbetont, Festlegung nach
phonologischen Regeln
– Sekundärakzente in Komposita
– da nicht jeder lexikalisch vorgegebene Akzent realisiert
wird, müssen Regeln für die Realisierung von
Wortakzenten erstellt werden
– Regeln = Strukturbedingungen
• Morphologische, syntaktische und semantisch-pragmatische
• phonetische Sichtweise:
– jede Silbe ist potenziell akzentuierbar
Akustische Parameter
zur Realisierung des Wortakzents
• entsprechen den generellen prosodischen
Parametern:
– Grundfrequenz
– Intensität
– Lautdauer
– Vokalqualität
– Reduktionsgrad
Akzentgruppe / Betonungsgruppe
• Engl: accent group, stress group
• Deutsch auch: Takt, Fuß
• Definition:
– betonte Silbe und die nachfolgenden unbetonten
Silben
– über Wortgrenzen hinweg
– nicht über Phrasengrenzen hinweg
(beginnt nächste Phrase mit unbetonter Silbe,
dann Auftakt)
– Beginn (nach Thorsen) am Anfang des Vokals der
betonten Silbe
Phrasierung
• Gliederung einer Äußerung in Abschnitte
– mit eigener Intonationskontur und
Deklinationslinie
• Abschnitt = Intonationsphrase,
intonatorische Phrase, prosodische Phrase
– Intonatorische Phrasen müssen nicht mit
syntaktischen Phrasen übereinstimmen
• Intonation beinhaltet Grenzsignale, um
Phrasengrenzen anzuzeigen
– Phrasenbeginn: Reset der Deklination,
Deklination
• = Absinken der Grundfrequenz im
Äußerungsverlauf
• erstmals beobachtete Pike 1945 das
Phänomen
• Begriff Deklination vs. Trend
• mögliche Ursachen:
– nachlassender subglottaler Druck
– Translation des Schildknorpels
• Erklärungsansätze und verschiedene
Beispiel Deklinationslinien
Intonationsmodelle
• Zweck:
– Erklärung der Komplexität und Diversität von
F0-Konturen
– Generierung von F0-Konturen für die
Sprachsynthese
• aus prosodischer Etikettierung oder syntaktischer Analyse
• Arten:
– Hierarchische Modelle
• Superpositionsmodelle
– Tonsequenzmodelle
Intonationsmodelle
• Pierrehumbert, ToBI
– Basis: H* und L*
– Erweiterungen: Grenztöne
• IPO: Intonationsgrammatik aus perzeptiv nicht
unterscheidbaren Kopiekonturen
• KIM:
– Gipfel, Täler, Endkonturen
• Fujisaki:
– mathematische Beschreibung des Kurvenverlaufs
– Superposition von Phrasenkomponente und
Akzentkomponenten
Tonsequenzmodelle
• phonologisch:
– repräsentieren die Prosodie einer Äußerung als
lineare Abfolge von abstrakten Einheiten
– generieren F0-Konturen aus einer Folge
phonologisch distinktiver Töne bzw. kategorial
versch. Pitchakzente
– Töne bzw. Pitchakzente sind strikt lokal
determiniert und interagieren nicht
• wichtigste Vertreter:
– Pierrehumbert
Modell nach Pierrehumbert
• Tonsequenzansatz wurde von Janet
Pierrehumbert entwickelt
• Grundlage sind die metrische und
autosegmentale Phonologie
– regelbasierte Klassifizierung von starken und
schwachen Silben
– segmentale und suprasegementale Ebene sind
synchronisiert, können aber unabhängig
voneinander agieren
– Intonationskontur = Abfolge von Tönen, die den
akzentuierten Silben zugeordnet werden
• H (hohe Töne) und L (tiefe Töne)
Pierrehumbert (Fortsetzung)
• Akzente und Töne des Modells:
– Pitchakzent
•
•
•
•
jedes prosodische Wort besitzt einen Pitchakzent
einfache Töne: H*, L*
bitonale Töne: H*+L, H+L*, L*+H, L+H*
* bezeichnet die betonte Silbe des prosodischen Wortes
– Phrasenakzent
• markiert den Tonhöhenverlauf am Phrasenende (ip)
• bestimmt den Tonhöhenverlauf zwischen Pitchakzent und Grenzton
• H-, L-
– Grenztöne
• bestimmen den Tonhöhenverlauf am Anfang und am Ende von IPs
• notiert werden initiale und finale Grenztöne an den Rändern der IPs
Pierrehumbert (Fortsetzung 2)
• Grammatik beschreibt wohlgeformte
Tonsequenzen
• Bsp:
Das ist ein richtig guter Vorschlag.
%H
H*
H* L- L%
• Synthese der Intonation:
– abstrakte tonale Repräsentation  phonetische
Realisierungsregeln  F0-Kontur
– Regeln legen die F0-Werte von H- und L-Tönen fest
Intonationsgrammatik des
Tonsequenzmodells
nach Pierrehumbert
ToBI / GToBI
• ToBI = Tones and Break Indices
• GToBI = an das Deutsche angepasste Version
• Weiterentwicklung des Tonsequenzmodells von
Pierrehumbert
– = Formalisierung als Transkriptionssystem (phonemisch,
weit)
• Ton-Inventar:
Pitchakzente
Phrasentöne
initial
final
Phrasenakzente
Grenztöne
Amerik.
Deutsch
H*, L*
L+H*, L*+H, H+!H*
H*L, L*H
(L*HL, HH*L, H*M)
%H, %L
H%, L%
H-, LL-L%, L-H%, H-L%, H-H%
ebenso
IPO-Modell
• Datenbank niederländischer (gelesener)
Sprachdaten wurde analysiert
• Konturen vereinfacht, solange perzeptiv kein
Unterschied erkennbar war  Kopiekontur
– Stilisierung der Kontur durch lineare Abschnitte
• Intonationsgrammatik
– Satz von Standardkonturen
– Regeln zur Verkettung der Konturen
– Deklinationsregeln
• ohne phonologischen Formalismus
• arbeitet auf Satzebene als Intonationsdomäne
• bisher für Niederländisch, Englisch und Deutsch
verfügbar
Deklination im IPO-Modell
• 2 Basislinien (0, 3), 2 zusätzliche Linien für
sehr starke Betonungen
• Tonhöhenumfang:
– Englisch: 12 HT, Deutsch: 7,5 HT, Niederländisch: 6
HT
Kieler Intonationsmodell (KIM)
• entwickelt von Klaus Kohler (1991)
• regelbasiert
– Regeln steuern die akustischen Parameter
– Regelwerk ist mit Hilfe einer generativen Grammatik
formuliert
• phonologisch ausgerichtet
• beschreibt die grundlegende globale Makroprosodie von
Phrasen und Sätzen
– schließt auch Mikroprosodie mit ein
• Ziel:
– Modellierung der gesamten prosodischen Vielfalt mittels
einer begrenzten Anzahl von Kategorien und Regeln
KIM (Fortsetzung)
• erfasste linguistische Kategorien:
–
–
–
–
–
–
–
Wortbetonung
Satzakzent
Intonation
Synchronisation
Grenzmarkierungen
Sprechgeschwindigkeit
„Downstep“ und „Reset“
• Downstep = sequentieller Abstieg = jeder folgende F0-Gipfel liegt etwas
tiefer als der vorangehende
• statt Deklination
Fujisaki-Modell
• Dekomposition komplexer F0-Konturen in
einfachere Kurven mit jeweils eigener
temporaler Domäne
• Merkmale:
– superponierend
– physiologisch fundiert
– linguistische Interpretation der Komponenten und
Steuerparameter ist möglich
– auf viele Sprachen anwendbar
Fujisaki-Modell (Fortsetzung)
FujisakiModellkompone
nten
Literatur
• zum Modell von Pierrehumbert
– Pierrehumbert, Janet (1980): The phonology and
phonetics of English intonation
Dissertation, MIT Press, Cambridge, MA, USA
• zu ToBI / GToBI
– Grice / Baumann / Benzmüller (2001): German
intonation within the framework of autosegmentalmetrical phonology.
http://www.coli.unisb.de/phonetik/projects/Tobi/gtobi.html
• zum IPO-Modell
– Adriaens, Léon M. H. (1991): Ein Modell deutscher
Intonation. Diss., TU Eindhoven und IPO
Literatur (Fortsetzung)
• zum Kieler Intonationsmodell:
– Klaus J. Kohler (1991): Prosody in speech synthesis: the interplay
between basic research and TTS application.
In: J. Phonetics Nr. 19, S. 121-138
– Klaus J. Kohler (1996): Modellgesteuerte Prosodiegenerierung:
Die Implementation des Kieler Intonationsmodells (KIM) in der
TTS-Synthese für das Deutsche.
In: Fortschritte der Akustik, DAGA'96. S. 90-91
– Klaus J. Kohler (1991): .A model of German intonation. In:
AIPUK 25, S. 295-368 (Inst. Phonetik und digitale
Sprachverarbeitung, Univ, Kiel)
– Kohler, Klaus J. (URL): .The Kiel IntonationModel (KIM), its
implementation in TTS synthesis and its application to the study
of spontaneous speech.
http://www.ipds.uni-kiel.de/forschung/kim.de.html
Literatur (Fortsetzung 2)
• zum Fujisaki-Modell:
– Bernd Möbius (1993): Ein quantitatives Modell der
deutschen Intonation.
– Hiroya Fujisaki (1988): A note on the physiological
and physical basis for the phrase and accent
components in the voice fundamental frequency
contour.