Konversationsanalys (CA) och kommunikationsreglering

Download Report

Transcript Konversationsanalys (CA) och kommunikationsreglering

Makropragmatik:
Textlingvistik och Samtalsanalys
Språk, kommunikation och tänkande
VT06
Staffan Larsson ([email protected])
• Introduktion
• Textlingvistik
• Samtalsanalys
– Conversation Analysis (CA)
– Dialogue games
Pragmatik
• Studiet av språkanvändning i olika sammanhang
(kontext)
• Grekiska: pragma = handling, aktivitet
• Allwood: studiet av lingvistisk kommunikation som
handling och interaktion mellan sändare och mottagare
• Dirven & Verspoor: språkets interpersonella funktion
(”användningen av språket i interaktion”)
• Till skillnad från
–
–
–
–
Språkets ideationella funktion (”att uttrycka idéer”)
Semantik: betydelse (dekontextualiserad)
Syntax (& morfologi): struktur
Fonetik, grafonomi: form
Kontext / sammanhang
•
Fysisk
–
–
–
–
•
Biologisk
–
•
Dialogdeltagarna är människor
Psykologisk
–
–
–
–
•
Tid & rum
Perceptuell kontext
Fysiska egenskaper hos dialogdeltagare (möjliggörande och förhindrande)
Artefakter, verktyg, hjälpmedel
Psykologiska attityder
Emotioner
Processer
Rationalitet
Sociologisk
–
–
–
–
–
–
Språklig kunskap
Dialog/diskurskontext
Sociala attityder
Konventioner
Etik
Sociala institutioner, roller etc.
Micro and macro
• Alternatively:
– Co-text: linguistic context - surrounding sentences / utterances
– Context: non-linguistic context
• Micopragmatics
– How are isolated utterances interpreted in relation to a context
– Interpersonal level
• Macropragmatics:
– Textual level
– How are sequences of utterances related to each other?
– How are sequences of utterances interpreted in relation to a
context?
Text linguistics
Text, representation
• Text (D&V):
– “the spoken or written evocation of an event or series of events”
– “the words we speak”
– “The linguistic expressions used in communication between
people and the interpretation the hearer or reader makes of
them”
• Text representation (D&V)
– “The interpretation of a coherent whole on the basis of text
elements and our own mental grasp of the world”
– A conceptual level mediating between linguistic expressions and
communicative intentions
– [here: not a representation as such, in the sense of something
explicit that can be written down]
Communication (D&V)
• A text almost never contains all the clues needed to
interpret it; we add a lot to the text based on our cultural
or world knowledge (context)
• Communication
– Means of expression
• Nonverbal (gestures, body language, …)
• Paralinguistic (intonation etc)
• Verbal
– Spoken
– Written
– World of speaker/hearer [more generally, Context as defined
previously]
• Ideas and feelings
• Cultural or world knowledge
Text linguistics
• “The study of how speaker and hearer manage to communicate via
texts, that is how they go beyond the text (words) they produce or
perceive to see the relations between the sentences, the
paragraphs, the sections etc.”
• Criticises earlier research (“Discourse Analysis”)
– Too formalistic
– Too simplified view of text as conjunction of sentences
• Comments
– Bias towards written communication; speech doesn’t have sections
– Regards interpretation as essentially a process of inferring relations
between text elements; this is assumed to capture the meaning of a
– Criticism is directed to research from the 60’s & not necessarily valid
today
– D&V take a mentalistic view of context (e.g. referents as mental objects
rather than things in the world) which is highly controversial and
arguably based on missing the distinction between intension and
extension
Coherence
• A text is coherent if it is possible to
construct a coherent representation of that
text
• Coherence is the property that
distinguishes texts from arbitrary sets of
sentences
Cohesion and coherence
• Cohesion = the explicit marking of coherence by
means of cohesive links
• Example
– “The adventures of Huckleberry Finn” must be
pronounced the most amusing book Mark Twain has
written for years. Moreover, it’s a more minute and
faithful picture of southwestern manners and customs
fifty years ago than was “Life on the Mississippi”,
while in regard to the dialect it surpasses any of the
authour’s previous stories in the command of the halfdozen species of patios which passed for the English
language in old Missouri
Coherence without cohesion
Twelve year term of imprisonment
London, April 10
The London court has convicted a Brighton
resident to twelve years imprisonment for
accessory to murder.
The victim was fatally wounded in a shooting
incident in a Winchester restaurant last
year.
Cohesion without coherence
• I bought a Ford. A car in which President
Wilson rode down the Champs Elysées
was black. Black English has been widely
discussed. The discussions between the
presidents ended last week. A week has
seven days. Every day I feed my cat. The
cat is on the mat. Mat has three letters.
Referential coherence
• Established by repeated reference to the same
objects in the context
• Example
– “The adventures of Huckleberry Finn” must be
pronounced the most amusing book Mark Twain has
written for years. Moreover, it’s a more minute and
faithful picture of southwestern manners and customs
fifty years ago than was “Life on the Mississippi”,
while in regard to the dialect it surpasses any of the
authour’s previous stories in the command of the
half-dozen species of patios which passed for the
English language in old Missouri
Referential coherence
• Exophoric reference
– Gets interpretation from co-text
– Referring to objects mentioned previously
• Endophoric reference
– Gets interpretation from context
– “Referring to something outside the text”
– E.g. deixis; “I’m here now”
Referential coherence
• Exophoric reference
– Anaphoric reference
• Gets interpretation from preceding context
– Cataphoric reference
• Gets interpretation from following context
• “That’s just my luck; first my tires burst and then
the bride is closed, too”
Definiteness
• Typically, a new referent is introduced by
an indefinite NP
– “A man was walking down the street”
• Referents which have already been
introduced are referred to using definites
– “The man stopped.”
Prominence
• The way in which referents are referred to
depends on the prominence of the referent
– Prominence = the extent to which something
is in the focus of attention
• If something is prominent, a pronoun is
often enough
• If something is less prominent, a full noun
phrase may be needed to establish coreference
• These conventions can be exploited:
– Overspecifying a referring NP (giving more
info is given than is necessary to identify the
referent) can be used to indicate
segmentation, e.g. a new paragraph
– Using an indefinite to refer to an already
introduced referent may be used to indicate
perspectivization
Relational coherence
• The linking of text parts with coherence relations
–
–
–
–
Cause-consequence
Contrast
Evidence
…
• Often signalled explicitly
– Although Greta Garbo was the yardstick of beauty, she never married
(Concession; conventional implicature that beautiful women usually
marry)
• “The adventures of Huckleberry Finn” must be pronounced the most
amusing book Mark Twain has written for years. Moreover, it’s a
more minute and faithful picture of southwestern manners and
customs fifty years ago than was “Life on the Mississippi”, while in
regard to the dialect it surpasses any of the authour’s previous
stories in the command of the half-dozen species of patios which
passed for the English language in old Missouri
Relational underspecification
• When coherence relations are not explicit but only hinted
at
– John was approached last year by the publisher of X after he
had written a critical article on the first issue of X.
– “After” here indicates cause, not only temporal sequence
• In such cases, context is needed
– E.g. text genre / type
• Coherence relations are often conversational
implicatures
– E.g. if temporal ordering is indicated by “after” but not relevant in
itself, this may trigger searching for some more specific
coherence relation such as cause
– “After John entered the room, Bill jumped out of the window”
Taxonomy of coherence relations
• Positive/negative
– “The unicorn died because it was lonely”
• P(x) because Q(x)
– “Although GG was the yardstick of beauty,
she never married”
• Although P(x), not Q(x)
– Implies “usually, if P(X) then Q(x)”
• “A negation is needed to get at the regularity”
Taxonomy of coherence relations
• Hypotactic/paratactic
– Groups coherence relation based on the hierarchical relation
between linked clauses
• Paratactic: clauses of equal status
– “multi-nuclear”
– Example: sequence
– “Bring the water to the boil, add the yeast extract, and pour in the
dry semolina”
• Hypotactic
–
–
–
–
“nucleus-satellite”
Linking an independent clause to a dependent one
Example:evidence
“John must have stopped smoking, because I haven’t seen him
with a cigarette all day”
Taxonomy of coherence relations
• Grouping coherence relations based on conceptual level
described in clauses:
• Ideational / content
– Two clauses at same “world” level
– “The unicorn died because it was lonely”
• Epistemic
– One clause describes justification of belief epressed in other
clause
– “Maggie must be eager for promotion. She’s worked late three
days in a row.”
• Interpersonal / speech act
– One clause gives reason for uttering other clause
– “Since we’re on the subject, when was George Washington
born?”
Conversation Analysis (CA)
Conversation Analysis
• Etnologer: ”etnometdologi”
• Sacks, Schegloff, Jefferson
• Empiriska data
– audio (ofta telefonsamtal)
– video
– transkriptioner
• Empirisk metod
– Söker efter mönster i data och konstruerar regler för att förklara
dessa
• I motsats till traditionell lingvistik & pragmatik: intuitioner,
filosofisk spekulation, ”armchair linguistics”
• (Relativt) ickeformell metod
Typer av mönster funna inom CA
• makrostrukturer
– Närhetspar (Adjacency pairs)
– Preferensorganisation
– Presekvenser (Pre-sequences)
• ”local management systems”: lokal
reglering (subdialoger)
– Turtagning
– Reparationer
Närhetspar (adjacency pairs)
• Sekvenser av 2 yttranden som är näraliggande och
produceras av olika talare
– Del 1 föregår del 2
– Dock ej nödvändigtvis direkt efter
• Exempel
– fråga-svar
– hälsning-hälsning
– erbjudande-accepterande
• Approximativ regel:
– Om A producerar den första delen i ett närhetspar, måste A sluta
tala och B måste producera parets andradel
• Alternativ regel: konditionell relevans
– Om A producerar den första delen i ett närhetspar, så är dess
andradel förväntad och relevant
Preferensorganisation
• Problem med närhetspar:
– till varje förstadel svarar en mängd potentiella
andradelar
• T ex fråga ->
–
–
–
–
–
svar
protest
vidarebefodring (”Fråga Kalle”)
vägran att svara
ifrågasättande av ärlighet
• Lösning: preferensorganistation
– vissa andradelar är prefererade
• preferens är ej ett psykologiskt begrepp
– utan relaterat till ”markedness”
– prefererade andradelar är omärkta, ickeprefererade är märkta
• Vanliga kännetecken på ickeprefererad andradel:
–
–
–
–
föregås av försening, tvekljud etc
inledningsord som makerar ickepreferens (”Well...”, ”Tja...”)
åtföljs av förklaring till varför prefererad andradel ej gavs
innehåller avböjande komponent
• Exempel
– A: Kan du hjälpa mig?
– B1: visst (prefererat)
– B2: Äh njae jag har lite mycket att göra just nu
Pre-sekvenser
• ”förberedande frågor”
• Exempel 1
– T1
– T2a
– T3a
X: Är du upptagen ikväll?
Y: Nä, hurså?
X: Vill du följa med på bio?
• Exempel 2
– T1
– T2b
– T3b
X: Är du upptagen ikväll?
Y: Ja, jag ska tvätta håret. hurså?
X: Äh det var inget särskilt?
• T1 är en förberedande fråga som undersöker ett
förvillkor till den handling som T3 gäller
• T3 beror av T2, responsen på T1
Turtagning
• Observation: konversation karakteriseras
av turtagning (A och B: talare)
– A – B - A – B – A - ...
• Hur åstadkoms denna organisation?
– mindre än 5% överlapp
• Med hjälp av ett ”Local Management
System”!
– en uppsättning regler
– styr tillgång till ”the floor”, ung. rätten att tala
Turtagning: begprepp
• Tur (Turn Constructional Unit)
– en sekvens av syntaktiska enheter vars
gränser (främst) avgörs av syntaktiska (t ex
satsgränser) eller prosodiska faktorer
• TRP = Transition Relevance Place
– en punkt där turtagning kan ske
– TRP måste vara möjliga att förutse, för att
smidig turtagning ska vara möjlig
• Regel 1: Gäller initialt vid första TRP i varje tur
– (a) Om aktuell talare (A) väljer nästa talare (N) under
sin tur, måste A sluta och N börja tala vid första TRP
efter valet av N
– (b) Om A inte väljer N så kan vem som helst ta turen
vid nästa TRP (fri konkurrens)
– (c) Om A inte väljer N och ingen annan ”självväljer” så
kan A fortsätta
• Regel 2: Gäller vid efterföljande TRP i en tur
– När 1(c) har applicerats av A, så gäller 1(a)-(c) vid
nästa TRP, och rekursivt vid efterföljande TRP, tills
talarbyte inträffar
• Om någon bryter mot reglerna
– den som avbryter kan bli förmål för kritik (”Låt mig tala
till punkt!”)
– ”tävling”: ökande volym, lägre tempo, förlängda
vokaler, staccato etc. tills någon ger upp
• Kritik mot denna modell
–
–
–
–
Tar ej hänsyn till ickeverbala signaler
Vad är en TRP mer exakt?
Ej universell
Tar ej hänsyn till
• sociala roller & maktstrukturer
• institutionella turtagningssystem (t ex formella möten,
rättegång)
Reparationer
•
Exempel
– A: Jag mötte Nils igår
– B: Vem sa du? [NTRI]
– A: Nils
•
TUR1
TUR2
TUR3
Next Turn Repair Initiator (NTRI)
– inbjuder till reparation av föregående tur
•
Typer av reparationer
– Självinitierad, utan NTRI
– Annan-initierad, med NTRI
•
Preferensordning
– Självinitierad i TUR1
• Jag mötte Nils äh Kalle igår
– Själviniterad efter TUR1 men före TUR2
• Jag mötte Nills igår. Äh Kalle mena ja
– Annaninitierad med NTRI i TUR2, självreparation i T3 (se överst)
– Annaniniterad annanreparation i T2
• A: Jag mötte Nils igår
• B: Du menar väl Kalle?
Dialogspel
Talakter vs. dialogspel
• Logisk positvism mfl, Tractatus: Språkliga
uttryck är bilder av verkligheten
• Talaktsteori: Yttranden är handlingar.
– Alla yttranden är inte påståenden som
beskriver världen och som är sanna eller
falska. Däremot kan alla yttranden ses som
handlingar
– (illokuta akter) som förändrar världen och kan
lyckas eller misslyckas.
• Dialogspelsteori: Yttranden är drag i
dialogspel.
• (Klassisk) talaktsteori tar ej hänsyn till:
– kontext; varje yttrande behandlas i isolering
– att dialoger har flera deltagare
– dialogstruktur och dess relation till
deltagarnas mål och medel
Spelmetaforen fokuserar på att
• dialoger har flera deltagare
• varje deltagare har en roll i spelet som
påverkar dess handlingar
• dialog är (ofta) en målinriktad aktivitet
• dialog är en (mer eller mindre) regelstyrd
aktvivitet
• dessa regler ger upphov till systematiska
sekvenser (spel) av talhandlingar ( drag)
• Språklig aktivitet är bunden till ickespråkliga
aktiviteter (”livsformer”, Wittgenstein)
• en handling kan ha olika funktion i olika
sammanhang;
• yttrandet av en sats kan utgöra olika drag (ha
olika funktion) beroende på
– vilket spel man befinner sig i
– vilken roll man har
– spelets nuvarande tillstånd
• Dessa faktorer bestämmer också vilka drag som
är tillåtna i olika sammanhang. Jfr sporter:
– i fotboll är det inte tillåtet att ta bollen med händerna,
– men det är det i handboll - spelet bestämmer vad
man får göra.
– Dock: om man är målvakt i fotboll (en roll) får man ta
bollen med händerna
– i vissa stadier i en fotbollsmatch får vem som helst ta
bollen med händerna (om det är avblåst).
– att sparka bollen i riktning mot moståndarens mål kan
tolkas som ett skott eller som en passning framåt,
beroende (bla) på hur övriga spelare är positionerade
• spelmetaforen fokuserar inte på konflikt,
även om viss dialog innehåller konflikter (t
ex prutning, förhandling)
• ``drag'' för tanken till schack, men kanske
fotboll är en bättre metafor (alternativ:
Clarks ”ensemble’”)
• ”Dialogspel” används här som ett samlingsnamn
för en mängd disparata forskningsintningar inom
olika vetenskaper
–
–
–
–
sociologi
filosofi
lingvistik
etnologi
• Ej ett unifierat forskningsparadigm
• Annat namn: Diskursanalys (dock mkt flertydigt)
• Annat möjligt namn: dialoggrammatik (täcker
dock inte in hela fältet)
Historik
•
•
•
•
•
•
•
•
Wittgenstein (1958)
Bellack (1966)
Sinclair & Coulthard (1975)
Moore, Mann & Levin (1977)
Levinson (1979)
Lyttkens (1981)
Carlson (1983)
senare utveckling: dialogspel + planbaserad
talaktsteori -> dialogagenter
Wittgenstein
• ``Filosofiska Undersökningar'' (1958)
• ``det finns oräkneligt många språkspel!''
• Exempel på primitivt språkspel;
– roller: byggmästare B, hjälpreda H
– en enkel regel: om B säger namnet på en byggsten S
så måste H ge S till B. (liknande: läkare & sköterska
vid operation)
• Exempel: ge order och lyda dem
– Roller: ordergivare G, ordertagare T
– Mål: T utför handling H
– Regler: om G ger T order att utföra H, så är T skyldig
att utföra H
fler exempel...
• beskriva/identifiera objekt
– Roller: beskrivare, åhörare
• påstå något och acceptera/avvisa det
– Roller: ``påståare'', bedömare
• konstruera objekt utifrån beskrivning
– Roller: beskrivare, konstruktör
• rapportera om en händelse
– Roller: rapportör, publik
• gissa gåtor
– Roller: frågeställare, gissare
• ge information om tågtider
– Roller: kund, informerare
• ställa en fråga och besvara den
– Roller: frågeställare, besvarare
Bellack (1966): studier av
interaktion i klassrum
• Sociolog; utgår från Wittgenstein
• Använder termerna spel, delspel, cykel, drag;
dock på ett något avvikande sätt jämfört med
senare teorier
• drag:
–
–
–
–
soliciting (fråga, order, begäran...)
responding (svar på soliciting)
focusing
reacting
• ”cykel”: börjar med soliciting move, fortsätter till
nästa soliciting move. (vad andra kallat spel)
Exempel
• Cykel 1:
• A: Vad heter
huvudstaden i Norge
• B: Oslo
• A: Vad heter
huvudstaden i
sverige?
– fråga (soliciting)
– svar (responding)
• Cykel 2
– fråga
Sinclair & Coulthard (1975):
utveckling av Bellack
• 4 strukturella beskrivningsnivåer (”ranks'')
för dialog
• varje enhet på en nivå kan beskrivas i
termer av enheter på nivån under:
– transaktion
– utbyte
– drag
– akt
• akt  maximala syntaktisk enhet med viss funktion
– marker, starter, bid, elicitation, directive, informative, check,
prompt, clue, ...
• drag
–
–
–
–
initiering (I) ( soliciting),
respons (R) ( responding),
feedback (F) ( reacting)
framing (``OK, ``right'' etc - indikerar gränser mellan
transaktioner)
– focusing (metapåståenden om diskursen)
• akter förhåller sig till drag som morfem till ord
– många drag består av bara en akt.
• utbyte (exchange):
– sekvens av I, R och F,
– närmare bestämt ett I följt utan ett antal R och
F;
– reguljärt uttryck I(RF)*
• transaktion: sekvens av utbyten
Sekvensregler i form av grammatik
(varje enhet på en nivå kan beskrivas i termer av enheter på nivån under)
• Transactions:
– Lesson → Trans*
– Trans → Boundary Teaching+ (Boundary)
• Exchanges:
– Boundary → (Framing) (Focusing)
– Teaching → I (R) (F)
• Moves:
– I → ( marker ) ( starter ) ( bid ) { elicitation | directive | informative
| check } ( { prompt | clue } )
– I → (((cue) bid) nomination)
– R → (acknowledge) {reply | react | acknowledge} (comment)
– ...
Exempel
MOVE
I
R
ACT
bid
elicitation
reply
A: sir
can i go to the toilet
B: yes
• Dessutom: tolkningsregler som relaterar satstyp
och den aktuella situationen till akter
• Exempel: en deklarativ eller interrogativ sats
tolkas som en order att sluta om den refererar till
en handling som är otillåten vid den
yttrandetidpunkten
• Exempel
– Jag hör att någon skrattar
– skrattar någon?
– vad skrattar du åt?
Moore, Mann och Levin (1977)
• Inför termen dialogspel, som...
– ... är målorienterade enheter
– ... specificerar typer av språkliga interaktioner
– ... används i tolkning av yttranden genom att
• generera förväntningar och
• tillhandahålla ett ramverk för att integrera förståelsen av ett
yttrande i kontexten av tidigare yttranden
• Senare utveckling:
– Dialogue Macrogame Theory (Mann)
– Mann & Thompson: Rhetorical Structure Theory (->
textlingvistik)
Försök till summering av definition
• Ett språkspel definieras ev
– en uppsättning roller (kund, säljare)
– en uppsättning regler (inkl. konventioner för tolkning
av språkliga yttranden)
• Exempel: om X ställer en fråga bör Y svara
• Exempel: sats med omvänd ordföljd indikerar normalt fråga
– en uppsättning drag (fråga, svar)
– ett mål (säljaren ger info om, alt. säljer en resa)
• Inte helt olikt en plan...
Typ och förekomst i språkspel
TYP
FÖREKOMST
spel
yttrandesekvens
drag
konkret yttrande
roll
individ
mål
avsikt
Agenter & dialogspel
• Hur använder en agent kunskap om dialogspel?
– Känn igen vilket spel som spelas
– Tolka yttranden utifrån kunskap om detta spel och
dess regler
– Bestäm egna handlingar (``vad ska jag göra nu?'')
utifrån spelets regler
• Vilket spel som spelas är en tolkningsfråga;
missförstånd om vilket spel som spelas kan
uppstå
Dialogspel som tyst kunskap
• Kunskap om språkspelen är gemensam i en
språkgemenskap
– varje språk består av en repertoar av språkspel, vilka
inkluderar konventioner för hur uttryck i språket ska
tolkas
• Deltagare i ett dialogspel känner till reglerna
implicit
– på så sätt att de vet vad de ska göra, t ex om någon
ställer en fråga ska man svara.
– Däremot kan de kanske inte beskriva dessa regler
explicit.
Hur många drag kan ett spel ha?
•
Exempel: informationssökningsspel med
två drag
1. fråga (”vad är klockan?'')
2. svar (``tolv''/''vet inte'')
•
Men enligt Sinclair & Coulthard har de flesta
spel 3 drag:
–
–
Initiativ, Respons, Feedback.
Feedback kan dock vara implicit
1. I
2. R
3. F
•
A: vad är klockan?
B: tolv
A: jaha (explicit) / dags att gå på lunch
(implicit)
Finns ett fixt antal som gäller för alla spel?
•
Bör man inkludera ``tysta'' drag (tacit
moves) i spel?
1. I
2. R
3. F
•
A: vad är klockan?
B: tolv
(A uppfattar B's svar)
Jfr ”causeToWant”
Regelbrott; lyckade och
misslyckade spel; reparationer
• En approach:
– Om ett spel spelas enligt reglerna tills spelets mål
uppnåtts, så har spelet lyckats.
– Om någon regel bryts (och inte repareras) leder detta
till att spelet avbryts och misslyckas.
– Regelbrott kan följas av reparationer, vilket möjliggör
ett lyckat slutförande
• Alternativ approach: bygg in möjlighet i
reparation i informationssökningsspelet:
– ”en fråga följs av ett svar eller ett reparationsspel följt
av ett svar''
• Exempel:
–
–
–
–
A: vad är klockan?
B: ursäkta?
A: jag sa: vad är klockan?
B: åh ursäkta. hon är 12.
• I detta exempel bryts regeln ``en fråga följs av ett svar''
(alt: om A ställer en fråga till B är B skyldig att besvara
frågan).
• B initierar istället en reparation (ett reparationsspel) som
möjliggör informationssökningsspelets slutförande.
• En annan typ av regelbrott: brott mot
frame
– t ex vägran att acceptera sin roll (i exemplet
ovan accepterar B sin roll)
• Exempel:
– A: ursäkta, vad är klockan?
– B: håll käft jävla idiot
• B accepterar inte rollen ”frågebesvarare”
Hierarkisk spelstruktur
• Spel kan vara inbäddade i andra spel; sådana
spel kan kallas delspel (subgames).
• Exempel:
– A1: vad är klockan?
• B1: ursäkta?
• A2: jag sa: vad är klockan?
– B2: åh ursäkta. hon är 12.
• Här utgör B1 och A2 ett inbäddat spel (ett
reparationsspel).
• Exempel
– A1: vad kostar en resa till stockholm?
• B1: har du studentkort?
• A2: ja
– B2: då kostar det 175 kr.
• Här är ett informationssökningsspel
– IS = B1+A2
• inbäddat i ett annat
– A1+ IS + B2
• Exempel:
A1: Du vet Kalle?
B1: Ja
A2: Han har skaffat en katt
B2: Jahaja
• Analys 1:
– Referentidentifieringsspel
A1+B1 inbäddat i
påstående-drag A2
– A2 ingår i påståendespel
(A1+B1+A2)+B2
• Exempel:
A1: Du vet Kalle?
B1: Ja
A2: Han har skaffat en katt
B2: Jahaja
• Analys 2:
– A1+B1 föregår
påståendespel A2+B2
Fria och bundna spel
• Om man räknar med tysta drag kan man skilja på ``fria''
och ``bundna'' (”latenta'') delspel.
• De senare kan uppkomma som en konsekvens av
(vanligtvis) tysta drag som misslyckas och då ger
upphov till ett delspel.
• Exempel
– A1: Kalle är sjuk
– B1 (identifierar referent till ``Kalle'')
– B2: Jaha
• Denna dialog kan sägas innehålla tre drag, varav ett är
tyst (B1).
• Detta tysta drag kan ge upphov till ett delspel:
–
–
–
–
A1: Kalle är sjuk
B1: Vilken Kalle?
A2: Kalle Anka
B2: Jaha
• Här är identifieringsspelet (B1+A2) bundet.
• Fria delspel är alla delspel som inte är bundna, d v s
som ej ersätter ett tyst drag.
• Exempel:
–
–
–
–
A1: Vad är klockan?
B1: Titta där går Kalle
A2: Ja minsann
B2: Klockan är 5
• Inbäddning kan vara rekursiv:
A1: Kalle är sjuk
B1: Vilken Kalle?
A2: Känner du Lisa?
B2: Ja
A3: Hennes bror.
B3: Jaha
• Här är identifieringsspelet A2+B2 inbäddat
i B1-A3 som i sin tur är inbäddat i A1-B3.
• Spel kan även överlappa utan att det ena är
inbäddat i det andra:
A1: jag är så hungrig
B1: vill du ha pannkakor eller en semla?
A2: en semla tack.
• Här är A1+B1 ett påståendespel där B1 kan ses
som implicit bekräftelse av att B uppfattat och
accepterat påståendet i A1.
• Samtidigt initierar B1 ett nytt
informationssökningsspel (som dessutom råkar
sammanfalla med ett erbjudandespel där B1 är
ett erbjudande och A2 ett accepterande).
Dialogstruktur
• En dialog kan ses som en ström av spel
som överlappar och är inbäddade i
varandra.
• i många fall (men inte alla) har spelen och
deras drag en stackstruktur
– varje yttrande måste antingen utföra ett drag i
det översta spelet på stacken, eller initiera ett
nytt spel som då läggs överst på stacken.
– Då det sista draget i ett spel utförts så tas det
av stacken.
s1
A1: Kalle är sjuk
B1: Vilken Kalle?
A2: Känner du
Lisa?
s2 s3
B2: Ja
A3: Hennes bror.
B3: Jaha
STACK:
<s1>
<s2, s1>
<s3, s2, s1>
<s2, s1>
<s1>
<>
Representation av regler
• Den ovanstående representationen av regler
kan utläsas t ex ``i ett påståendespel måste ett
påstående följas av ett accepterande''.
• dialoggrammatik (jfr Sinclair & Coulthard)
– påståendespel → påstående accepterande
– påståendespel → påstående avvisande
– frågespel → fråga svar
– påståendespel →
påstående { accepterande | avvisande }
Finite State Transition Network
• Reguljära grammatiker kan också
representeras som FSTN: finite state
transition network
påståendespel:
accepterande
påstående
frågespel:
avvisande
fråga
svar
Recursive Transition Network
• Inbäddade spel kräver RTN: recursive
transition network (motsvarar pushdownstack)
– frågespel → fråga (frågespel) svar
– repgame → rep-init (repgame) rep
frågespel:
svar
fråga
frågespel
Dialogspel och informationstillstånd
• Det kanske mest intressant alternativet är att låta
spelstrukturen emergera från dragens förvillkor &
effekter.
• Till exempel:
– en fråga ha effekten att åhöraren är skyldig att ge ett svar, och
– ett svar kan ha förvillkoret att talaren är skyldig att ge ett svar.
• Denna metod kräver en representation av deltagarnas
kognitiva tillstånd (informationstillstånd), med både
privata och sociala attityder (skyldigheter, committments
mm)
• Informationstillstånd innehåller information, till skillnad
från tillstånd i en finit automat
• fråga(A, B, F)
– förvillkor:
• A undrar om F
– effekt:
• B har skyldighet besvara F
• svar(B, A, S)
– förvillkor:
• B har skyldighet besvara F,
• B tror att S är svar på F
– effekt:
• B har ej längre skyldighet besvara F
• Kopplingen mellan fråga och svar kan också vara mer
indirekt,
– t ex om förvillkor för svar är att B vill svara;
– Isåfall krävs att B vill besvara alla frågor som B är skyldig att
besvara.
• Kan också göras med andra typer av kognitiva tillstånd, t
ex QUD (”Questions Under Discussion”)
– fråga(A,B,F)
• effekt: att Q finns på QUD (frågestack)
– svar(B,A,S)
• förvillkor: det finns en fråga F på stacken som S är ett svar på
• effekt: F poppas av QUD
• -> Dialog-agenter (dialogsystem)
Grounding and ICM
Grounding (Clark mfl)
• Not CA, but related area
• Common Ground (CG): shared knowledge about the
dialogue; utterances incrementally add to CG
• ”To ground a thing … is to establish it as part of common
ground well enough for current purposes.” (Clark)
• making sure that the participants are percieving,
understanding, and accepting each other’s utterances
• Grounding is regulated by local communication
management systems (Allwood)
– ICM: grounding, sequencing, turntaking
– OCM: hesitations, self-corrections, ...
Clark’s grounding model
• Contribution types: Present, Accept
Accept
Present
S
1
• When does the presentation phase end?
– I: Move the boxcar to Corning
– I: and load it with oranges
– R: ok
F
Clark’s grounding model
• Contribution types: Present, Accept
Accept
Present
S
1
F
• When does the presentation phase end?
–
–
–
–
I: Move the boxcar to Corning
R: ok
I: and load it with oranges
R: ok
• Cannot be decided by just looking at the utterance; need
to look at next utterance
– not useful in realtime setting
Traum’s grounding model
• Discourse Units (DUs)
– unit of conversation at whicgh grounding takes place
– composed of individual utterance-level actions
(grounding-level acts, sub-DU acts)
• Some (sub-DU) acts
–
–
–
–
–
Initiate
Continue
Ack(nowledge)
Repair: correcting oneself or the other
Cancel: retraction, makes DU ungroundable (Ӏh
förresten det var inget”)
• act(I/R); I=initiator, R=responder
Continue(I)
Ack(R)
Initiate(I)
S
1
F
• This model is supplemented with an
information state update model
• adding self-repair and cancel
Continue(I), Repair(I)
Ack(R)
Initiate(I)
S
1
F
Cancel(I)
Cancel(I)
D
• adding self-repair and cancel
Continue(I), Repair(I)
Ack(R)
Initiate(I)
S
1
F
Cancel(I)
Cancel(I)
D
Feedback and grounding in
dialogue systems
ICM (Allwood)
• Interactive Communication Management
– As opposed to Own Communication Management (OCM): selfcorrections, hesitations, etc.
• Feedback moves
– (short) utterances which signal grounding status of previous
utterance (”mm”, ”right”, ”ok”, ”pardon?”, ”huh?” etc.)
• Sequencing moves
– utterances which signal dialogue structure (”so”, ”now”, ”right”,
”anyway” etc.)
• Turntaking moves
ICM in current commercial
systems
• Usually, limited to ”verification”
• Examples (San Segundo et. al. 2001)
– I understood you want to depart from Madrid. Is that
correct? [”explicit v.”]
– You leave from Madrid. Where are you arriving at?
[”implicit v.”]
• Involves repetition or reformulation
• Appears in H-H dialogue, but not very common
From verification to ICM in
dialogue systems
• ”Verification” is just one type of ICM behaviour
– Perhaps the one most cruicial in dialogue systems given
poor speech recognition
• Could a wider range of the ICM behaviour occurring
in H-H dialogue be useful in dialogue systems?
• We want a typology of ICM moves for H-H dialogue
– Feedback and sequencing moves
• We want to formalise it and use it in a system
– Still we will implement only a subset
• We want to relate it to grounding in a system
Classifying feedback
•
•
•
•
•
Level of action
Polarity
Eliciting or non-eliciting
Form (syntactic realisation)
Content type (object- or metalevel)
Feedback levels
• Action levels in dialogue (Allwood, Clark, Ginzburg)
– Contact: whether a channel of communication is established
– Perception: whether DPs are perciveving each other’s
utterances
– Understanding: Whether DPs are understanding each other’s
utterances
• Non-contextual (”semantic”) meaning
• Contextual (”pragmatic”) meaning
– Acceptance: Whether DPs are accepting each other’s utterances
• The function of feedback is to signal the status of
utterance processing on all levels
Feedback polarity
• Polarity (Allwood et.al. 1992)
– Positive: indicates contact, perception, understanding,
acceptance
– Negative: indicates lack of contact, perception, understanding,
acceptance
– We add a ”neutral” or ”checking” polarity – there is one or more
hypotheses, but the DP lacks confidence in them
• Examples
–
–
–
–
”I don’t understand”: negative
”Do you mean that the destination is Paris?”: checking
”To Paris.”: positive
”Pardon”: negative
Eliciting / nonelciting feedback
(Allwood et. al. 1992)
• Eliciting feedback is intended to evoke a response from
the user
• Noneliciting feedback is not so intended
– But may nevertheless recieve a response
• Rough correspondence / operationalisation
– Checking feedback is eliciting; explicitly raises grounding issue
– Positive feedback is noneliciting; may implicitly raise grounding
issue
• What about negative feedback?
– ”pardon?”,”huh?”: eliciting?
– ”I didn’t hear you”: noneliciting?
Object- or metalevel content
• Utterances with metalevel content explicitly refer to contact,
perception, understanding or acceptance
• Object-level utterances instead refer to the task at hand
• Example
–
–
–
–
–
–
S: What city are you going to?
U: Paris
S(1a): Did you say you’re going to Paris? [meta]
S(1b): Are you going to Paris? [object]
S(2a): Do you mean Paris, France or Paris, Texas?
S(2b): Do you want to go to Paris, France or Paris, Texas?
• This dimension does not apply to all feedback, e.g. ”Paris.”,
”Pardon?”
• (Is 2b feedback or simply an alternative question?)
Realisation of feedback moves
• Syntactic form:
– declarative: ”I didn’t hear what you said.”; ”The destination
city is Paris.”
– interrogative: ”What did you say?”; ”Do you want to go to
Paris?”
– imperative: ”Please repeat your latest utterance!”
– elliptical
• interrogative: ”Paris?”, ”To Paris or from Paris?”
• declarative: ”To Paris.”
• In general, the exact formulation of ICM phrases may
depend on various contextual factors
– including activity, noise level, time constraints etc.
Simplifying assumptions
regarding feedback
• We only represent action level and polarity
• Eliciting/noneliciting dimension implicit
– Negative feedback is eliciting in some sense; since something
went wrong, it must be fixed
– Checking feedback is also eliciting, since it poses a question that
must be adressed
– Positive feedback is not eliciting (we assume)
• Syntactic form not included in classification; decided by
generation module
• Metalevel / object level perhaps not so interesting unless
full compositional semantics are used
– ”Do you mean that you want to Paris?” vs. ”Do you want to go to
Paris?”
Formalising ICM dialogue moves
• Level
–
–
–
–
–
con: contact
per: perception
sem: semantic understanding (no context)
und: pragmatic understanding (relevance in context)
acc: acceptance
• Polarity
– pos: positive
– neg: negative
– chk: checking
Feedback move notation
• icm:Level*Polarity{:Args}
• Examples
–
–
–
–
–
–
icm:per*pos:String – ”I heard you say ’londres’”
icm:und*neg – ”Sorry, I don’t understand”
icm:und*chk:AltQ – ”Do you mean x or y?”
icm:und*pos:P – ”To Paris.”
icm:acc*neg:Q – ”Sorry, I can’t answer Q”
icm:acc*pos – ”Okay”
GoDiS: an issue-based
dialogue system
•
Explores and implements Issue-based dialogue
management (Larsson 2002)
–
–
•
Based on Ginzburg’s notion of a dialogue gameboard
involving Questions Under Discussion (QUD)
Uses (mostly pre-scripted) dialogue plans
Extends theory to more flexible dialogue
–
–
–
–
Multiple tasks, information sharing between tasks
ICM: feedback and grounding, sequencing
Question accommodation, re-raising, clarification
Inquiry-oriented, action-oriented, negotiative dialogue
System feedback for user
utterances in GoDIS
• contact
– negative (”I didn’t hear anything from you.”, ”Hello?”) [icm:con*neg]
• perception
– negative: fb-phrase (”Pardon?”, ”I didn’t hear what you said”)
[icm:per*neg]
– positive: repetition (”I heard ’to paris’”) [icm:per*pos:String]
• semantic understanding:
– negative: fb-phrase (”I don’t understand”) [icm:sem*neg]
– positive: reformulation (”Paris.”) [icm:sem*pos:Content]
System feedback, cont’d
• pragmatic understanding
– negative: fb-phrase (”I don’t quite understand”) [icm:und*neg]
– positive: reformulation (”To Paris.”) [icm:und*pos:Content]
– checking: reformulation (”To Paris, is that correct?”, ”To Paris?”)
[icm:und*chk:Content]
• acceptance/integration
– negative:fb-phrase with reformulation (”Sorry, I cannot answer
Q”, ”Sorry, Paris is not a valid destination city.”)
[icm:acc*neg:Content]
– positive: fb-word (”okay.”) [icm:acc*pos]
User feedback for system
utterances in GoDiS
• contact: • perception
– negative: fb-phrase (”Pardon?”, ”I didn’t hear what you said”)
[icm:per*neg]
• understanding: • acceptance/integration
– negative: fb-phrase (”I don’t know”, ”Never mind”) [icm:acc*neg]
– positive: fb-word (”okay.”) [icm:acc*pos]
Feedback selection
•
Feedback polarity selected depending on:
1.
2.
3.
4.
Contact: Whether any speech is observed
Perception: Speech recognition score > threshold
Semantics: Whether system can find a non-contextual
interpretation
Pragmatic understanding: Whether system can find a relevant
contextual interpretation
–
–
–
–
5.
•
none: extremely high score (certain of interpretation)
Positive: high score (pretty sure of interpretation)
Checking: medium score (not so sure)
Negative: low score (very unsure)
Acceptance: Whether system can accept what has been said
General principles
–
–
Produce positive feedback only on highest possible level
When producing negative feedback on level N, produce positive
feedback on level N-1
Feedback on multiple levels
S> Lets see. What can I do for you?
U> (mumble mumble)
S> Sorry, I didnt hear what you said. What can I do for you?
Positive
perception
Negative
perception
feeback
Negative
understanding
U> siridus
S> I heard you say siridus . Sorry, I dont understand. What can I
do for you?
Positive
understanding
(word meaning)
Negative
understanding
(relevance)
U> channel one
S> channel one. I dont quite understand. Do you want to add a
program or change channel?
(Task
clarification)
Positive
understanding
Rejection
(negative
acceptance
feedback)
U> turn on the t v
S> turn on the TV… Sorry, I cannot control the TV set. Do you want to add a
program or change channel?”
User negative
perception
U> pardon
S> Sorry, I cannot control the TV set. Do you want to add a program or change
channel?
U> change channel
S> Okay.
System
repetition
Positive
acceptance
Reactions to positive and
checking feedback
• After check feedback,
– (e.g., ”channel one, is that correct?”)
– positive response is needed, or system will assume it
was wrong
• After positive feedback,
– (e.g., ”channel one.”)
– if user gives no response or positive response,
system continues to assume it was right;
– If user gives negative response, system assumes it
was wrong
• correcting the system
Correcting the system
S> Lets see. What can I do for you?
U> add program
S> Okay. Add a program…
S> Lets see. What channel do you want?
U> channel six
S> OK, channel five.
Positive
feedback
U> no
S> not channel five. So, WhatNegative
channel do you want?
answer to fb.
U> channel six
S> Okay. channel six.”
Issue-based grounding
• Checking feedback on und-level explicitly raises understandingissue
– icm:und*chk:C raises ?und(C)
• ”Is C the meaning of the previous utterance?”
– Positive response leads to adding C to shared commitments
– Negative or no response leads to no action
• Positive understanding feedback does not raise the understandingissue explicitly
– In fact, tentatively assumes it has been positively resolved
– but makes it available for interpretation of short answers
• in this case, ”yes” or ”no”
– Negative reponse leads to retracting C
– Positive or no response leads to no action
• So far, only implemented for understanding level
ISSUES, QUD and accommdation
• We distinguish QUD and ISSUES:
– QUD (local): Questions available for resolution of short
answers
– ISSUES (global): Issues/questions that have been raised but
not yet resolved
• QUD-to-ISSUES accommodation
– If an answer is given which does not address any question
on ISSUES,
– But does address a question Q on QUD
– Then, accommodate Q to ISSUES (this amounts to raising
Q)
Feedback, ISSUES and QUD
• Assume previous move had content C
• Checking feedback
– Push ?und(C) on ISSUES and QUD
• Positive feedback
– Add C to shared commitments
– Push ?und(C) on QUD (but not on ISSUES)
– ”yes” or ”no”  do QUD-to-ISSUES accommodation
• Integrating responses to understanding-issues
– Done by a single rule, regardless of how the understanding-issue was
raised
– Given that ?und(C) is on ISSUES,
– ”yes”  add C to shared commitments if not already there
– ”no”  retract C from shared commitments if it’s there (actually,
backtrack to saved previous shared commitments)
Negative response to positive
feedback
S> Lets see. What channel do you want?
U> channel six
S> OK,
channel five.
channel (5) added to shared commitments;
?und(channel (5)) on QUD
U> no
QUD-to-ISSUES accommodation
 ?und(channel (5)) on ISSUES
integrate ”no”
 retract channel(5)
S> not channel five. So, What channel do you want?
Negative response to cheking
feedback
S> Lets see. What can I do for you?
U> add program
S> Okay. Add a program…
S> Lets see. What channel do you want?
U> channel six
S> channel
five?
?und(channel (5)) on ISSUES and QUD
U> no
integrate ”no” ( do nothing)
S> So, What channel do you want?
U> channel six
S> Okay. channel six.”
Sequencing ICM
• Discourse particles
– ”so” may be used to reraise a previously discussed
question
– ”right”, ”anyway”, ”let’s see…”
• Verbose sequencing
– ”Let’s talk about …”, ”Let’s return to the issue of …”
• How do we classify these?
– We correlate them with updates to the common
ground
Sequencing moves generated
by GoDiS
• Formal notation schema:
– icm:Type{:Content}
• Loading a dialogue plan
– icm:loadplan – ”let’s see.”
• Question accommodation
– icm:accommodate – ”alright.”
• Reraising an issue
– icm:reraise – ”so, ”
– icm:reraise:Q – ”returning to the issue of …”
Sequencing ICM: reraising
issue, loading a plan
Signals loading a
plan
S> Welcome to the travel agency!
U> price information
S> (…) Lets see. How do you want to travel?
U> by flight
S> (…) What city do you want to go to?
U> paris
S> (…) What city do you want to go from?
U> do I need a visa ?
Reraising an issue
S> (…) Lets see. What country are you from?
explicitly
U> sweden
S> Okay. Yes, you need a Visa.
S> Returning to the issue of price. Lets see. What city do you want to
go from?
Sequencing ICM:
Accommodation
S> Lets see. What can I do for you?
U> channel five today
Signals accommodation
S> Alright. add a program… Lets see. Okay. channel
five… today… What time do you want to start
recording?
U> from six thirty to seven thirty
S> Okay. from six thirty… to seven thirty… The
program has been added. ”
Future work
• Replace current ad-hoc forms based on corpus studies
and existing work
– ”discourse markers” (Schiffrin)
– ”cue phrases” (Grosz & Sidner and others)
• ”Real” generation rather than templates
– Integrate ICM with other utterances, rather than just appending
them
• Explore other ways of generating ICM
– Intonation, facial expression, etc.
• Extend the range of ICM generated (and interpreted) by
the system
• Extend issue-based grounding to all levels
Summary of ICM and grounding in
GoDiS
• By extending the range of ICM used by systems, their
communication becomes more natural and
comprehensive
• We have provided an initial classification of feedback
and sequencing ICM useful in a dialogue system, and
implemented it
• Issue-based grounding provides mechanisms
allowing the user to react to system feedback
• Sequencing moves can be correlated with updates to
common ground, and used to signal these updates to
the user
Relation to Traum’s computational
theory of grounding
• Traum puts focus on positive feedback and
corrections (self and other)
– Deals with the question, when does a contribution end?
Related to turntaking.
– Focus on self- and other-corrections (not included here);
involves turntaking and OCM, but also feedback
– Does not include sequencing ICM
– Based on the TRAINS corpus of H-H dialogue -> (arguably)
focus on positive feedback
• Focus on understanding-level
– ”grounding” here refers only to the understanding level
– Acceptance and rejection seen as ”core speech acts”
Implicit feedback?
• Clark: ”relevant followup” to U counts as positive
feedback
– What is relevant?
• simple cases for followups to questions:
– answer to question
– ”subquestion”
– feedback concering question
• Complex cases: all other utterances
– In general, complex inference and knowledge may be
needed (implicatures)
– Currently, irrelevant followup counts as negative feedback (a
cautious assumption)
• What about no followup at all?
– in reaction to ask-move or interrogative feedback, counts as
negative
– in reaction to answer or positive feedback, counts as positive
Rejection?
S: ”Where do you want to go?”
U1: ”Nowhere”
U2: ”I don’t know”
• Should these count as rejections?
– U1: negative answer? presupposition failiure?
rejection?
– U2: rejection?
• but not as definite as ”No comment!”
OCM: Own Communication
Management
• Egenkommunikationsreglering
• Till nästa gång
Uppgifter
• 1. Hur fungerar turtagning enligt CA-analysen? Hitta på
några dialoger som exemplifierar olika
turtagningssituationer och förklara dessa utifrån CAreglerna för turtagning.
• 2. Titta i TV-tablån och bestäm dig för ett TV-program
som du vill spela in. Ha penna och papper (eller dator)
redo. Ring upp Videoapplikationen i GoDiS på 7731978
och försök programmera videon att spela in ditt program.
Anteckna allt som sägs i dialogen (det går rätt långsamt,
så man hinner med). Vilka typer av ICM (grounding och
sequencing) förekommer i dialogen?
– Observera att systemet funkar rätt dåligt just nu, p g a diverse
tekniska problem. GoDiS är egentligen mycket bättre än såhär!
I dialog med en miniräknare
•
Uppgift: Fundera över följande:
– Hur skulle talad interaktion med en
vanlig enkel miniräknare kunna se
ut?
– Aspekter att fundera över:
Talsyntes
Taligenkänning
•
•
•
•
Turtagning
Tvekljud
Självreparation
Återkoppling
– Innan torsdagens föreläsning:
Försök att designa ett ‘dialogspel’
som inbegriper dessa fenomen!
– Ge konkreta exempel i form av små
transkriptioner, t.ex.:
U: 2+2
+1
S:
4
5
va?
5
– Skriv en sida om din design. De som
gör detta tillräckligt bra slipper fler
uppgifter i samband med min
föreläsning.