Intro Datalingvistikk i IT – språk, logikk, psykologi 16.03.2005 Jan Tore Lønning To visjoner • AI-visjonen (kunstig intelligens) – Språkforståing, – ”Natural Language Understanding” • Nyttevisjonen – Språkteknologi – ”Language Technology”

Download Report

Transcript Intro Datalingvistikk i IT – språk, logikk, psykologi 16.03.2005 Jan Tore Lønning To visjoner • AI-visjonen (kunstig intelligens) – Språkforståing, – ”Natural Language Understanding” • Nyttevisjonen – Språkteknologi – ”Language Technology”

Intro
Datalingvistikk
i
IT – språk, logikk, psykologi
16.03.2005
Jan Tore Lønning
To visjoner
•
AI-visjonen (kunstig intelligens)
– Språkforståing,
– ”Natural Language Understanding”
•
Nyttevisjonen
– Språkteknologi
– ”Language Technology”
Kan datamaskiner forstå?
• Visjon:
– Intelligente maskiner
– Maskiner som forstår
– Roboter
• En slik maskin må:
– Kunne snakke
– Og lytte
Turingtesten
AI-visjonen
• Turingtesten, 1950
• Eliza, Weizenbaum, 1967
• SHRDLU, Winograd, 1971
• Maskiner som kopierer/modellerer
mennesker
Nyttevisjonen
• Mobiltelefoner
– Stemmestyring
– SMS (T9)
Å
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
År
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
Ære
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
Åpen
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
Åpen
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
Åpen f
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
Åpen få
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
Åpen dag
1
2 ABC
3 DEF
4 GHI
5 JKL
6 MNO
7 PQRS 8 TUV
9 WXYZ
*
#
0+
Nyttevisjonen
• Mobiltelefoner
• Ordprosessorer
– Stavesjekking
– Grammatikksjekking
– Språkvalg
Nyttevisjonen
• Mobiltelefoner
• Ordprosessorer
• Maskinoversettelse
– Forskningsområde siden ca 1950
– 1949, Warren Weaver, 1950 Y. Bar-Hillel
– Vekslende suksess og interesse
– Stort behov
– Hjelpemiddel, om ikke helautomatisk
Nyttevisjonen: tekst
•
•
•
•
•
Mobiltelefoner
Ordprosessorer
Maskinoversettelse
Spørsmål-svar systemer
Søking med forståelse
Nyttevisjonen: tale
• Dikteringssystemer
• Dialogsystemer
• Oversettelse
Språkteknologi – hva trengs?
• Maskinen må ha kunnskaper om språket.
• Disse må være representert i et format
maskinen kan behandle.
• Maskinen utfører operasjoner på disse
representasjonene.
Fra visjon til virkelighet
• Datalingvistikk (computational linguistics):
– Grammatikk
– Semantikk
• Informatikk:
– Algoritmer
– Programmering
• Logikk
• Statistikk
Grammatikk
• Chomsky, Syntactic structures, 1957
• Generativ grammatikk:
– Endelig vokabular og endelig grammatikk
– Beskriver uendelig mange setninger
• Viktig for programmeringsspråk
• Chomsky (og etterfølgere) gikk bort fra
dette i lingvistikk
Grammatisk analyse
• Morfologi og tagging
• Syntaktisk analyse (erg)
Semantikk
• Montague, 1970, formell semantikk
• Sammenhengen språklig mening – logikk:
Sokrates er et menneske
Alle mennesker er dødelige
Sokrates er dødelig
• Logiske metoder sentrale i datalingvistikk
(fra 80-tallet)
• Ordsemantikk (word net)
Statistikk
•
•
•
•
Sentralt i taleteknologi
Sentralt i anvendelser på 90-tallet
Beskrivelse av store datamengder
Hvordan skal statistikk og symbolske
metoder forenes?
Fremtiden
• Vi vil se flere anvendelser
• Det er vanskelig å forutse hvor raskt
utviklingen vil gå
• AI-tenkning vil komme tilbake i
datalingvistikk og språkteknologi:
– maskinlæring
Språkteknologi – hva trengs?
Datateknologi - informatikk
Hardware
elektronikk
Software
Programmer
Representasjoner
Logikk
Språkteknologi – hva trengs?
Datateknologi - informatikk
Hardware
elektronikk
Software
Programmer
Representasjoner
Logikk
Språkvitenskap
Grammatikk
Statistiske
språkmodeller
Språkteknologi
Oppbygning
Oppbygning
V3
H3
HUMIT 3720
V2
HUMIT 2720 LING 1102
H2
HUMIT 1750
V1
Ex.Fac
INF 1010
H1
Ex.phil
HUMIT 1700 HUMIT 1730
INF 1050
Eksempler på studieløp