Controlled Croatian Language Processing in Intelligent

Download Report

Transcript Controlled Croatian Language Processing in Intelligent

Obrada kontroliranog hrvatskog jezika u
inteligentnom tutorskom sustavu
Branko Žitko
Prirodoslovno matematički fakultet
Sveučilište u Splitu
[email protected]
Dan jezičnih tehnologija
Zagreb, 30.11.2012
Sadržaj
1.
2.
3.
4.
5.
6.
Inteligentni tutorski sustav (ITS)
Problem
Rješenje
Prepoznavanje kontroliranog jezika
Generiranje kontroliranog jezika
Tutorski dijalog
2
Inteligentni tutorski sustav
•
Inteligentni tutorski sustavi (ITS) su računalni sustavi zasnovani na
tehnikama umjetne inteligencije kako bi simulirali ljudske tutore
koji znaju
• što poučavaju,
• koga poučavaju i
Inteligentni tutorski sustav
• kako poučavaju
Znanje o
Što
Područno
znanje
Modul
stručnjaka
Koga
tutorskim
metodama
Kako
Modul učitelja
Modul učenika
Komunikacijski
modul
Znanje o
učeniku
Znanje o
komunikaciji
Učenik
3
Inteligentni tutorski sustav
• Učenik se uči i testira nad područnim znanjem
• Komunikacijski modul
– prikazuje područno znanje
– prikazuje test nad područnim znanjem i prima učenikove odgovore
Inteligentni tutorski sustav
Područno
znanje
učenje i
testiranje
Komunikacijski
modul
Učenik
• Prikaz područnog znanja i testa u ITS-u Tutor-Expert System (TEx-Sys)
TEx-Sys – Stankov 1997 2008
4
Problem
• Ne postoji pravilo za imenovanje elemenata područnog znanja
– imenovanje koncepata
– imenovanje relacija
• Rezultira generiranjem gramatički nepravilnih rečenica kod
– prikaza područnog znanja i
– testa nad područnim znanjem
Ulazna jedinica
vrsta
Miš
Ulazne jedinice
vrsta
je vrsta
Tipkovnica
Miš
je vrsta
Tipkovnica
Miš i Tipkovnica vrsta Ulazna jedinica.
Miš i Tipkovnica je vrsta Ulazne jedinice.
Tko je povezan vezom vrsta s ulazna
jedinica?
Tko je povezan vezom je vrsta s ulazne
jedinice?
Je li Miš vrsta Ulazna jedinica?
Je li Miš je vrsta Ulazne jedinice?
5
Rješenje
• Uvedeno
– ontologija kao područno znanje
– kontrolirani jezik kao sredstvo komunikacije
• Struktura kontroliranog jezika i jezične tehnologije primijenjene
rečenica
gramatika kontroliranog jezika
kontekstno neovisna gramatika
fraza
pravila za imenovanje fraza
parametrizirani regularni izrazi
riječ
morfološki oblik riječi
morfosintaktički opis
• Obrada kontroliranog jezika
– generiranje rečenica (iz područnog znanja)
– prepoznavanje fraza (frazama se imenuje koncept i relacija)
Prirodni jezik
Kontrolirani jezik
Područno znanje
Rečenica
Koncept
generiranje
Relacija
Fraza
Riječ
prepoznavanje
Učenik
6
Rješenje
• Controlled Language Service (CoLaS)
– generiranje rečenica i prepoznavanje fraza kontroliranog jezika
• Hrvatski morfološki leksikon (HML)
– generiranje i prepoznavanje oblika riječi
• Hrvatski valencijski leksikon glagola (CROVALLEX)
– određivanje oblika riječi priloženog uz glagol
ITS
Komunikacijski modul
učenje i testiranje
Područno
znanje
Učenik
generiranje i prepoznavanje
kontroliranog jezika
CoLaS
HML
CoLaS – Žitko 2010
HML – Tadić 2003
CROVALLEX – Mikelić Preradović 2008
Gramatika
kontroliranog
jezika
Pravila za
imenovanje
fraza
CROVALLEX
7
Ontologija kao područno znanje
<owl:Class rdf:about="#Arithmetic_logic_unit">
<rdfs:label xml:lang="hr">aritmetičko logička jedinica</rdfs:label>
<rdfs:label xml:lang="en">arithmetic logic unit</rdfs:label>
<rdfs:subClassOf>
<owl:Class>
<owl:intersectionOf rdf:parseType="Collection">
<owl:Restriction>
<owl:onProperty rdf:resource="#is_part_of"/>
<owl:someValuesFrom rdf:resource="#Central_processing_unit"/>
</owl:Restriction>
<owl:Restriction>
<owl:onProperty rdf:resource="#execute"/>
<owl:allValuesFrom>
<owl:Class>
<owl:unionOf rdf:parseType="Collection">
<rdf:Description rdf:about="#Aritmetic_operation"/>
<rdf:Description rdf:about="#Logical_operation"/>
</owl:unionOf>
</owl:Class>
</owl:allValuesFrom>
</owl:Restriction>
</owl:intersectionOf>
</owl:Class>
</rdfs:subClassOf>
</owl:Class>
#Arithmetic_logic_unit
identifikator koncepta
aritmetičko logička jedinica
naziv koncepta
(na hrvatskom)
intersectionOf
oznaka veznika
(i)
#is_part_of
identifikator relacije
someValuesFrom
oznaka broja
(1 = jednina)
#Arithmetic_
logic_unit
#execute
#execute
n
#Central_
processing_
K5
unit
1
#is_part_of
n
#Arithmetic_
operation
#Logical_
operation
8
Prepoznavanje kontroliranog jezika
fraza
Aritmetičko logička jedinica
riječ
Aritmetičko
riječ
Logička
riječ
Jedinica
RBP
Parametri
(Rod Broj Padež)
CoLaS
Pravilo za imenovanje fraza
HML
oblik riječi
lema
KRBP = ((A--RBP | A--nsn)? A--RBP)? N-RBP? N-RBP
morfosintaktički
opis (MSD)
aritmetičko aritmetički Afpnsay
Afpnsny
Afpnsvy
Afpfsny
logička
logički
Afpfsvy
Afpnpay
Afpnpny
Afpnpvy
Ncfpg
jedinica
jedinica
Ncfsn
KRBP = A--nsn A--RBP N—RBP
R = f – ženski
B = s – jednina
P = n – nominativ
(aritmetički, A--nsn) (logički, A--RBP)(jedinica, N-RBP)
MULTEXT East specifikacija
N – imenica
f – ženski rod
s – jednina
n - nominativ
Parametrizirana fraza
9
Generiranje kontroliranog jezika (1)
#Arithmetic_
logic_unit
#execute
#Central_
processing_
K5
unit
1
#is_part_of
n
#Arithmetic_
operation
#execute
n
#Logical_
operation
CoLaS
HML
Gramatika kontroliranog jezika
CROVALLEX
AND
SENTENCE
SENTENCE
SINGLE
#Arithmetic_logic_
unit
SINGLE
#is_part_of
#Central_processing_
unit
AND
#execute
MULTIPLE
MULTIPLE
#Arithmetic_
operation
#Logic_
operation
10
Generiranje kontroliranog jezika (2)
AND
SENTENCE
SENTENCE
SINGLE
SINGLE
AND
#Arithmetic_logic_
unit
#is_part_of
#Central_processing_
unit
#execute
B=s
P=n
B=s
B=s
P=g
B=s
za glagol "biti" trpitelj
radnje je u genitivu
identifikator
#Arithmetic_logic_unit
#is_part_of
#Central_processing_unit
#execute
#Arithmetic_operation
#Logic_operation
CROVALLEX
parametrizirana fraza
(aritmetički, A--nsn)
(logički, A--RBP)
(jedinica, N-RBP)
(biti, V----n)
(dio, N-BPn)
(centralan, A--RBP)
(procesorski, A--RBP)
(jedinica, N-RBP)
(izvršavati, V----n)
(aritmetički, A--RBP)
(operacija, A--RBP)
(logički, A--RBP)
(operacija, A--RBP)
B=s
P=g
B=s
B=p
P=a
B=p
P=a
MULTIPLE
#Arithmetic_
operation
#Logic_
operation
B=s
P=a
B=s
P=a
za glagol "izvršavati" trpitelj
radnje je u genitivu
parametri
B=s
P=n
B=s
MULTIPLE
fraza (HML)
(aritmetičko, aritmetički, Afpnsny)
(logička, logički, Afpfsny)
(jedinica, jedinica, Ncfsn)
(je, biti, Vcip3s)
(dio, dio, Ncmsn)
(centralne, centralan, Afpfsg)
(procesorske, procesorski, Afpfsg)
(jedinice, jedinica, Ncfsg)
(izvršava, izvršavati, Vmip3s)
(aritmetičke, aritmetički, Afpmpa)
(operacije, operacija, Ncmpa)
(logičke, logički, Afpmpa)
(operacije, operacija, Ncmpa)
Aritmetičko logička jedinica je dio centralne procesorske jedinice
i izvršava aritmetičke operacije i logičke operacije
11
Tutorski dijalog
• Tutorski dijalog kombinira
– generiranje kontroliranog jezika
– prepoznavanje kontroliranog jezika
• Dijalog jednostrane inicijative ostvaren preko dijaloškog okvira
Tutor planira i
postavlja
pomoćno pitanje
S4
S1
S2
S3
Tutor postavlja
pitanje
Učenik odgovara
Tutor ocjenjuje
odgovor i daje
izjavu o točnosti
S5
Tutor procjenjuje
učenikovo
razumijevanje
12
Tutorski dijalog
2
4
#Control_unit
#Computer
#is_part_of
1
6#Arithmetic_
#Central_
5processing_
#is_part_of
K5
logic_unit
#is_part_of
#is_part_of
#Main_
memory
unit
#execute
#Arithmetic_
operation
#execute
#a_kind_of
#RAM
#a_kind_of
#ROM
#Logical_
operation
#
1
Stanje
S1
Sudjelovatelj
Tutor
2
3
S2
S3
Učenik
Tutor
4
5
S4
S2
Tutor
Učenik
6
7
S3
S4
Tutor
Tutor
8
9
S2
S3
Učenik
Tutor
Tekst
Aritmetičko logička jedinica je dio koga ili
čega?
Računala
Aritmetičko logička jedinica je dio računala, ali
ovo nije potpuni odgovor
Koji su djelovi računala?
Centralna procesorska jedinica i radna
memorija
Točno.
Je li aritmetičko logička jedinica dio centralne
procesorske jedinice?
Da
Točno.
13
CoLaB Tutor
• Controlled Language Tutor (CoLaB Tutor)
– inteligentni tutorski sustav zasnovan na obradi kontroliranog jezika nad ontologijom
http://nasti.pmfst.hr > CoLaB Tutor
CoLaB – Žitko 2010
14
Obrada kontroliranog hrvatskog jezika u
inteligentnom tutorskom sustavu
Branko Žitko
Prirodoslovno matematički fakultet
Sveučilište u Splitu
[email protected]
Dan jezičnih tehnologija
Zagreb, 30.11.2012