Transcript Įvadas į kompiuterinę lingvistiką
Fonologija ir fonetika
Doc. Pijus Kasparaitis [email protected]
2012-2013 m. m. pavasario semestras
Žmonių bendravimas balsu
2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 2
Fonologijos ir fonetikos santykis
Fonologija tiria tik tas konkrečios kalbos garsų savybes, nuo kurių priklauso prasmė Fonetika tiria visas garsų savybes 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 3
Fonemų identifikacija
Paradigminė fonemų identifikacija minimaliosios poros: buvo – puvo, vagų – vagių, kasdami - kąsdami Sintagminė fonemų identifikacija mažiausio inventoriaus principas: /al/ -> /a/+/l/, /ur/ -> /u/+/r/, /au/ -> /a/+/v/, /ui/ -> /u/+/j/ reguliariausių santykių principas: neskaidyti /ie/, /uo/, /ts/, /tš/, /dz/, /dž/ 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 4
Fonemų grupės
Balsiai Priebalsiai 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 5
Balsių klasifikavimas
Pagal aukščiausiai pakilusią liežuvio dalį priešakinės eilės vidurinės eilės užpakalinės eilės 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 6
Balsių klasifikavimas
Pagal liežuvio atstumą iki gomurio atviri pusiau atviri pusiau uždari uždari Pagal lūpų padėtį labializuoti nelabializuoti 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 7
Priebalsių klasifikavimas
Pagal artikuliavimo būdą Sprogstamieji Pučiamieji Aproksimantai Nosiniai Šoniniai Vibrantai Taukštelėjimai, pliaukštelėjimai 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 8
Priebalsių artikuliavimo vietos
2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 9
Priebalsių klasifikavimas
Pagal artikuliavimo vietą lūpiniai dantiniai alveoliniai retrofleksiniai palataliniai veliariniai glotiniai 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 10
IPA sudarymo principai
Skirtingas tos pačios kalbos fonemas turi atitikti skirtingi simboliai Tas pačias skirtingų kalbų fonemas žymėti tuo pačiu simboliu Naudoti lotyniškos abėcėlės raides, prireikus naudoti kitų Europos kalbų raides, mažas didžiąsias raides, horizontaliai ar vertikaliai apverstas raides. Vengti diakritinių ženklų, juos naudoti kitiems tikslams 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 11
IPA sudarymo principai
Raides parinkti taip, kad jas atitinkantys garsai sutaptų su daugumoje kalbų šiuo simboliu žymimais garsais Naujai įtrauktais simboliais žymimi garsai turi būti kuo lengviau nuspėjami http://www.langsci.ucl.ac.uk/ipa/ 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 12
IPA priebalsių klasifikacija
2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 13
IPA balsių klasifikacija
2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 14
Fonemų pavadinimų rašymas kompiuteryje
Specialūs šriftai http://scripts.sil.org/DoulosSIL_download Specialios abėcėlės SAMPA http://www.phon.ucl.ac.uk/home/sampa/ ARPAbet 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 15
Anglų kalbos fonemos ARPAbet, IPA ir SAMPA sistemose 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 16
Anglų kalbos fonemos ARPAbet, IPA ir SAMPA sistemose (tęsinys) 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 17
MBROLA garsų bazėse naudojama lietuvių kalbos fonemų sistema Balsiai Kirčiuoti ir nekirčiuoti balsiai traktuojami kaip skirtingos fonemos Trumpi nekirčiuoti žymimi viena mažąja raide, pvz., "a" Trumpi kirčiuoti – viena didžiąja raide, pvz., "A" Ilgi nekirčiuoti – dviem mažosiomis raidėmis, pvz., "aa" Ilgi tvirtaprade priegaide kirčiuoti – didžiąja ir mažąja raide, pvz., "Aa" Ilgi tvirtagale priegaide kirčiuoti – mažąja ir didžiąja raide, pvz., "aA" Ilgas balsis /e/ žymimas dviem raidėmis "ea“ Ilgas balsis /ė/ žymimas dviem raidėmis "ee" 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 18
MBROLA garsų bazėse naudojama lietuvių kalbos fonemų sistema Priebalsiai Simbolis ' (apostrofas, ASCII 39) po priebalsio žymi minkštumą. Dauguma priebalsių eina poromis: kietas ir minkštas Priebalsiai, priklausantys tvirtagale priegaide kirčiuotiems mišriesiems dvigarsiams, žymimi didžiąja raide, pvz., "N" Priebalsis /š/ žymimas didžiąja raide "S“ Priebalsis /ž/ žymimas didžiąja raide "Z" 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 19
MBROLA garsų bazėse naudojama lietuvių kalbos fonemų sistema Mišrieji dvigarsiai ir dvibalsiai Nekirčiuoti mišrieji dvigarsiai sudaromi iš balsių {a e i u} ir priebalsių {l l' m m' n n' r r'} Kirčiuoti tvirtaprade priegaide Kirčiuoti tvirtagale priegaide – – iš balsių {Aa Ea I U} ir priebalsių {l l' m m' n n' r r'} iš balsių {A E I U} ir priebalsių {L L' M M' N N' R R'} Dvibalsiai /ie/ ir /uo/ laikomi atskiromis fonemomis Kiti dvibalsiai (tiek kirčiuoti, tiek nekirčiuoti) sudaromi panašiai, kaip mišrieji dvigarsiai iš balsių ir priebalsių {j J w W}, kurie tekste paprastai žymimi "i" (rečiau j) ir "u" 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 20
Lietuvių kalbos fonemos MBROLA, IPA ir SAMPA sistemose (balsiai) 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 21
Lietuvių kalbos fonemos MBROLA, IPA ir SAMPA sistemose (priebalsiai) 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 22
Transkripcijos tipai
Plačioji (kaip reikia tarti) Siauroji (kaip ištarė) 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 23
Anglų kalbos fonemų grupavimas į vizemas 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 24
Fonemų ir vizemų sinchronizavimas 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 25
Animacinio personažo pavyzdys
C:\Program Files\Microsoft Speech SDK 5.1\Samples\Scripts\SimpleTTS\SimpleTTS.html
2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 26
Literatūra
http://www.ikp.uni-bonn.de/lehre/informationen-materialien/ informationen-und-materialien-kopho/materialien-1/hess/ grundlagen-der-phonetik/gph_1b.pdf
Girdenis, A. (1995). Teoriniai fonologijos pagrindai. Vilniaus universitetas, Vilnius Jurafsky, D., J. H. Martin (2000). Speech and Language
Processing. An Introduction to Natural Language Processing,
Computational Linguistics, and Speech Recognition, Prentice Hall, Upper Saddle River, New Jersey 07458 http://www.ikp.uni-bonn.de/lehre/informationen-materialien/ informationen-und-materialien-kopho/materialien-1/hess/ grundlagen-der-phonetik/gph_2b.pdf
http://www.langsci.ucl.ac.uk/ipa/ http://scripts.sil.org/DoulosSIL_download http://www.phon.ucl.ac.uk/home/sampa 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 27
Literatūra
Microsoft Speech SDK v. 5.1 help http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html
Kasparaitis, P. (2005). Diphone Databases for Lithuanian Text-to-Speech Synthesis. Informatica, 16(2), 193-202 Raškinis A., Raškinis G., Kazlauskienė A. (2003). SAMPA (Speech Assessment Methods Phonetic Alphabet) for Encoding Transcriptions of Lithuanian Speech Corpora.
Information Technology and Control, 2003, Nr. 4 (29), 50-56 2013.02.27
P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 28