Įvadas į kompiuterinę lingvistiką

Download Report

Transcript Įvadas į kompiuterinę lingvistiką

Fonologija ir fonetika

Doc. Pijus Kasparaitis [email protected]

2012-2013 m. m. pavasario semestras

Žmonių bendravimas balsu

2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 2

Fonologijos ir fonetikos santykis

  Fonologija tiria tik tas konkrečios kalbos garsų savybes, nuo kurių priklauso prasmė Fonetika tiria visas garsų savybes 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 3

Fonemų identifikacija

  Paradigminė fonemų identifikacija  minimaliosios poros: buvo puvo, vagų vagių, kasdami - kąsdami Sintagminė fonemų identifikacija  mažiausio inventoriaus principas: /al/ -> /a/+/l/, /ur/ -> /u/+/r/, /au/ -> /a/+/v/, /ui/ -> /u/+/j/  reguliariausių santykių principas: neskaidyti /ie/, /uo/, /ts/, /tš/, /dz/, /dž/ 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 4

Fonemų grupės

  Balsiai Priebalsiai 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 5

Balsių klasifikavimas

 Pagal aukščiausiai pakilusią liežuvio dalį  priešakinės eilės  vidurinės eilės  užpakalinės eilės 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 6

Balsių klasifikavimas

  Pagal liežuvio atstumą iki gomurio  atviri  pusiau atviri   pusiau uždari uždari Pagal lūpų padėtį   labializuoti nelabializuoti 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 7

Priebalsių klasifikavimas

 Pagal artikuliavimo būdą  Sprogstamieji  Pučiamieji      Aproksimantai Nosiniai Šoniniai Vibrantai Taukštelėjimai, pliaukštelėjimai 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 8

Priebalsių artikuliavimo vietos

2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 9

Priebalsių klasifikavimas

 Pagal artikuliavimo vietą  lūpiniai  dantiniai      alveoliniai retrofleksiniai palataliniai veliariniai glotiniai 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 10

IPA sudarymo principai

   Skirtingas tos pačios kalbos fonemas turi atitikti skirtingi simboliai Tas pačias skirtingų kalbų fonemas žymėti tuo pačiu simboliu Naudoti lotyniškos abėcėlės raides, prireikus naudoti kitų Europos kalbų raides, mažas didžiąsias raides, horizontaliai ar vertikaliai apverstas raides. Vengti diakritinių ženklų, juos naudoti kitiems tikslams 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 11

IPA sudarymo principai

  Raides parinkti taip, kad jas atitinkantys garsai sutaptų su daugumoje kalbų šiuo simboliu žymimais garsais Naujai įtrauktais simboliais žymimi garsai turi būti kuo lengviau nuspėjami http://www.langsci.ucl.ac.uk/ipa/ 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 12

IPA priebalsių klasifikacija

2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 13

IPA balsių klasifikacija

2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 14

Fonemų pavadinimų rašymas kompiuteryje

  Specialūs šriftai http://scripts.sil.org/DoulosSIL_download Specialios abėcėlės  SAMPA http://www.phon.ucl.ac.uk/home/sampa/  ARPAbet 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 15

Anglų kalbos fonemos ARPAbet, IPA ir SAMPA sistemose 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 16

Anglų kalbos fonemos ARPAbet, IPA ir SAMPA sistemose (tęsinys) 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 17

MBROLA garsų bazėse naudojama lietuvių kalbos fonemų sistema  Balsiai  Kirčiuoti ir nekirčiuoti balsiai traktuojami kaip skirtingos fonemos        Trumpi nekirčiuoti žymimi viena mažąja raide, pvz., "a" Trumpi kirčiuoti – viena didžiąja raide, pvz., "A" Ilgi nekirčiuoti – dviem mažosiomis raidėmis, pvz., "aa" Ilgi tvirtaprade priegaide kirčiuoti – didžiąja ir mažąja raide, pvz., "Aa" Ilgi tvirtagale priegaide kirčiuoti – mažąja ir didžiąja raide, pvz., "aA" Ilgas balsis /e/ žymimas dviem raidėmis "ea“ Ilgas balsis /ė/ žymimas dviem raidėmis "ee" 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 18

MBROLA garsų bazėse naudojama lietuvių kalbos fonemų sistema  Priebalsiai     Simbolis ' (apostrofas, ASCII 39) po priebalsio žymi minkštumą. Dauguma priebalsių eina poromis: kietas ir minkštas Priebalsiai, priklausantys tvirtagale priegaide kirčiuotiems mišriesiems dvigarsiams, žymimi didžiąja raide, pvz., "N" Priebalsis /š/ žymimas didžiąja raide "S“ Priebalsis /ž/ žymimas didžiąja raide "Z" 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 19

MBROLA garsų bazėse naudojama lietuvių kalbos fonemų sistema  Mišrieji dvigarsiai ir dvibalsiai  Nekirčiuoti mišrieji dvigarsiai sudaromi iš balsių {a e i u} ir priebalsių {l l' m m' n n' r r'}     Kirčiuoti tvirtaprade priegaide Kirčiuoti tvirtagale priegaide – – iš balsių {Aa Ea I U} ir priebalsių {l l' m m' n n' r r'} iš balsių {A E I U} ir priebalsių {L L' M M' N N' R R'} Dvibalsiai /ie/ ir /uo/ laikomi atskiromis fonemomis Kiti dvibalsiai (tiek kirčiuoti, tiek nekirčiuoti) sudaromi panašiai, kaip mišrieji dvigarsiai iš balsių ir priebalsių {j J w W}, kurie tekste paprastai žymimi "i" (rečiau j) ir "u" 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 20

Lietuvių kalbos fonemos MBROLA, IPA ir SAMPA sistemose (balsiai) 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 21

Lietuvių kalbos fonemos MBROLA, IPA ir SAMPA sistemose (priebalsiai) 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 22

Transkripcijos tipai

  Plačioji (kaip reikia tarti) Siauroji (kaip ištarė) 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 23

Anglų kalbos fonemų grupavimas į vizemas 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 24

Fonemų ir vizemų sinchronizavimas 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 25

Animacinio personažo pavyzdys

C:\Program Files\Microsoft Speech SDK 5.1\Samples\Scripts\SimpleTTS\SimpleTTS.html

2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 26

Literatūra

       http://www.ikp.uni-bonn.de/lehre/informationen-materialien/ informationen-und-materialien-kopho/materialien-1/hess/ grundlagen-der-phonetik/gph_1b.pdf

Girdenis, A. (1995). Teoriniai fonologijos pagrindai. Vilniaus universitetas, Vilnius Jurafsky, D., J. H. Martin (2000). Speech and Language

Processing. An Introduction to Natural Language Processing,

Computational Linguistics, and Speech Recognition, Prentice Hall, Upper Saddle River, New Jersey 07458 http://www.ikp.uni-bonn.de/lehre/informationen-materialien/ informationen-und-materialien-kopho/materialien-1/hess/ grundlagen-der-phonetik/gph_2b.pdf

http://www.langsci.ucl.ac.uk/ipa/ http://scripts.sil.org/DoulosSIL_download http://www.phon.ucl.ac.uk/home/sampa 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 27

Literatūra

    Microsoft Speech SDK v. 5.1 help http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html

Kasparaitis, P. (2005). Diphone Databases for Lithuanian Text-to-Speech Synthesis. Informatica, 16(2), 193-202 Raškinis A., Raškinis G., Kazlauskienė A. (2003). SAMPA (Speech Assessment Methods Phonetic Alphabet) for Encoding Transcriptions of Lithuanian Speech Corpora.

Information Technology and Control, 2003, Nr. 4 (29), 50-56 2013.02.27

P.Kasparaitis. Kompiuterinės lingvistikos įvadas. Fonologija ir fonetika 28