Ievads datorlingvistikā - Latviešu valodas aģentūra

Download Report

Transcript Ievads datorlingvistikā - Latviešu valodas aģentūra

Latviešu valodas resursi e-vidē

Ilze Auziņa

LU MII Mākslīgā intelekta laboratorija e-pasts: [email protected]

  Elektroniskie latviešu valodas mācību līdzekļi Elektroniskie latviešu valodas resursi:  elektroniskās vārdnīcas   latviešu folkloras un folkloristikas materiāli latviešu literatūras teksti   periodika Latviešu valodas korpuss un tā izmantošana mācību līdzekļu izstrādē

ELEKTRONISKIE LATVIEŠU VALODAS MĀCĪBU LĪDZEKĻI

Elektroniskie latviešu valodas mācību līdzekļi

   mācību līdzekļi un materiāli

vispārizglītojošo skolu audzēkņiem

mācību līdzekļi latviešu valodas kā otrās valodas apguvei (

LAT2

) mācību līdzekļi latviešu valodas kā svešvalodas apguvei

Mācību līdzekļi

vispārizglītojošo skolu audzēkņiem (1)

   Latviešu valodas vidusskolai (LIIS) Latviešu valoda pamatskolai (LIIS) Latviešu valoda sākumskolai

Latviešu valoda pamatskolai (LIIS)

http://valoda.ailab.lv/latval/pamatskolai/galvena.swf

 5 daļas:     

Valoda Skaņu mācība Morfoloģija Teikuma mācība Leksikoloģija

 Teorija izklāstīta, izmantojot animāciju un skaņu  Vairāk nekā 240 uzdevumu

Galvenā lapa Latviešu valoda pamatskolai (LIIS)

Latviešu valoda sākumskolai (2004)

http://www.valoda.lv

vai http://valoda.ailab.lv/latval/sakumskolai/galvena.swf

 5 daļas:     

Burti un skaņas Vārdu daļas Vārdu mācība Vārdu nozīme Teikums un teksts

  teorija izklāstīta, izmantojot animāciju un skaņu 180 uzdevumu   izstrādātājs: laboratorija LU MII Mākslīgā intelekta finansiālais atbalsts: Valsts valodas aģentūra

Sākumlapa

Latviešu valoda sākumskolai

Galvenā lapa

Latviešu valoda sākumskolai

Tēmas galvenā lapa

Latviešu valoda sākumskolai

Mācību līdzekļi latviešu valodas kā otrās valodas apguvei (LAT2)

Latviešu valoda mazākumtautību skolām

 http://valoda.ailab.lv/latval/vidusskolai/cittaut.htm

 aplūkoti dažādi problēmjautājumi, piemēram, garo patska ņu lietošana rakstībā; līdzskaņu mija lietvārdu loc ījumos; vārdu saskaņošana dzimtē, skaitlī un locījumā; priev ārdu lietošana; īpašības vārdu noteiktās, nenoteiktās galotnes lietošana  425 uzdevumi un 3 testi   metodiskie norādījumi skolotājiem paskaidrojumi krievu kas rodas valodā, kuros raksturotas problēmas, cittautiešiem runājot latviski

Mācību līdzekļi latviešu valodas kā svešvalodas apguvei

     Interaktīva mācību programma “Ko tu teici?” Latviešu valodas e-mācību līdzeklis (brīva piekļuve) Latviešu valodas e-mācību līdzeklis bēgļiem un patvēruma meklētājiem (ierobežota piekļuve) Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai (ierobežota piekļuve) citi mācību materiāli:  Nikoles Nau mācību materiāls  

Latvian Language Helper

Jāzeps Lelis.

Basic Latvian (1984?)

Interaktīva mācību programma "Ko tu teici?"

 http://valoda.ailab.lv/latval/iesacejiem/  tapusi ar LVAVP atbalstu 1998. gadā  virtuālas spēles un vingrinājumi latviešu valodas apguvei  aplūkotas 17 dažādas tēmas, piemēram, Veikali un

iepirkšanās, Laika apstākļi, Sports, Latvijas Republika

 dažāda vecuma interesentiem

E-mācību līdzeklis latviešu valodas apguvei

       izstrādāts

Latviešu valodas aģentūrā

atbalsta valoda: angļu vai krievu valoda 7 nodarbības (tēmas):

Iepazīšanās, Adrese, Ģimene, Dzīvesvieta, Pilsētā, Ikdiena, Ēdienreizes

Papildu informācija: dots

alfabēts, skaitļi kalendārs

(dienu un mēnešu nosaukumi) un to izruna, katras tēmas beigās ir

vārdnīca

(Vārdu krātuve) un

uzdevumi

Mācību līdzeklī ir neliela latviešu valodas

gramatika

drīzumā būs atrodams LVA mājas lapā

E-mācību līdzekļa sākumlapa Latviešu valodas e-mācību kurss

Galvenā lapa Latviešu valodas e-mācību kurss

Nodarbības sākumlapa Latviešu valodas e-mācību kurss

Nodarbības lapa Latviešu valodas e-mācību kurss

Nodarbības lapa un papildinformācija Latviešu valodas e-mācību kurss

Uzdevumi Latviešu valodas e-mācību kurss

Latviešu valodas e-mācību līdzeklis bēgļiem un patvēruma meklētājiem  ESF projekts „Interaktīva elektroniska latviešu valodas apguves mācību kursa izveide bēgļu un patvēruma meklētāju integrācijas veicināšanai“ un „Bēgļu un patvēruma meklētāju interaktīvā elektroniskā latviešu valodas apguves mācību kursa papildinājums izglītības pieejamības veicināšanai”     Izstrādāts Datorzinību centrā, piedaloties LVA (mācību satura izstrāde) un SIA “Tilde” (valodas prasmju pārbaudes moduļi) pārstāvjiem; māksliniece – Anita Ozoliņa A1 un A2 valodas prasmes līmenis: A1 līmenī ir 9 nodarbības (9 tēmas), A2 līmenī – 30 nodarbības, kas aptver 12 tēmas.

Atbalsta valoda – angļu Trūkums – nav publiski pieejams

Galvenā lapa Latviešu valodas e-mācību līdzeklis bēgļiem un patvēruma meklētājiem

Nodarbības sākumlapa Latviešu valodas e-mācību līdzeklis bēgļiem un patvēruma meklētājiem

Nodarbības lapa Latviešu valodas e-mācību līdzeklis bēgļiem un patvēruma meklētājiem

Uzdevums (1) Latviešu valodas e-mācību līdzeklis bēgļiem un patvēruma meklētājiem

Uzdevums (2) Latviešu valodas e-mācību līdzeklis bēgļiem un patvēruma meklētājiem

   

Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai (1)

Eiropas Trešo valstu valstspiederīgo integrācijas fonda projekts „Latviešu valodas apguves e-mācību kursa izveide trešo valstu valstspiederīgajiem izglītības un darba tirgus pieejamības veicināšanai” Mērķis – izveidot elektronisku mācību programmu, kas trešo valstu valstspiederīgajiem ļautu apgūt latviešu valodu (prasmes līmenis A1 un A2) un iegūt zināšanas par Latvijas valsti, vēsturi, ģeogrāfiju un sabiedrisko dzīvi Projekta īstenotājs: a/s „Datorzinību centrs“ Projekta partneri:     Latviešu valodas aģentūra SIA “Tilde” LR Izglītības un zinātnes ministrija Pilsonības un migrācijas lietu pārvalde;

Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai (2)

 

Struktūra

:  mācību kursam ir 2 daļas, kas atbilst A1 un A2 valodas prasmju līmenim;  katrā līmenī ir     20 nodarbības, pārbaudes moduļi (diktāts un tulkošana), vārdnīca, īsa latviešu valodas gramatika Mācību līdzekli var izmantot tikai trešo valstu valstspiederīgie, kas pašlaik dzīvo Latvijā

Galvenā lapa Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Nodarbības sākumla

pa

Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Nodarbības lapa (1) Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Nodarbības lapa (2) Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Nodarbības lapa: uzdevums (1)

Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Nodarbības lapa: uzdevums (2)

Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Dažādi uzdevumi Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Pārbaude (1) Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Pārbaude (2) Latviešu valodas e-mācību līdzeklis trešo valstu valstspiederīgo integrācijai

Citi interaktīvie mācību materiāli latviešu valodas kā svešvalodas apguvei

Latvian: Teaching material (Latviešu val. mācību materiāli) http://www.staff.amu.edu.pl/~naunicol/NNlatvmacib.html

 autores: Nikole Nau, Inga Klēvere  piecas stundas, kurās ir dialogi (tos iespējams arī noklausīties), teksti un uzdevumi; pievienota arī skolotāja grāmata The Latvian Language helper http://www.languagehelpers.com/members/latvian/online/language helper.html

 Latviešu valodas vārdi un frāzes ikdienas saziņai Jāzeps Lelis “Basic Latvian” (1984?) http://courses.washington.edu/latvian/basic_latvian/

ELEKTRONISKĀS VĀRDNĪCAS

Latviešu literārās valodas vārdnīca (1)

Latviešu literārās valodas vārdnīca

(beta versija)

   

http://www.tezaurs.lv/llvv/

~64000 šķirkļu Elektroniskā versijā izstrādāta LU MII Mākslīgā intelekta laboratorijā Projektu finansē Valsts pētījumu programma Letonika

Latviešu literārās valodas vārdnīca (2)

Latviešu literārās valodas vārdnīca (3)

Skaidrojošā vārdnīca

(1)   http://www.tezaurs.lv/sv/

152 494

šķirkļi 

Mobilā versija:

www.tezaurs.lv/wap  Sastādījis A. Spektors, izmantojot līdz šim publicētās latviešu valodas skaidrojošās vārdnīcas

Skaidrojošā vārdnīca

(2)

Mūsdienu latviešu valodas vārdnīca (1)

Mūsdienu latviešu valodas vārdnīca

     http://www.tezaurs.lv/mlvv/ Pašlaik

19225

šķirkļi (A-Ļ) Izstrādā LU Latviešu valodas institūts, red. Dr. philol. I. Zuicena Finansiālais atbalsts: Latviešu valodas aģentūra Nav elektronisku šķirkļu

Mūsdienu latviešu valodas vārdnīca (2)

K.Mīlenbaha un J.Endzelīna “Latviešu valodas vārdnīca”

(1) http://www.tezaurs.lv/mev/      Ar Latviešu Fonda finansiālu atbalstu ir izveidota

Mīlenbaha - Endzelīna latviešu valodas vārdnīcas

elektroniskā versija Apjoms: ~

75 000 šķirkļi

papildu sējumi) (4 pamatsējumi un 2 Ieskenējot un manuāli ievadot vārdnīcu, pilnībā ir saglabāta oriģinālā rakstība Iespējams meklēt šķirkļa vārdu u.tml.

gan mūsdienu ortogrāfijā, gan oriģinālrakstībā; meklēt pēc avota Vārdnīca ir pieejama bez maksas un to var izmantot tikai pētnieciskos nolūkos

K.Mīlenbaha un J.Endzelīna “Latviešu valodas vārdnīca”

(2)

Letonika.lv vārdnīcas (SIA Tilde)

Noderīgas saites!

 LU MII Mākslīgā intelekta laboratorijas vārdnīcu serveris:  http://www.tezaurs.lv/ Vārdnīcas internetā: http://www.vvk.lv/?sadala=180  Vārdnīcas un terminu datu bāzes: http://www.hzf.lu.lv/saites/  Letonika.lv (SIA

Tilde

vārdnīcas): http://www.letonika.lv/groups/default.aspx?g=2

LATVIEŠU FOLKLORAS UN FOLKLORISTIKAS MATERIĀLI

Latviešu folkloras elektroniskie materiāli (1)

Latviešu tautas pasakas un teikas   http://valoda.ailab.lv/folklora/pasakas/ elektroniski atrodamas P. Šmita “Latviešu pasakas un teikas” (15 sējumi) un A. Lerha-Puškaiša “Latviešu tautas teikas un pasakas” Latviešu tautas ticējumi     http://valoda.ailab.lv/folklora/ticejumi/ P. Šmita apkopotie latviešu tautas ticējumi vairāk nekā 36 000 vienīb u meklēšana iespējama pēc atslēgas vārda

Latviešu folkloras elektroniskie materiāli (2)

Latviešu sakāmvārdu datorfonds    http://valoda.ailab.lv/folklora/sakamvardi/ izveidots sadarbībā ar Latviešu folkloras krātuvi vairāk nekā 20 000 vienību Dainu skapis

Latviešu folkloristika (1)

Folkloristikas elektroniskā bibliotēka (FEB)       http://www.korpuss.lv/feb/ Projektu finansēja Valsts kultūrkapitāla fonds. FEB ir folkloras pētniecisko materiālu krātuve, kas tiek veidota, lai elektroniski būtu pieejami dažādu laika perioda materiāli. Pirmās publikācijas no 1856. gada.

Šobrīd FEB ir ievietoti ap

200

rakstu un to turpinājumi, kas publicēti galvenokārt

19. gs. beigu un 20. gs

vidus materiālus. . sākuma latviešu periodikā. Nākotnē iecerēts projektu turpināt, ievietojot arī 20. gs. sākuma un Iespēja meklēt pēc atslēgas vārda.

Materiālus iespējams kārtot     pēc publicēšanas gada, pēc autora, pēc izdevuma, kurā raksts publicēts, pēc nosaukuma.

Latviešu folkloristika (2)

Latviešu folkloristika (3)

Latviešu folkloristika (4)

Folklora, mitoloģija un pseidomitoloģija literatūrā http://www.liis.lv/folklora/folkloristika/liter/     

Auseklis. Izlase. R., 1955.

Merķelis G. Vidzemes senatne I. R., 1906.

Pumpurs A. Lāčplēsis. Latvju tautas varonis. Tautas eposs. Pumpurs A. Tēvijā un svešumā R., 1890.

Puškaitis-Lerhis A. Kurbads senlatvju varonis. Pēc tautas teikām, pasakām un dziesmām sacerēts. Jelgava, 1891.

Folkloras ekspedīcijas http://jiltd.realm.lv/sites/folklora/  Rēzeknes Augstskolas folkloras ekspedīcijās savāktais folkloras tekstu materiāls, dati no 1993. gada. (Materiāli tiek papildināti)

LATVIEŠU LITERATŪRAS TEKSTI

Latviešu literatūras klasika    http://www.korpuss.lv/klasika Apsīšu Jēkaba, Brāļu Kaudzīšu, Māteru Jura, R.Blaumaņa, A.Deglava, J.Purapuķes, Zeiboltu Jēkaba, Raiņa, A.Pumpura darbi. T. Zeiferta "Latviešu rakstniecības vēsture".

Elektroniskajā bibliotēkā ir iekļauti dažādi latviešu autoru teksti daiļliteratūra, kā arī zinātniskie un citi teksti. Tika apkopoti latviešu literatūras vecmeistaru darbi, kurus neaizsargā autortiesību likums. Ievadot datorā tekstus, tika saglabāta oriģinālrakstība, jo tie ir izdoti dažādos laika posmos. Projekts realizēts ar Kultūrkapitāla fonda atbalstu.

Letonika.lv

interneta bibliotēka

(SIA

Tilde

)

Periodika (www.periodika.lv)

LATVIEŠU VALODAS KORPUSS UN TĀ IZMANTOŠANA MĀCĪBU LĪDZEKĻU IZSTRĀDĒ

KORPUSA JĒDZIENS

Korpuss

— reprezentatīvs rakstīta teksta un / vai transkribētas runas kopums elektroniskā formā, ko izmanto datorizētā valodas analīzē un aprakstīšanā; palīdz ātri un precīzi atlasīt valodas faktus

Korpusu tipi

 Tekstu un runas korpuss  Vienvalodas un divvalodu (daudzvalodu) korpuss  Vispārīgs un speciāls korpuss Vispārīgs [latviešu valodas] korpuss vs. speciāls (izlokšņu; kāda funkcionālā stila; kādas konkrētas vecuma grupas korpuss; noteikta reģiona [latviešu valodas] korpuss; [latviešu] valodas apguvēju korpuss; noteikta laika perioda tekstu korpuss)     Sinhronisks un diahronisks korpuss Marķēts (anotēts) un nemarķēts korpuss Multimodāls korpuss, kas apvieno tekstu, skaņu un attēlu u. c.

       

Korpusu nepieciešamība un izmantošanas iespējas

Humanitārajās un sociālajās zinātnēs

Gramatikas un citu valodniecības jautājumu izpētē Leksikogrāfijā – bez korpusa un korpusa rīkiem mūsdienās nevar uzrakstīt labu vārdnīcu (statistikas dati, vārdu savienojumu analīze) Terminoloģijas izstrādē Valodas mācīšanā Tulkošanas studijās un tulku apmācībā, mašīntulkošanā Valodas tehnoloģiju izstrādē Psiholingvistikā, sociolingvistikā, tiesu ekspertīzēs  Korpuss ļauj pētīt reālo valodu un atklāt līdz šim nepamanītas lietas, pamanīt tipisko (skaitliski nozīmīgo)

Korpusu raksturojošās pazīmes

     Apjoms Reprezentativitāte – kādi tekstu paveidi atrodami korpusā Līdzsvarotība (sabalansētība) – kādas ir šo tekstu proporcijas Marķējums Lietojumrīki

Korpusa apjoms

    Korpusa apjomu nosaka korpusa tips Jo lielāks, jo labāks? Tikai ar vairākiem nosacījumiem:   saglabājas reprezentatitivāte labi strukturēts un pārlūkojams  ir pieejami atbilstoši rīki informācijas atlasei un izgūšanai Milzīgs korpuss nepieciešams leksikogrāfijā (lai pietiktu datu par reti lietotiem vārdiem) Nosacīts mūsdienu valodas korpusa minimums: aptuveni miljons vārdlietojumu

Korpusa izmantošanas rīki

    vārdformu indekss vārdformu biežumu saraksti

konkordances

programmatūra – konkordance rāda izvēlēto (meklējamo) vārdformu centrā un sniedz šīs vārdformas apkaimi (kontekstu); apkaimes garumu iespējams variēt, nosakot kā simbolu skaitu; iespējama kārtošana pēc kreisā / labā konteksta, iekļaujot / izņemot konkrētus vārdus u.tml.

interaktīva meklēšanas iespēja

www.korpuss.lv

Bonito

sistēmas saskarne

korpuss

Piedāvātie latviešu valodas korpusi

(izmantojot pārlūkprogrammu Bonito)

Vārdlie Morfo tojumu Nosaukums

miljons-1.0

Raksturojums 1 milj. vārdlietojumu liels līdzsvarots mūsdienu latviešu valodas korpuss

(1991–2008) ar metadatiem; VVA finansiālais atbalsts, izstrādātājs – LU MII

skaits

1 milj.

loģiski marķēts

miljons-2.0

miljons–2.0m

3,5 milj. vārdl. liels līdzsvarots mūsdienu latviešu valodas korpuss

(1991–2008) ar metadatiem; iegūts, papildinot 1 milj. vādlietojumu korpusu ar 2,5 milj. ~3,5 milj.

līdzsvarota mūsdienu latviešu valodas korpusa morfoloģiski marķēta versija; atstātas visas sintaktiski pieļaujamās morfoloģiski daudznozīmīgās formas ~3,5 milj.

Saeima-1.0

~4,7 milj.

Saeima-2.0

timeklis-1.0

ledus

Latvijas Republikas 5. Saeimas sēžu stenogrammas ar metadatiem Latvijas Republikas 5.–9. Saeimas sēžu stenogrammas ar metadatiem liels latviešu valodas tīmekļa korpuss (ar SemTi-Kamols gramatisko analizatoru 100% automātiski nomarķēti ~60 000 vārdlietojumu) morfoloģiski marķēts paraugkorpuss (P. Bankovskis „Plāns ledus“, 1. nodaļa) 22,5 milj.

~97 milj.

~14 000 nē jā jā

Nemarķēta tekstu korpusa iespējas

  Korpusa izmantojums:    leksikogrāfijā; leksikas, gramatikas u.tml. pētījumos; tulkošanā;  statistiskās informācija iegūšanā (biežuma saraksti u.tml.)  u. c.

Morfoloģiski līmenī

ne

marķētos korpusos vaicājums iespējams veikt tikai konkrētu vārdformu vai virspusēju regulāro izteiksmju

Informācijas meklēšana nemarķētā korpusā (1)

.

Meklēšanā izmantojamie simboli: jebkurš (1) simbols, piem.,

.īle

pīle, zīle, vīle, Čīle, Sīle

.

+

viens vai neierobežots skaits simbolu, piem.,

māj.+

māju, mājas

*

viens, neviens vai vairāki simboli (tiks atrasti vārdi ar pēdējo simbolu, bez tā un vārdi, kuros aiz vaicājumā dotā pēdējā simbola būs vēl kāds simbols), piem.,

plus*

plus, pluss; Markus*

Marku, marku, Markus, Markuss

?

[] ar pēdējo simbolu vai bez tā, piem.,

mājas?

skolot

māja, mājas; skolo, skolot

jebkurš no minētajiem simboliem, piem.,

[jkp]a

ja, ka, pa

|

vai

(viena no apaļajās iekavās dotajām vērtībām), piem.,

isl(a|ā)ms

islams, islāms

Informācijas meklēšana nemarķētā korpusā (2)

Vaicājums: galva

Informācijas meklēšana nemarķētā korpusā (2)

Vaicājums: isl(ā|a)m.*

Informācijas meklēšana morfoloģiski marķētā tekstu korpusā

Vaicājums: [lemma=".*:desmit_.*"] [tag=".*:n..p[n,g].*_.*"]

Korpusa izmantošana sabiedrisko norišu izpētē (1)

 Valsts valodas likums   Cik bieži Saeimas sēžu stenogrammās tiek pieminēts vārdu savienojums

“valodas likums”

?

Kad tiek runāts par Valsts valodas likumu?  Kuri deputāti visbiežāk debatēs runā par Valsts valodas likumu?

Korpusa izmantošana sabiedrisko norišu izpētē (1)

Vaicājums: valodas likum.*

saeima-2.0 sastopam 659 lietojumus ar

valodas likum.*

Korpusa izmantošana sabiedrisko norišu izpētē (1)

Vaicājums: valodas likum.*

miljons-2.0 sastopam 10 lietojumus ar

valodas likum.*

(6x tas minēts Saeimas stenogrammās, 3x – publicistikā, 1x – zinātniskajā literatūrā)

Korpusa izmantošana sabiedrisko norišu izpētē (2)

saeima-2.0 sastopam 2189 lietojumus ar

krīzi

E. Andronova, I. Auziņa, N. Grūzītis, G. Nešpore.

Vara, nauda un fakti latviešu valodas korpusā. –

Prezentācija CLARIN seminārā 26.02.2010.

Korpusa izmantošana sabiedrisko norišu izpētē (3)

Kas ir krīze?

 

finansu krīze

jeb

budžeta situācija (nav) lielas krīzes

jeb

liela sabrukuma

  

tā saucamajam negatīvajam scenārijam

jeb

krīzes scenārijam ar krīzi es domāju gan inflāciju, gan masveida emigrāciju, gan to, kas notiek..

finanšu krīze īsumā nozīmē to, ka naudas ir mazāk...

Kādas krīzes satrauc parlamentāriešus?

banku krīze krīze krīze

(36 ×),

komercbanku krīze

(1 ×), (155 ×),

krīze banku sistēmā

(1 ×),

bankas „Baltija“ „Parex“ bankas krīze

(3 ×),

banku un banku sistēmas

(1 ×)   

ekonomiskā krīze finansu krīze

(13 (

finanšu ×

) (145

×

),

ekonomijas krīze

kopš 8. Saeimas laikiem) (17

×

)

krīze

(80

×

),

finansiālā politiskā krīze

(42 ×), arī

politikas krīze

(1

×

) u.tml.

E. Andronova, I. Auziņa, N. Grūzītis, G. Nešpore.

Vara, nauda un fakti latviešu valodas korpusā. –

Prezentācija CLARIN seminārā 26.02.2010.

Korpusa izmantošana mācību līdzekļu izstrādē

   Korpuss ir piemēru (teikumu, tekstu) krātuve Izmantojot vārdformu biežuma sarakstu,   var atlasīt mācību līdzeklī iekļaujamo leksiku, var uzzināt, kuras ir biežāk lietotās vārdformas Konkordanču rindiņas var izmantot, piem., veidojot uzdevumus par vārda nozīmi