Boris Lehečka [email protected], [email protected] VOKABULÁŘ WEBOVÝ aneb HISTORICKÉ SLOVNÍKY NA INTERNETU Vokabulář webový – VWobsah představení VW  zdroje VW  struktura slovníků v XML  návod na použití.

Download Report

Transcript Boris Lehečka [email protected], [email protected] VOKABULÁŘ WEBOVÝ aneb HISTORICKÉ SLOVNÍKY NA INTERNETU Vokabulář webový – VWobsah představení VW  zdroje VW  struktura slovníků v XML  návod na použití.

Boris Lehečka
[email protected], [email protected]
VOKABULÁŘ WEBOVÝ
aneb
HISTORICKÉ SLOVNÍKY NA
INTERNETU
Vokabulář webový – VWobsah
představení VW
 zdroje VW
 struktura slovníků v XML
 návod na použití VW
 nedostatky VW
 další slovníky (nejen historické)
 budoucí zdroje VW

Selfpromotion
Boris Lehečka
 [email protected], [email protected]
 oddělení vývoje jazyka ÚJČ AV ČR, v. v. i.
 programování

◦ zpracování textů a databází
◦ Visual Basic, C#, SQL
◦ XML, XSLT, HTML, CSS
Představení VW
Vokabulář webový
 http://vokabular.ujc.cas.cz
 důvod vzniku
 webová aplikace
 současné možnosti VW
 plánované možnosti VW

Zdroje VW

Heslář Staročeského slovníku (HesStčS)
◦ databáze

Malý staročeský slovník (MSS)
◦ tištěná publikace

Elektronický slovník staré češtiny (ESSČ)
◦ elektronický text
Fungování VW

databáze (MS SQL Server)
◦ obsahuje heslová slova
◦ hledání podle části hesel
◦ abecední a retrográdní řazení

texty (soubory XML)
◦ fulltextové prohledávání (Indexing Service, IFilter)
◦ zobrazení (transformace pomocí XSLT)

korpus (Manatee)
◦ prohledávání textů
◦ kolokace

webová aplikace (zpřístupňuje zdroje)
Fungování VW
HesStčS
Generální
heslář
Vokabulář webový
MSS
Indexing
Service
ESSČ
korpus
http://vokabular.ujc.
cas.cz
Slovníky v XML

tištěné slovníky
◦ zachování distinktivních rysů (vlastnosti písma:
patkové, bezpatkové; tučné, kurzívní…)
◦ rozepisování zkrácených podob [blázniti (sě)]
◦ identifikace jednotlivých částí heslové stati
(heslové slovo, morfologický, slovotvorný,
etymologický údaj, odkaz, slovní spojení…)

elektronické slovníky
◦ definování struktury podle vlastních potřeb
◦ není třeba se omezovat místem
◦ pomůcky pro hlídání autorů (formální správnosti)
Návod na použití VW
seznam zdrojů
 jednoduché prohledávání
 pokročilé prohledávání
 fulltextové prohledávání
 řazení
 připomínky

Nedostatky VW
chyby v HesStčS
 chyby v generálním hesláři
 chyby v textech slovníků
 nezvýrazňuje nalezený výraz
 novočeská flexe při fulltextovém hledání
 omezení Indexing Service (jednopísmenné
výrazy)

Další slovníky

Jazykové slovníky
◦ Klaret (http://titus.uni-
frankfurt.de/texte/etcs/slav/acech/klaret/klare.htm)
◦ K. Z.Vusín (http://kb-upol.bach.cz/slov/)
◦ F. Št. Kott (Česko-německý slovník zvláště
grammaticko-fraseologický)
◦ Chorvatské historické slovníky
(http://crodip.ffzg.hr/default_en.aspx)
◦ DEBDict (http://nlp.fi.muni.cz/projekty/deb2/index-cs.html)
◦ SSJČ
◦ ASCS, SSČ (Leda)
Další slovníky

Encyklopedie
◦ Seznam (http://encyklopedie.seznam.cz)
◦ Co je to (http://coje.to)
Další zdroje VW

o Vokabuláři webovém
◦ Leonardo
(http://www.rozhlas.cz/leonardo/audio/_audio/00507236.mp3)

plánované slovníky
◦
◦
◦
◦

J. Dobrovský (Deutsch-böhmisches Wörterbuch)
V. J. Rosa (Thesaurus linguae bohemicae)
J. Gebauer (Slovník staročeský)
J.V. Pohl (Česko-německý slovnář oder BöhmischDeutsches Wörter-Buch, 1756)
plánované další zdroje
◦ Gebauerova excerpce
◦ korpus staročeských textů