Boris Lehečka [email protected], [email protected] VOKABULÁŘ WEBOVÝ aneb HISTORICKÉ SLOVNÍKY NA INTERNETU Vokabulář webový – VWobsah představení VW zdroje VW struktura slovníků v XML návod na použití.
Download
Report
Transcript Boris Lehečka [email protected], [email protected] VOKABULÁŘ WEBOVÝ aneb HISTORICKÉ SLOVNÍKY NA INTERNETU Vokabulář webový – VWobsah představení VW zdroje VW struktura slovníků v XML návod na použití.
Boris Lehečka
[email protected], [email protected]
VOKABULÁŘ WEBOVÝ
aneb
HISTORICKÉ SLOVNÍKY NA
INTERNETU
Vokabulář webový – VWobsah
představení VW
zdroje VW
struktura slovníků v XML
návod na použití VW
nedostatky VW
další slovníky (nejen historické)
budoucí zdroje VW
Selfpromotion
Boris Lehečka
[email protected], [email protected]
oddělení vývoje jazyka ÚJČ AV ČR, v. v. i.
programování
◦ zpracování textů a databází
◦ Visual Basic, C#, SQL
◦ XML, XSLT, HTML, CSS
Představení VW
Vokabulář webový
http://vokabular.ujc.cas.cz
důvod vzniku
webová aplikace
současné možnosti VW
plánované možnosti VW
Zdroje VW
Heslář Staročeského slovníku (HesStčS)
◦ databáze
Malý staročeský slovník (MSS)
◦ tištěná publikace
Elektronický slovník staré češtiny (ESSČ)
◦ elektronický text
Fungování VW
databáze (MS SQL Server)
◦ obsahuje heslová slova
◦ hledání podle části hesel
◦ abecední a retrográdní řazení
texty (soubory XML)
◦ fulltextové prohledávání (Indexing Service, IFilter)
◦ zobrazení (transformace pomocí XSLT)
korpus (Manatee)
◦ prohledávání textů
◦ kolokace
webová aplikace (zpřístupňuje zdroje)
Fungování VW
HesStčS
Generální
heslář
Vokabulář webový
MSS
Indexing
Service
ESSČ
korpus
http://vokabular.ujc.
cas.cz
Slovníky v XML
tištěné slovníky
◦ zachování distinktivních rysů (vlastnosti písma:
patkové, bezpatkové; tučné, kurzívní…)
◦ rozepisování zkrácených podob [blázniti (sě)]
◦ identifikace jednotlivých částí heslové stati
(heslové slovo, morfologický, slovotvorný,
etymologický údaj, odkaz, slovní spojení…)
elektronické slovníky
◦ definování struktury podle vlastních potřeb
◦ není třeba se omezovat místem
◦ pomůcky pro hlídání autorů (formální správnosti)
Návod na použití VW
seznam zdrojů
jednoduché prohledávání
pokročilé prohledávání
fulltextové prohledávání
řazení
připomínky
Nedostatky VW
chyby v HesStčS
chyby v generálním hesláři
chyby v textech slovníků
nezvýrazňuje nalezený výraz
novočeská flexe při fulltextovém hledání
omezení Indexing Service (jednopísmenné
výrazy)
Další slovníky
Jazykové slovníky
◦ Klaret (http://titus.uni-
frankfurt.de/texte/etcs/slav/acech/klaret/klare.htm)
◦ K. Z.Vusín (http://kb-upol.bach.cz/slov/)
◦ F. Št. Kott (Česko-německý slovník zvláště
grammaticko-fraseologický)
◦ Chorvatské historické slovníky
(http://crodip.ffzg.hr/default_en.aspx)
◦ DEBDict (http://nlp.fi.muni.cz/projekty/deb2/index-cs.html)
◦ SSJČ
◦ ASCS, SSČ (Leda)
Další slovníky
Encyklopedie
◦ Seznam (http://encyklopedie.seznam.cz)
◦ Co je to (http://coje.to)
Další zdroje VW
o Vokabuláři webovém
◦ Leonardo
(http://www.rozhlas.cz/leonardo/audio/_audio/00507236.mp3)
plánované slovníky
◦
◦
◦
◦
J. Dobrovský (Deutsch-böhmisches Wörterbuch)
V. J. Rosa (Thesaurus linguae bohemicae)
J. Gebauer (Slovník staročeský)
J.V. Pohl (Česko-německý slovnář oder BöhmischDeutsches Wörter-Buch, 1756)
plánované další zdroje
◦ Gebauerova excerpce
◦ korpus staročeských textů