Integrační nástroje pro zpřístupnění vědeckých databází Vladimír Karen výkonný ředitel Albertina icome Praha s.r.o. Osnova Výchozí situace Federativní vyhledávání „Discovery services“ Serials Solutions Shrnutí.
Download
Report
Transcript Integrační nástroje pro zpřístupnění vědeckých databází Vladimír Karen výkonný ředitel Albertina icome Praha s.r.o. Osnova Výchozí situace Federativní vyhledávání „Discovery services“ Serials Solutions Shrnutí.
Integrační nástroje pro
zpřístupnění vědeckých
databází
Vladimír Karen
výkonný ředitel
Albertina icome Praha s.r.o.
Osnova
Výchozí situace
Federativní vyhledávání
„Discovery services“
Serials Solutions
Shrnutí
Výchozí situace
… v odborných knihovnách:
e-časopisy tvoří >90% aktuálního fondu
periodik
e-knihy (e-verze odborných knih) jsou na
vzestupu
databáze obsahují významnou přidanou
hodnotu v metadatech
… ale kdo se v tom má vyznat?
Výchozí situace
„Topíme se v informacích
a hladovíme bez znalostí."
Rutherford David Rodgers, Yale University
Federativní vyhledávání
6
Federativní vyhledávač
(metavyhledávač)
technologie zaměřená na vyhledávání v tzv.
„deep web“
první implemetace 1999-2000
– WebFeat
– MetaLib
dnes relativně běžná technologie
Princip federativního
vyhledávače (metavyhledávače)
1. transformuje dotaz a rozešle jej s vyžadovanou syntaxí
konkrétním vyhledávacím strojům
2. shromáždí výsledky vyhledávání a odstraní duplicity
3. zobrazí výsledky jednotným způsobem uživateli
Princip federativního
vyhledávače (metavyhledávače)
konektor = programový modul sloužící ke
komunikaci s konkétním zdrojem
využívané protokoly
–
–
–
–
Z39.50
SRU/SRW
XML gateway
nebo individuální nastavení
360 Search
federativní vyhledávač od
může vyhledávat v neomezeném počtu zdrojů
naráz (podle licence)
pokročilé funkce
–
–
–
clustering výsledků
inline zobrazování abstraktů
export výsledků
ukázka
(vyžaduje heslo)
Nevýhody federativního
vyhledávání
pomalá odezva (typicky 20-30s)
omezené možnosti vyhledávání (výběr polí)
závislost na funkčnosti konektorů
omezený počet vrácených záznamů z
jednotlivých zdrojů
problémy s přesností deduplikace
problémy s přesností clusteringu
Jaké by bylo ideální řešení?
Řešení =
„Discovery service“
ála Google
vyhledávání v předindexovaném obsahu
E-zdroje
Katalogy knihovny (OPAC)
Repozitáře
jakákoli další strukturovaná data
Serials Solutions Summon
zakladatel trendu discovery services
první reálně dostupné řešení
–
–
beta od ledna 2009
plně komerčně dostupný od léta 2009
Počet vydavatelů
Množství dat a metadat
94 000 titulů časopisů od >7000 vydavatelů
aktuálně indexuje > 500 milionů
unikátních dokumentů!
» 360 000 000 novinových článků
» 115 000 000 článků z časopisů
»
50 000 000 knih
»
2 000 000 konf. sborníků
»
4 500 000 diplomových/disertačních prací
»
3 800 000 patentů
»
1 500 000 video a audionahrávek
» 82 000 000 záznamů z OPAC
» 20 000 000 Open Access záznamů
»
880 000 záznamů z repozitářů
Summon
Jak velký je velký?
Počet záznamů
Průměrný
katalog
PubMed
Library of
Congress
Summon
Summon
16
Summon
Kvalita dat a indexace
prolínání metadat z různých zdrojů
deduplikace
indexace plných textů
využití taxonomií a tezaurů
obohacování metadat – Ulrichs, DOI atd.
Summon – integrace a
přívětivost
Integrace
– zobrazení údajů o dostupnosti tištěných
zdrojů v reálném čase (z OPAC)
– načítání dat k indexaci via FTP nebo OAIPMH
Uživatelské rozhraní
– „našeptávač“ s encyklopedickým obsahem
– následné zpřesňování výsledků vyhledávání
(fazety)
Možnost tvorby vlastního rozhraní (XML API)
>140 skutečných zákazníků, >40 v Evropě
Erasmus University
University of Loeben
University of Konstanz
Aarhus University
University of London
University of Dundee
University of Huddersfield
Bibliotheca Alexandrina
Erasmus University Rotterdam
http://www.eur.nl/ub/english/search/seurch/
Bibliotheca Alexandrina
http://bibalex.summon.serialssolutions.com/
Openbare Bibliotheek Amsterdam
(XML API - VUfind)
https://library.villanova.edu/Find/
Srovnání s konkurencí
Reálně fungující řešení
Bezkonkurenční množství pokrytých externích zdrojů
Výhody jednotného centrálního indexu
Žádné kompromisy – žádná kombinace vyhledávání
v indexu s federativním vyhledáváním!
Spolupracuje s libovolnými knihovními katalogy a
dalšími zdroji dat (repozitáře, databáze atd.)
XML API - integrace s libovolným uživatelským
rozhraním
SaaS – žádné další náklady
Poskytovatel specializovaný výhradně na e-nástroje!
Společnost Serials Solutions založena v roce 2000
knihovníky pro knihovníky
>2000 zákazníků (institucí) po celém světě
První na trhu s portálem typu A-Z List
Zavedli koncept AMS a správu elektronických
předplatných
Služby založeny na principu SaaS (hostované služby)
– bez nákladů na pořízení a údržbu hw + sw
– průběžná aktualizace dat a software
Unikátní znalostní databáze KnowledgeWorks –
základ všech produktů
Kdo používá Serials
Solutions?
>2000 institucí po celém světě
Princeton University
Cambridge University
University of Southern California
US zpravodajské služby (např. NSA & CIA)
US Army
US Air Force Research Libraries
NASA
Library of Congress
Microsoft
Kdo používá Serials
Solutions v ČR?
Vysoká škola ekonomická v Praze
České vysoké učení technické v Praze
Univerzita Karlova v Praze - CERGE
Národní lékařská knihovna ČR
Univerzita Pardubice
Česká zemědělská univerzita v Praze
Mendelova Univerzita v Brně
Univerzita J.E.Purkyně v Ústí n.L.
Shrnutí
Serials Solutions – světově respektovaný
průkopník nadstavbových nástrojů
Summon – nejlepší řešení na trhu
centralizovaných vyhledávačů
AiP - renomovaný partner na tuzemském trhu
odborných knihoven
Informace o nabídce AiP
Katalog na www.aip.cz
popisy >2000 produktů online a na CD/DVD-ROM
Vyzkoušejte! - zdarma přístup na 30 dnů
E-novinky
Elektronický zpravodaj
Personalizovány podle oborů zájmu
1-2x měsíčně
Registrace na www.aip.cz
Děkuji za pozornost.
Vaše otázky?
Kontakt:
Vladimír Karen
[email protected]
www.aip.cz
28