Integrační nástroje pro zpřístupnění vědeckých databází Vladimír Karen výkonný ředitel Albertina icome Praha s.r.o. Osnova  Výchozí situace  Federativní vyhledávání  „Discovery services“  Serials Solutions  Shrnutí.

Download Report

Transcript Integrační nástroje pro zpřístupnění vědeckých databází Vladimír Karen výkonný ředitel Albertina icome Praha s.r.o. Osnova  Výchozí situace  Federativní vyhledávání  „Discovery services“  Serials Solutions  Shrnutí.

Integrační nástroje pro
zpřístupnění vědeckých
databází
Vladimír Karen
výkonný ředitel
Albertina icome Praha s.r.o.
Osnova
 Výchozí situace
 Federativní vyhledávání
 „Discovery services“
 Serials Solutions
 Shrnutí
Výchozí situace
… v odborných knihovnách:
 e-časopisy tvoří >90% aktuálního fondu
periodik
 e-knihy (e-verze odborných knih) jsou na
vzestupu
 databáze obsahují významnou přidanou
hodnotu v metadatech
 … ale kdo se v tom má vyznat?
Výchozí situace
„Topíme se v informacích
a hladovíme bez znalostí."
Rutherford David Rodgers, Yale University
Federativní vyhledávání
6
Federativní vyhledávač
(metavyhledávač)
 technologie zaměřená na vyhledávání v tzv.
„deep web“
 první implemetace 1999-2000
– WebFeat
– MetaLib
 dnes relativně běžná technologie
Princip federativního
vyhledávače (metavyhledávače)
1. transformuje dotaz a rozešle jej s vyžadovanou syntaxí
konkrétním vyhledávacím strojům
2. shromáždí výsledky vyhledávání a odstraní duplicity
3. zobrazí výsledky jednotným způsobem uživateli
Princip federativního
vyhledávače (metavyhledávače)
 konektor = programový modul sloužící ke
komunikaci s konkétním zdrojem
 využívané protokoly
–
–
–
–
Z39.50
SRU/SRW
XML gateway
nebo individuální nastavení
360 Search
federativní vyhledávač od
 může vyhledávat v neomezeném počtu zdrojů
naráz (podle licence)
 pokročilé funkce
–
–
–
clustering výsledků
inline zobrazování abstraktů
export výsledků
ukázka
(vyžaduje heslo)
Nevýhody federativního
vyhledávání
 pomalá odezva (typicky 20-30s)
 omezené možnosti vyhledávání (výběr polí)
 závislost na funkčnosti konektorů
 omezený počet vrácených záznamů z
jednotlivých zdrojů
 problémy s přesností deduplikace
 problémy s přesností clusteringu
Jaké by bylo ideální řešení?
Řešení =
„Discovery service“
 ála Google
 vyhledávání v předindexovaném obsahu




E-zdroje
Katalogy knihovny (OPAC)
Repozitáře
jakákoli další strukturovaná data
Serials Solutions Summon
 zakladatel trendu discovery services
 první reálně dostupné řešení
–
–
beta od ledna 2009
plně komerčně dostupný od léta 2009
Počet vydavatelů
Množství dat a metadat
 94 000 titulů časopisů od >7000 vydavatelů
 aktuálně indexuje > 500 milionů
unikátních dokumentů!
» 360 000 000 novinových článků
» 115 000 000 článků z časopisů
»
50 000 000 knih
»
2 000 000 konf. sborníků
»
4 500 000 diplomových/disertačních prací
»
3 800 000 patentů
»
1 500 000 video a audionahrávek
» 82 000 000 záznamů z OPAC
» 20 000 000 Open Access záznamů
»
880 000 záznamů z repozitářů
Summon
Jak velký je velký?
Počet záznamů
Průměrný
katalog
PubMed
Library of
Congress
Summon
Summon
16
Summon
Kvalita dat a indexace
 prolínání metadat z různých zdrojů
 deduplikace
 indexace plných textů
 využití taxonomií a tezaurů
 obohacování metadat – Ulrichs, DOI atd.
Summon – integrace a
přívětivost
 Integrace
– zobrazení údajů o dostupnosti tištěných
zdrojů v reálném čase (z OPAC)
– načítání dat k indexaci via FTP nebo OAIPMH
 Uživatelské rozhraní
– „našeptávač“ s encyklopedickým obsahem
– následné zpřesňování výsledků vyhledávání
(fazety)
 Možnost tvorby vlastního rozhraní (XML API)
>140 skutečných zákazníků, >40 v Evropě
Erasmus University
University of Loeben
University of Konstanz
Aarhus University
University of London
University of Dundee
University of Huddersfield
Bibliotheca Alexandrina
Erasmus University Rotterdam
http://www.eur.nl/ub/english/search/seurch/
Bibliotheca Alexandrina
http://bibalex.summon.serialssolutions.com/
Openbare Bibliotheek Amsterdam
(XML API - VUfind)
https://library.villanova.edu/Find/
Srovnání s konkurencí
 Reálně fungující řešení
 Bezkonkurenční množství pokrytých externích zdrojů
 Výhody jednotného centrálního indexu
 Žádné kompromisy – žádná kombinace vyhledávání
v indexu s federativním vyhledáváním!
 Spolupracuje s libovolnými knihovními katalogy a
dalšími zdroji dat (repozitáře, databáze atd.)
 XML API - integrace s libovolným uživatelským
rozhraním
 SaaS – žádné další náklady
 Poskytovatel specializovaný výhradně na e-nástroje!
 Společnost Serials Solutions založena v roce 2000
knihovníky pro knihovníky
 >2000 zákazníků (institucí) po celém světě
 První na trhu s portálem typu A-Z List
 Zavedli koncept AMS a správu elektronických
předplatných
 Služby založeny na principu SaaS (hostované služby)
– bez nákladů na pořízení a údržbu hw + sw
– průběžná aktualizace dat a software
 Unikátní znalostní databáze KnowledgeWorks –
základ všech produktů
Kdo používá Serials
Solutions?
>2000 institucí po celém světě
Princeton University
Cambridge University
University of Southern California
US zpravodajské služby (např. NSA & CIA)
US Army
US Air Force Research Libraries
NASA
Library of Congress
Microsoft
Kdo používá Serials
Solutions v ČR?
Vysoká škola ekonomická v Praze
České vysoké učení technické v Praze
Univerzita Karlova v Praze - CERGE
Národní lékařská knihovna ČR
Univerzita Pardubice
Česká zemědělská univerzita v Praze
Mendelova Univerzita v Brně
Univerzita J.E.Purkyně v Ústí n.L.
Shrnutí
 Serials Solutions – světově respektovaný
průkopník nadstavbových nástrojů
 Summon – nejlepší řešení na trhu
centralizovaných vyhledávačů
 AiP - renomovaný partner na tuzemském trhu
odborných knihoven
Informace o nabídce AiP
 Katalog na www.aip.cz
 popisy >2000 produktů online a na CD/DVD-ROM
 Vyzkoušejte! - zdarma přístup na 30 dnů
 E-novinky




Elektronický zpravodaj
Personalizovány podle oborů zájmu
1-2x měsíčně
Registrace na www.aip.cz
Děkuji za pozornost.
Vaše otázky?
Kontakt:
Vladimír Karen
[email protected]
www.aip.cz
28