Integrační nástroje pro zpřístupnění vědeckých databází Vladimír Karen výkonný ředitel Albertina icome Praha s.r.o. Osnova Výchozí situace Federativní vyhledávání „Discovery services“ Serials Solutions Shrnutí.
Download ReportTranscript Integrační nástroje pro zpřístupnění vědeckých databází Vladimír Karen výkonný ředitel Albertina icome Praha s.r.o. Osnova Výchozí situace Federativní vyhledávání „Discovery services“ Serials Solutions Shrnutí.
Integrační nástroje pro zpřístupnění vědeckých databází Vladimír Karen výkonný ředitel Albertina icome Praha s.r.o. Osnova Výchozí situace Federativní vyhledávání „Discovery services“ Serials Solutions Shrnutí Výchozí situace … v odborných knihovnách: e-časopisy tvoří >90% aktuálního fondu periodik e-knihy (e-verze odborných knih) jsou na vzestupu databáze obsahují významnou přidanou hodnotu v metadatech … ale kdo se v tom má vyznat? Výchozí situace „Topíme se v informacích a hladovíme bez znalostí." Rutherford David Rodgers, Yale University Federativní vyhledávání 6 Federativní vyhledávač (metavyhledávač) technologie zaměřená na vyhledávání v tzv. „deep web“ první implemetace 1999-2000 – WebFeat – MetaLib dnes relativně běžná technologie Princip federativního vyhledávače (metavyhledávače) 1. transformuje dotaz a rozešle jej s vyžadovanou syntaxí konkrétním vyhledávacím strojům 2. shromáždí výsledky vyhledávání a odstraní duplicity 3. zobrazí výsledky jednotným způsobem uživateli Princip federativního vyhledávače (metavyhledávače) konektor = programový modul sloužící ke komunikaci s konkétním zdrojem využívané protokoly – – – – Z39.50 SRU/SRW XML gateway nebo individuální nastavení 360 Search federativní vyhledávač od může vyhledávat v neomezeném počtu zdrojů naráz (podle licence) pokročilé funkce – – – clustering výsledků inline zobrazování abstraktů export výsledků ukázka (vyžaduje heslo) Nevýhody federativního vyhledávání pomalá odezva (typicky 20-30s) omezené možnosti vyhledávání (výběr polí) závislost na funkčnosti konektorů omezený počet vrácených záznamů z jednotlivých zdrojů problémy s přesností deduplikace problémy s přesností clusteringu Jaké by bylo ideální řešení? Řešení = „Discovery service“ ála Google vyhledávání v předindexovaném obsahu E-zdroje Katalogy knihovny (OPAC) Repozitáře jakákoli další strukturovaná data Serials Solutions Summon zakladatel trendu discovery services první reálně dostupné řešení – – beta od ledna 2009 plně komerčně dostupný od léta 2009 Počet vydavatelů Množství dat a metadat 94 000 titulů časopisů od >7000 vydavatelů aktuálně indexuje > 500 milionů unikátních dokumentů! » 360 000 000 novinových článků » 115 000 000 článků z časopisů » 50 000 000 knih » 2 000 000 konf. sborníků » 4 500 000 diplomových/disertačních prací » 3 800 000 patentů » 1 500 000 video a audionahrávek » 82 000 000 záznamů z OPAC » 20 000 000 Open Access záznamů » 880 000 záznamů z repozitářů Summon Jak velký je velký? Počet záznamů Průměrný katalog PubMed Library of Congress Summon Summon 16 Summon Kvalita dat a indexace prolínání metadat z různých zdrojů deduplikace indexace plných textů využití taxonomií a tezaurů obohacování metadat – Ulrichs, DOI atd. Summon – integrace a přívětivost Integrace – zobrazení údajů o dostupnosti tištěných zdrojů v reálném čase (z OPAC) – načítání dat k indexaci via FTP nebo OAIPMH Uživatelské rozhraní – „našeptávač“ s encyklopedickým obsahem – následné zpřesňování výsledků vyhledávání (fazety) Možnost tvorby vlastního rozhraní (XML API) >140 skutečných zákazníků, >40 v Evropě Erasmus University University of Loeben University of Konstanz Aarhus University University of London University of Dundee University of Huddersfield Bibliotheca Alexandrina Erasmus University Rotterdam http://www.eur.nl/ub/english/search/seurch/ Bibliotheca Alexandrina http://bibalex.summon.serialssolutions.com/ Openbare Bibliotheek Amsterdam (XML API - VUfind) https://library.villanova.edu/Find/ Srovnání s konkurencí Reálně fungující řešení Bezkonkurenční množství pokrytých externích zdrojů Výhody jednotného centrálního indexu Žádné kompromisy – žádná kombinace vyhledávání v indexu s federativním vyhledáváním! Spolupracuje s libovolnými knihovními katalogy a dalšími zdroji dat (repozitáře, databáze atd.) XML API - integrace s libovolným uživatelským rozhraním SaaS – žádné další náklady Poskytovatel specializovaný výhradně na e-nástroje! Společnost Serials Solutions založena v roce 2000 knihovníky pro knihovníky >2000 zákazníků (institucí) po celém světě První na trhu s portálem typu A-Z List Zavedli koncept AMS a správu elektronických předplatných Služby založeny na principu SaaS (hostované služby) – bez nákladů na pořízení a údržbu hw + sw – průběžná aktualizace dat a software Unikátní znalostní databáze KnowledgeWorks – základ všech produktů Kdo používá Serials Solutions? >2000 institucí po celém světě Princeton University Cambridge University University of Southern California US zpravodajské služby (např. NSA & CIA) US Army US Air Force Research Libraries NASA Library of Congress Microsoft Kdo používá Serials Solutions v ČR? Vysoká škola ekonomická v Praze České vysoké učení technické v Praze Univerzita Karlova v Praze - CERGE Národní lékařská knihovna ČR Univerzita Pardubice Česká zemědělská univerzita v Praze Mendelova Univerzita v Brně Univerzita J.E.Purkyně v Ústí n.L. Shrnutí Serials Solutions – světově respektovaný průkopník nadstavbových nástrojů Summon – nejlepší řešení na trhu centralizovaných vyhledávačů AiP - renomovaný partner na tuzemském trhu odborných knihoven Informace o nabídce AiP Katalog na www.aip.cz popisy >2000 produktů online a na CD/DVD-ROM Vyzkoušejte! - zdarma přístup na 30 dnů E-novinky Elektronický zpravodaj Personalizovány podle oborů zájmu 1-2x měsíčně Registrace na www.aip.cz Děkuji za pozornost. Vaše otázky? Kontakt: Vladimír Karen [email protected] www.aip.cz 28