Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha
Download
Report
Transcript Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha
Statistický modul
EZproxy a další
aktuální vývoj
MULTIDATA Praha
Mgr. Petr Novák
Knihovna psychologie FF UK
6.října 2009
Proč statistický modul?
OCLC (výrobce EZproxy) nabízí výčet různých
nástrojů, komerčních
i freeware / OSS
Neposkytují podporu pro skupiny
Neposkytují podporu pro různé způsoby
autentizace
zdlouhavá práce s logy na pracovní stanici
limity, nelze pracovat v dávkách
Statistický modul
Autor RNDr. Vladimír Pávek
Využívá XSLT procesor Saxon
Vyžaduje Java Virtual Machine
Otestováno na Windows 2003 server a Linux
Testovací demo ke stažení z www.multidata.cz
Konfigurace = editace XML souborů
práce přímo na serveru EZproxy
Generuje výstupy v ČJ a AJ
Skupiny v EZproxy
Jsou využívány:
pro korektní autorizaci uživatelů dle součásti
instituce (fakulty a základní součásti na VŠ,
zaměstnanci x čtenáři x testeři ve všech
knihovnách)
pro generování log souborů využívaných pro
statistický modul
předávány jsou různé kombinace skupin
Jak EZproxy ukládá logy
Konfigurace v config.txt
Ukládání v týdenních intervalech
2 druhy logů:
LogSPU -> spu%Y-%W.log
= výchozí URL zdroje
Hlavní log -> ezp%Y-%W.log
= kompletní komunikace uživatel-zdroj bez *.jpg a *.gif
Jak EZproxy ukládá logy - co se loguje
IP adresa,
uživatelské jméno,
výčet skupin uživatele oddělený „+“,
identifikátor session,
datum a čas,
kompletní HTTP request (např. GET
http://www.database.com HTTP/1.0),
číslelný status HTTP žádosti (200 aj.),
přenesená data v bajtech,
(v případě hlavního logu ještě user-agent)
Ukázka SPU logu
70.108.162.87 johndoe Default+UNI+MEDICINE+Student
a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100]
"GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0
18.18.162.117 marysmith Default+UNI+LAW+Student
e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100]
"GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0
60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff
94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100]
"GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0
90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff
476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100]
"GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0
58.128.110.30 tracylong Default+UNI+COMPSCI+Student
6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100]
"GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0
Způsoby zpřístupnění
elektronických inf. zdrojů
Autentizace na IP adresu (poskytovatel
zdroje zařadí IP adresu EZproxy serveru na
seznam povolených IP adres) = typ 1
Autentizace jménem a heslem
(poskytovatel zdroje zašle autentizační data
- uživ.jméno a heslo -, ta jsou zadána do
EZproxy a uživatel se jimi transparentně
autentizuje vůči skrytému formuláři = typ 2
Ukázka SPU logu
typ 1
typ 2
70.108.162.87 johndoe Default+UNI+MEDICINE+Student
a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100]
"GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0
18.18.162.117 marysmith Default+UNI+LAW+Student
e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100]
"GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0
60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff
94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100]
"GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0
90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff
476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100]
"GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0
58.128.110.30 tracylong Default+UNI+COMPSCI+Student
6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100]
"GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0
Rozdíl v logování
SPU log – srovnatelně zaznamená jak typ 1
(autentizace IP adresou), tak typ 2 (autentizace
jménem a heslem)
Hlavní log - zaznamená kompletní komunikaci
EZproxy se zdrojem dle typu 1, avšak pouhé
otevření zdroje typu 2
-> jako zdroj pro statistiky využívanosti se hodí
spíše SPU log, Hlavní log má doplňkovou funkci
Workflow práce se statistickým
modulem – generování HTML výstupů
Realizováno každý týden
Nakopírování čerstvého souboru LogSPU do
/statistika (adresář se statistickým modulem)
Spuštění dávky
Nakopírování výstupních HTML souborů do
požadované lokace – např. /docs/public (do této
lokace lze obecně umístit jakékoli HTML a grafické
soubory ke kterým není třeba ověřovat přístup)
Kontrola errorlog.html
Workflow práce se statistickým
modulem - tit-url.xml
Editace souboru tit-url.xml
tit-url.xml obsahuje seznam zdrojů včetně URL a
výčtu přiřazených skupin
Vždy při přidání nového zdroje
Konvence pojmenování zdroje
Pokud zdroj již není předplácen – nutno
konfiguraci v tit-url ponechat
Ukázka záznamu
Workflow práce se statistickým
modulem – analýza chybových URL
soubor errorlog.html
slouží k nalezení chybných konfigurací v titurl.xml
Statistika dle zdrojů a měsíců
pro celou knihovnu
K čemu může sloužit
Statistika dle zdrojů a měsíců
pro
celou knihovnu
pro jednotlivé skupiny
Využití pro marketing:
sledování
krátkodobých přístupů (trialy)
meziměsíční změny
celkové úhrny
Statistika dle skupin
K čemu může sloužit
Statistika dle skupin
pro
celou knihovnu
pro jednotlivé skupiny
Využití pro marketing:
rozdíly
mezi jednotlivými skupinami (fakultami)
zdroj pro přepočet dle počtu reálných uživatelů
(studenti + akademičtí pracovníci, všichni čtenáři /
aktivní uživatelé vzdáleného přístupu)
K čemu může sloužit
Statistika dle skupin a dle zdrojů
pro
jednotlivé skupiny
Využití pro marketing:
rozdíly
mezi jednotlivými skupinami
(fakultami) pro konkrétní zdroje
zdroj pro analýzu využívanosti zdrojů ->
podklad pro akvizici
Další práce s výstupy v Excelu
Všechny prezentované tabulky lze z HTML
přes schránku snadno metodou CTRL+C,
CTRL+V zkopírovat do Excelu a dále
zpracovávat
Výstup např. do CSV se ukázal jako
zbytečný
K nabídce statistického modulu
Dodávka zahrnuje budoucí aktualizace
Cena mírná , na dotázání
Dotazy ke statistickému modulu?
Čas na švestkovou buchtu
Autentizační modul
možnosti autentizace a autorizace EZproxy: built-in by OCLC
:-)
textový soubor s hesly
LDAP
LDAP dle RFC 2307 (např. OpenLDAP)
Active Directory, eDirectory
Shibboleth
doména Windows
pro ČR exotické knihovní systémy – Voyager, III, …
více viz
http://www.oclc.org/us/en/support/documentation/ezproxy/usr
/default.htm
ALEPH...?
Nativní podpora autentizace a autorizace
uživatelů EZproxy v systému ALEPH chybí
Akademické knihovny disponují LDAP
adresáři pro autentizaci k různým
informačním procesům v rámci svých
informačních systémů
Veřejné a vědecké knihovny LDAP podporu
pro čtenáře nemívají
->>> potřeba autentizačního modulu
Autentizační modul
Autoři
Jiří Rataj
Lukáš Hlůže
Martin Vojnar
testován na EZproxy serveru
draco.multidata.cz
Výhoda řešení
standardizované LDAP rozhraní podporující
EZproxy
Shibboleth Identity Provider
libovolné další služby (tiskové fronty, autentizace
pracovních stanic, …)
aktuální data via LDAP – např.
účet aktivní ihned po vystavení průkazky
účet odblokován okamžitě po uhrazení pokuty
lze stanovit specifickou skupinu uživatelů pro
vzdálený přístup (nikoli nutně všichni registrovaní
čtenáři)
Podrobnosti
možné zabezpečení komunikace
EZproxy-LDAP: SSL (ldaps) + fixní IP adresa
LDAP-mezivrstva-ALEPH: omezení jen pro localhost
komunikaci, pokud nebude LDAP a ALEPH na jednom
serveru – lze implementovat https + fixní IP adresu
propustnost v řádu desítek autentizačních dotazů
za minutu
mezivrstva LDAP – ALEPH je napsána v perlu
vyžaduje ALEPH v.18 a vyšší
s licencí X-services
Obsah datagramu mezivrstvy
<?xml version="1.0" encoding="UTF-8"?>
<bor-auth>
<bor-id>carovy_kod_uzivatele</bor-id>
<bor-uid>primarni_id_uzivatele</bor-uid>
<bor-name>jmeno_uzivatele</bor-name>
<bor-email>email_uzivatele</bor-email>
<bor-lang>jazyk_komunikace_s_uzivatelem</bor-lang>
<bor-auth-ok>vysledek_verifikace</bor-auth-ok>
<bor-credit>stav_penezniho_uctu</bor-credit>
<bor-status>kategorie_uzivatele</bor-status>
<error>textova_zprava_o_vysledku_verifikace_v_pripade_chyby
</error>
</bor-auth>
Ukázka
http://boa.ruk.cuni.cz:8991
ldapsearch -x -D
'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' -W -v
-h boa.ruk.cuni.cz -b
'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz'
uid=333,ou=ezproxy,dc=ruk,dc=cuni,dc=cz
boa.ruk.cuni.cz
ou=EZPROXY,dc=ruk,dc=cuni,dc=cz(objectClass=pe
rson)
uid
333
Vaše dotazy a
komentáře…
… za které děkuji
[email protected]