proces zberu a overovania prác
Download
Report
Transcript proces zberu a overovania prác
Centrálny register záverečných prác v SR
a kontrola originality dokumentov
ako centrálne poskytovaná služba
Juraj Noge
CVTI SR, Bratislava
[email protected]
CASLIN 2011, 12. – 15.6. 2011
OBSAH
Zopár slov o plagiátorstve na úvod
Etapy riešenia CRZP a APS
Proces zberu a overovania prác
Stručný popis technického riešenia
Čísla a štatistiky
Ohlasy, prínosy a hodnotenie po prvom roku
Perspektíva ďalšieho rozvoja
Záver
ÚVOD
Plagiátorstvo ako celospoločenský fenomén
Problém neoprávneného preberania resp.
napodobovania výsledkov cudzej duševnej
činnosti
V súčasnosti ho uľahčuje najmä:
Dostupnosť informačno-komunikačných
technológií prakticky pre každého
Dramatický rast obsahu, ktorý je dostupný
cez Internet
ÚVOD
Plagiátorstvo prináša nezaslúžený profesný,
spoločenský, ale nezriedka i finančný benefit
Najvypuklejšie v oblasti školstva
Môže kaziť dobré meno inštitúcie, v ktorej sa
práca obhájila
Riešenia v SK:
Na lokálnej úrovni
Komplexné riešenie na celoslovenskej úrovni
včítane centrálneho úložiska všetkých prác
ETAPY RIEŠENIA
Úvodná analyticko – koncepčne - organizačná
etapa – r. 2009:
Riešila centrálne úložisko všetkých
záverečných a kvalifikačných prác
MŠ SR – iniciátor a zastrešovateľ
Realizovaná pod gesciou UKF v Nitre
SVOP, s.r.o – vybraná ako externý dodávateľ
1. ETAPA
Činnosti počas 1. etapy riešenia:
Identifikácia východiskového stavu
Navrhla sa koncepcia, ktorá riešila:
• Legislatívu
• Problematiku autorských práv a licenčných
zmlúv na diela
• Finančné a organizačné zabezpečenia
projektu v celej jeho šírke pôsobenia
• identifikáciu logistiky a dopadov na
akademické informačné systémy a pod.
1. ETAPA
Konkrétne napr:
• vydanie Metodického usmernenia MŠ SR č,
14/2009
• Novela VŠ zákona s účinnosťou od 1.1.2010
a pod.
• Pripravila sa koncepcia technického
riešenia samotného
2. ETAPA
2. etapa riešenia – implementácia CRZP:
Implementácia CRZP:
• Technický návrh riešenia
• Vývoj programového vybavenia
• Vybudovanie technickej infraštruktúry
• Inštalovanie potrebného SW vybavenia
u prevádzkovateľa ako i na VŠ
• Testovacie práce
2. ETAPA
Dobudovanie požadovanej infraštruktúry
na strane vysokých škôl v súvislosti
s exportom prác do centrálneho registra
Testovanie funkcionality prenosových
rozhraní medzi centrálnym registrom a AIS
Príprava pokynov, vysvetlení a pod.,
súvisiacich s prijatou právnou normou
Zmena prevádzkovateľa - ministerstvom
priamo riadená organizácia - CVTI SR so
sídlom v Bratislave
3. ETAPA
3. etapa riešenia – implementácia APS:
Antiplagiátorský systém – nadstavba CRZP
Obstarávateľ CVTI SR
VO – tvrdé podmienky - 1. pokus neúspešný
Koniec r. 2009 - priame rokovacie konanie
Zmluva s fi. SVOP, s. r. o.
Koncom apríla 2010 systém uvedený do
ostrej prevádzky
PROCES ZBERU A OVEROVANIA PRÁC
75% VŠ už práce zbieralo vo svojich EZP
Bakalárske, diplomové, dizertačné; rigorózne,
habilitačné
Nutnosť dovybavenia rozhraním,
kompatibilným s rozhraním CRZP
Proces zberu na VŠ – požadovaný formát,
metadáta, licenčné zmluvy
Prenos do CRZP - z EZP v dávkach
Najprv metadáta, potom sa stiahnu samotné
práce
PROCES ZBERU A OVEROVANIA PRÁC
PROCES ZBERU A OVEROVANIA PRÁC
Kontrola prijatej dávky záverečných prác na
plagiátorstvo voči porovnávaciemu korpusu
Výsledky porovnania na plagiátorstvo systém
automaticky posiela späť príslušným vysokým
školám
Samotné texty prác sa začlenia do
porovnávacieho korpusu APS
Výsledky porovnania sú len podkladom pre
posúdenie a hodnotenie práce príslušnou
komisiou
POPIS TECHNICKÉHO RIEŠENIA
Technicky sú systémy CRZP a APS
konštruované ako systém spolupracujúcich
serverov
Samotný antiplagiátorský systém je súborom
viacerých aplikácií a originálnych algoritmov,
ktoré vytvorili vo firme SVOP, s.r.o.
Sú navrhnuté ako agentový systém a sú
spúšťané dynamicky na základe podnetov
POPIS TECHNICKÉHO RIEŠENIA
ČÍSLA A ŠTATISTIKY
Do systému CRZP/APS posiela v súčasnosti
záverečné a kvalifikačné práce na porovnanie
na plagiátorstvo 33 vysokých škôl
Za prvý akademický rok prevádzkovania sa v
systéme CRZP/APS zhromaždilo cca 71 000
záverečných a kvalifikačných prác.
Zaberajú cca 160 GB úložného priestoru
Predpoklad podobný aj na ďalšie roky
Momentálne už cca 140 000 prác
ČÍSLA A ŠTATISTIKY
z Internetu stiahnutých asi 3.4 milióna
dokumentov v objeme cca 1.4 TB dát
Porovnanie jednotlivého dokumentu oproti
dnešnému korpusu vrátane spracovania
metadát a vygenerovania PDF protokolu trvá
v priemere 10 sekúnd.
Maximálna dennú dávka dokumentov mala
4900 súborov, čo trvalo cca 10 hodín
OHLASY, PRÍNOSY A HODNOTENIE
Počiatočný mediálny záujem rýchlo ustal
Zo strany vysokých škôl prichádzali väčšinou
pozitívne reakcie
Samotné technické riešenie sa ukázalo ako
veľmi stabilné a vcelku bezproblémové
Zatiaľ sa javí, že porovnávacie algoritmy sú
dostatočne rýchle a systém stíha produkovať
výsledky s časovou rezervou, čo je veľmi
pozitívne
OHLASY, PRÍNOSY A HODNOTENIE
Kvalitu APS algoritmov plánuje dodávateľ
preveriť v medzinárodnej konkurencii na
workshope v Amsterdame na jeseň 2011
Systém má určite preventívny účinok (skôr
psychologického charakteru
Krátke obdobie na objektívne hodnotenie
prínosov
Riešenie je inšpiratívne a príťažlivé aj pre
susedov (Poľsko)
PERSPEKTÍVA ĎALŠIEHO ROZVOJA
Prenos prevádzky systému do
novovybudovaného DC VaV, ktorého je CVTI SR
prevádzkovateľom a ktoré poskytuje IKT
infraštruktúru najvyššej kvality.
• Urýchli sa proces porovnávania
• Poskytne vyššiu kvalitu zabezpečenia dát
Sprístupnenie záverečných prác, uložených
v CRZP verejnosti v zmysle novely VŠ zákona
Zabudovanie primárnych zdrojov (zákony,
smernice, normy, ...)
PERSPEKTÍVA ĎALŠIEHO ROZVOJA
Skvalitnenie porovnávacieho korpusu
• Staršie práce z VŠ
• Monografie, skriptá, učebnice (?problém AZ)
• Vytypovať ďalšie internetové zdroje
Skvalitnenie porovnávania zamontovaním
morfologického a synonymického slovníka resp.
slovníka koreňov slov
Vylepšenie funkcionality, používateľského
komfortu a možností nastavenia systému pre
administrátorov a prevádzkovateľov systému
PERSPEKTÍVA ĎALŠIEHO ROZVOJA
Optimalizácia výstupných protokolov
Implementácia opatrení proti trikom, ktorými sa
niektorí autori prác snažia „oklamať“
antiplagiátorský systém
Dať systém k dispozícii aj na overovanie iných
dokumentov ( seminárky, vedecké, projektové,
...)
Prepojenie s inými informačnými systémami
ZÁVER
Systém CRZP/APS má charakteristiku
centrálne poskytovanej služby, hoci je
poskytovaná len vybranej skupine klientov
O to viac, že je poskytovaná bezplatne
Systém CRZP/APS sa perspektívne plánuje
rozšíriť aj o poskytnutie služieb iným
inštitúciám ako sú len vysoké školy. Uvažuje
sa napr. o overovaní dokumentov, ktoré sú
výstupmi výskumu a vývoja alebo
dokumentov, ktoré sú súčasťou projektov
finančne podporených z verejných zdrojov.
ĎAKUJEM ZA VAŠU POZORNOSŤ
OTÁZKY?
Juraj Noge
CVTI SR, Bratislava
[email protected]