Transcript NTUR技術新發展
IR系統技術發展 江玉婷 臺大圖書館系統資訊組 [email protected] 2013/10/04 大綱 NTUR簡介 發展歷程 系統元件及運作基本概念 NTUR新版功能特色(RC5-RC6) 瀏覽與查詢 統計資訊 後端管理工具 與外部資源介接 挑戰與未來工作 2 NTUR發展歷程 NTUR DSPACE 系統架構 系統程式 JAVA跨平台 MVC Web架構 JAVA + JSP 其他工具程式 資料儲存 RDBMS Bitstream Files 文件原始檔案 靜態頁面 索引檔 4 基本資料結構 學院 Community Subcommunity Collection Collection Item Subcommunity Subcommunity 分類 Collection Item 文件 Item Bundle Bitstream 系所 Bitstream Bundle 檔案集 檔案 5 系統功能特性 瀏覽與查詢 階層式分類瀏覽 查詢:全文檢索、進階查詢、詞彙擴展、查詢排序 多語介面 排行統計 個人頁面 資料上傳、編輯 資料審核 文件認領 管理模組 單筆、整批資料處理 權限設定 系統參數設定 一般瀏覽 個人頁面 MyIR 管理模組 6 系統功能特性 彈性系統設計 社群與類別 詮釋資料 資料呈現設定 資料存取權限政策 資料對象:資料層級(Community、Collection、Item)… 動作:讀取、新增、刪除…. 適用身分:Eperson、EpersonGroup 7 NTUR新版功能 RC5-RC6 改版重點 更好的使用經驗 中文化 使用流程及介面調整 瀏覽及查詢 統計功能 更穩定的運作:除錯及系統效能調校 更便利的管理 整批資料處理 後端管理工具 更豐富、多樣化的連結 與外部資源介接 2013 - 2007 其他加值功能 雲端、智能運算 進階統計:呈現機構學術能量 9 資料瀏覽與檢索 資料瀏覽 11 資料瀏覽 導入外部相關資源 (RC6) 引文資訊 相關詞條說明:維基百科相關資源 共享連結及其他其他資源 (可自訂) 書目資料匯出 (RC6) 通用格式: EndNote RIS、BiBtex 創用CC (RC6) 查詢圖書館館藏:書、期刊 (RC6) 依資料類型瀏覽及查詢 (RC5) 適用於行動裝置之資料瀏覽 (RC6+) 相關文章推薦 (RC6+) 12 資料檢索 檢索詞彙推薦:維基百科相關資源 (RC6) 檢索結果排序 (RC5) 進階檢索:全文檢索與內文檢索 (RC6) 支援TAIR新功能 (RC5) 瀏覽及Meta-Search 即時統計 提昇檢索效能 robots.txt google網站管理員 spider設定、counter filter 13 資料檢索 提昇被索引率 Google Scholar建議 紀錄不要經常有大量的異動 全文檔最好確實是全文檔而非僅有連結 外部連結是否允許Google直接索引全文 Metadata儘量詳細且完整 journal/volume/page 作者語言與作品語言相符 以Metatag註記欄位及內容 <meta name="citation_date" content="2010-03" xml:lang="en_US" NTUR 系統改進 scheme="citation_date" /> 手動產生sitemaps <meta name="citation_title" content="Chiral angle dependence of 文件微格式(Microformat)著錄 resonance window widths in …." xml:lang="en_US" scheme="citation_title" /> 14 個人功能 使用者個人頁面(RC5) 個人資料 著作文件 (文件認領) 欄位名稱 show_profile 說明 是否顯示個人資料於前端 填寫內容 0 (否) / 1(是) Profile research_subject 個人基本資料 研究主題 自由填寫 自由填寫 related url researcher_id 相關網址 於Web of knowledge網站 已申請之Researcher ID 網址 researcher id bitstream_id 相關檔案,可設定是否作 為代表圖示 選擇本地端檔案 15 統計資訊 上傳與下載相關統計 (RC6) 社群與類別瀏覽時, 可檢視該範圍內之統計 文件下載次數計算 cache機制:固定時間更新 社群、類別計數 (全文筆數/總筆數) 資料庫 索引更新 造訪人次 local counter(簡易) 紀錄每日造訪人次 Counter filter 固定時間更新 利用Session紀錄線上人數 流量監控元件嵌入 Google analytics Awstats 16 統計資訊 Dspace 每月報表 依log分析,需手動執行 計算依據 統計項目 $IR_HOME/log/dspace.log.* [date] [log type] [program] [user]:[session_id]:[ip_addr] [action type] [resource_id] 檢索關鍵詞報表、連線IP排行、文件上傳數量、文件被瀏覽次數排行 資料庫報表匯出 每月新增資料數量、上傳下載排行 客制化query 報表 17 後端管理工具 整批資料處理 整批資枓匯出:依類別或社群下載打包文件 整批資料新增 / 修改 / 刪除 整批檔案上傳 / 權限設定 資料格式化與剖析 作者姓名格式化 (RC5) [last name], [first name] 資料來源字串剖析 (RC6) dc.relation: 關聯: Journal of Organic Chemistry, 57 (9), 2760-2762 Journal title / volume / issue / page / publish year 應用:引文格式匯出、查詢圖書館館藏 18 後端管理工具 社群與類別管理(RC5) 複製與移動 社群及類別之"參見"設定 詮釋資料欄位名稱中英語言對應(RC5) 資料隱藏 整筆資料隱藏 詮釋資料欄位隱藏(RC6) 全部資料隱藏特定欄位 單筆資料隱藏特定欄位 19 與外部資源介接 單一簽入(Single Sign On) 提供single sign on 之介接API (web service) 需有技術人員開發介接程式 運作概念 遠端認證介面 (各校提供url) 回傳認證結果 (各校提供 session) 若認證通過,以session number取回使用者資料 (各校提供API) 若使用者第一次登入,則新建帳號 (NTUR) 依使用者所屬系所自動授予上傳權限給名稱相同的社群 (NTUR) LDAP 21 外部資料匯入 單筆上傳 metadata import API 實例:臺大學術成果資訊系統與NTUR互通流程 整批匯入 整批轉檔/介接工具 eThesys轉NTUR程式(感謝中山大學提供) 國科會計畫資料轉NTUR程式 22 外部資料之顯示與匯出 引文資料顯示 (RC6) 查詢欄位:dc.doi WOS SCOPUS(感謝淡江大學提供) 資料匯出 (RC6) End Note RIS format 其他常用引文格式 相關詞條說明 (RC6) 館藏目錄查詢 (RC6) 社群及其他功能項目嵌入 (RC6) 23 資料交換 資料擷取:OAI-PMH http://ntur.lib.ntu.edu.tw/dspace-oai/request? Discovery Service探索服務主要接口 新增輸出欄位:社群/類別名稱、全文連結 資料訂閱:RSS 整合查詢:JSON (RC5) 可以http方式直接呼叫API,網址為: http://[ IR 系統ip]/simple-search-json?[參數] http://ntur.lib.ntu.edu.tw/simple-search-json? query=test&limit=100&start=1000 JSON格式範例 { "streetAddress": "21 2nd Street", "city": "New York", "state": "NY", "postalCode": "10021" }, 24 挑戰及未來工作 系統發展走向 維持系統彈性設計 提供多樣化、標準化之接口 深化統計分析、呈現資料特性與使用效益 近期發展重點 Web使用介面發展 統計資料進階分析 整合其他模組 Dspace 新版功能模組 各校技術開發團隊產出 雲端計算與知識庫整合應用 25 系統維運支援 機構典藏計劃網站 http://ir.org.tw 支援項目 系統安裝/移機/版本更新 系統內容建構設計 技術FAQ 錯誤回報 26 感謝聆聽,敬請指教 NTUR開發團隊 陳光華教授、黃乾綱教授 吳瑟量、黃建智、江玉婷 27