14 장 도서관과 서지검색 시스템

Download Report

Transcript 14 장 도서관과 서지검색 시스템

14 장 도서관과 서지검색 시스템

목차 14.1 소개 14.2 온라인 IR 시스템과 문헌 데이터베이스 14.3 온라인 공공 접근 목록 14.4 도서관과 전자도서관 프로젝트 14.5 연구동향 및 쟁정 14.6 참고 문헌 고찰

최신정보검색론 Chapter 14 1

14.1 소개

도서관 정보 검색 시스템의 발전 [Hildreth (372)]

다른 경로들을 따라간, 온라인 공공 접근 목록(OPAC: On-line Public Access Catalog)과 전통적인 정보 검색(IR) 시스템의 개발 역사는 시스템 개발의 기원, 파일과 데이터베이스 내용, 목표로 한 사용자의 세 가지 측면에서 달랐다.

• 정보 검색 시스템 – 대량의 텍스트 정보가 들어 있는 서지(bibliographic) 데이터베이스에기반 - 훈련된 탐색 중개자를 대상 • OPAC - 대규모 학술 도서관 시스템으로 개발 - 턴키(turnkey) 시스템으로 개발 - MARC 레코드 이용, 도서관 이용자 대상 최신정보검색론 Chapter 14 2

14.2 온라인 IR 시스템과 문헌 데이터베이스 • 데이터베이스 판매자

탐색 소프트웨어 제공 - 데이터베이스 생산자에게 허가를 받아 사용자가 이용할 수 있도록가치를 부가 - 레코드 포맷에 어느 정도의 표준을 제공 - 색인을 만듦(역파일 형태) - 다중 데이터베이스 탐색을 위한 공통의 인터페이스 제공 • 상용 데이터베이스의 특징 - 매우 큰 크기 - 많은 동시 사용자

최신정보검색론 Chapter 14 3

상승적인 관계가 문헌 데이터베이스 생산자와 판매자 사이에 존재 데이터베이스 생산자 데이터베이스 구조 설계 문헌 수집 요약(혹은 저자가 작성한 초록 편집) 통제 어휘로 색인 정기적으로 파일 갱신 판매자에게 옛 파일과 갱신 내용 영업 데이터베이스 판매자 탐색 소프트웨어 제작 생산자로부터 데이터베이스 저작권 취득 레코드 구조 표준화 역파일 색인을 만들어 데이터베이스 탑재 주기적(매일, 매주, 매달) 데이터베이스 갱신 탐색자를 위한 문서화 준비 고객에게 판매 고객 위주로 서비스와 훈련 제공 최신정보검색론 그림 14.1

데이터베이스 생산자와 판매자의 역할 Chapter 14 4

데이터베이스 판매자 DIALOG, LEXIS-NEXIS, OCLC, H.W.Wilson

DIALOG 세계에서 가장 큰 온라인 정보 회사인 DIALOG는 과학, 기술, 의학, 인류학, 비즈니스와 전자 신문을 포함하여 다양한 주제 모두를 커버하는 약 500개의 데이터베이스를 갖고 있다. 서지 정보와 전문 데이터베이스들이 포함되며, 몇몇 데이터베이스들은 현지 탐색을 위해 CD-ROM 버전으로 이용 가능하다.

URL:http://www.dialog.com

LEXIS-NEXIS LEXIS-NEXIS는 전문 데이터베이스들을 법조와 비즈니스계에 매매한다. LEXIS는 주와 연방 판례 법, 정관, 규정 등을 포함하여 4800개의 법률 연구 생산물에 대한 접근을 제공한다. NEXIS는 18000개 이상의 뉴스와 비즈니스 자료들을 커버한다.

URL:http://www.lexis-nexis.com

OCLC 도서관 자료의 공동 편목을 위한 서지정보 사업으로 시작한 OCLC(the Online Computer Library Center, Inc.)는 현재 70개 이상의 데이터베이스와 1천5백만 전문 기사들에 대한 접근을 제공한다. 최종 사용자 중심의 인터페이스와 상호 대차 모듈이 특징이다.

URL:http://www.oclc.org/oclc/menu/fs.html

H.W. Wilson H.W. Wilson은 1898년 인쇄된 색인을 생산하는 것으로 시작해서, 지금은 40개의 데이터베이스를 공공기관, 학교, 대학 도서관 시장에 제공한다. Wilson은 전자 형태의 CD-ROM, 마그네틱 테이프, 웹 기반 버전을 갖고 있다.

URL:http://www.hwwilson.com/default.htm

최신정보검색론 그림 14.2

데이터베이스 판매자의 소개 Chapter 14 5

14.2.1 데이터베이스

• 상용 온라인 검색 시스템 서지 정보 데이터베이스를 전자 형태로 생성하면서 시작 전문기관, 상업회사, 정부 조직체가 문헌에서 관련 자료를 선택  서지레코드 를 만들고, 초록을 제공  결과적으로 나온 정보를 테이프에 보관  정보검색을 목적으로 이용  서지 정보 뿐만 아니라 문헌 자체도 포함 (전문 데이터베이스) • 데이터베이스와 색인 데이터베이스는 단일한 표준이 없으며, 수동으로 색인 자동 색인 시스템에 관심 최신정보검색론 Chapter 14 6

14.2.1 데이터베이스(계속)

CA SEARCH: 화학 초록 적용 범위: 화학과 그 응용에 관한 전세계 문헌을 위한 서지 레코드 파일크기: 1천4백만 레코드; 매주 11,000 레코드 갱신 MEDLINE 적용 범위: 임상 및 실험 의학, 치과의학, 간호, 약리학, 정신 의학 등을 포함한 생체 임상 의학의 광범위한 분야의 전세계 3,700 저널 기사들을 색인한다.

파일크기: 약 9백5십만 레코드; 매주 7,700 레코드 갱신 New York Times - 전문 적용범위: 1981년부터 현재까지의 뉴욕 타임즈 전문 파일크기: 1천8백만 레코드; 매일 갱신 PsycINFO: 심리학 초록 적용범위: 1887년부터 현재까지의 정신의학, 사회학, 인류학, 교육, 약리학과 언어학을 포함하여 심리학 관련 행위 및 사회과학의 자료들을 위한 서지 레코드 파일크기: 1천5백만 레코드; 매달 5,000 레코드 갱신 그림 14.3 DIALOG상의 잘 알려진 몇몇 데이터베이스들의 특성 최신정보검색론 Chapter 14 7

DIALOG(R)File 5:BIOSIS PREVIEWS(R) (c) 1998 BIOSIS. All rts. reserv.

13165209 BIOSIS Number: 99165209 Population genetics of the Komodo dragon Varanus komodoensis Ciofi C; Bruford M; Swingland I R D.I.C.E., Univ. Kent, Kent, UK Bulletin of the Ecological Society of America 77 (3 SUPPL, PART 2). 1996. 81.

Full Journal Title: 1996 Annual Combined Meeting of the Ecological Society of America on Ecologists/Biologists as Problem Solvers, Providence, Rhode Island, USA, August 10-14, 1996.

Bulletin of the Ecological Society of America ISSN: 0012-9623 Language: ENGLISH Document Type: CONFERENCE PAPER Print Number: Biological Abstracts/RPM Vol. 048 Iss. 010 Ref. 171812 Descriptors/Keywords: MEETING ABSTRACT; VARANUSKOMODOENSIS; DRAGON; MONITOR LIZAR; GENETIC DIVERGENCE; GENE KOMODO FLOW; EVOLUTION; GENETIC DIVERSITY; SPECIES RANGE; POPU- LATION SIZE; POPULATION GENETICS; LESSER SUNDA REGION; IN- DONESIAN ISLANDS; ORIENTAL REGION; KOMODO; RINCA; FLORES; GILI MOTANG; INDONESIA Concept Codes: 03506 Genetics and Cytogenetics-Animal 03509 Genetics and Cytogenetics-Population Genetics (1972-) 07508 Ecology; Environmental Biology-Animal 62800 Animal Distribution (1971-) 00520 General Biology-Symposia, Transactions and Proceedings Conferences, Congresses, Review Annuals Biosystematic Codes: 85408 Sauria Super Taxa: Animals; Chordates; Vertebrates; Nonhuman Vertebrates; Reptiles 최신정보검색론 그림 14.4

샘플 레코드: BIOSIS PREVIEWS Chapter 14 8

DIALOG(R)File 39: Historical Abstracts (c) 1998 ABC-CLIO. All rts. reserv.

1488625 47A-9910 THE U.S.S. KEARARGE, SIXTEEN IRISHMEN, AND A DARK AND STORMY NIGHT.

Sloan, Edward W American Neptune 1994 54(4): 259-264.

NOTE: Based on primary sources, including the Offical Records of the Union and Confederate Navies in the War of the Rebelion, Series I and II(1894-1927); 28 notes.

DOCUMENT TYPE: ARTICLE ABSTRACT: Tells the story of the Union navy's Kearsarge, a sloop-of-war that patrolled English seas looking for Confederate commerce raiders. Upon dock- ing at the Irish port of Cobh(Queenstown) in November 1863, 16 locals stowed away. They were subsequently returned to Cobh, but in the meantime Captain John Winslow temporarily enlisted the men in order, he said, that they be jus- tifiably clothed and fed, although other ship diaries indicate that the ship was short-handed and Winslow intended a real enlistment. Whatever the reality, the captain inadvertently created an international crisis since his action technically violated the British Foreign Enlistments Act. It is unclear whether Confederates plotted the incident to embarrass the Union in Britain because there are dispar- ities between offical accounts and the diaries of individual crewmen. (S) DESCRIPTORS: USA ; Civil War ; Ireland-(Cobh) ; Kearsarge-(vessel) ; Po- litical Crisis ; Military Service ; Stowaways ; 1862-1864 HISTORICAL PERIOD: 1860D 1800H HISTORICAL PERIOD (Starting): 1862 HISTORICAL PERIOD (Ending): 1864 그림

14.5

샘플 레코드: Historical Abstracts. ABC-CLIO, CA, USA 최신정보검색론 Chapter 14 9

14.2.2 온라인 검색 시스템 • 1950 년대 : 서지 정보 검색을 위한 컴퓨터 이용 등장 • 1960 년대 : 온라인 프로토 타입 시스템 개발

- 최초의 서비스 : Lockheed의 DIALOG  NASA 에 의에 구현 - 오늘날 DIALOG는 인터넷을 통해 개인, 도서관등에 서비스 최신정보검색론 Chapter 14 10

14.2.3 온라인 검색 시스템의 IR

• 온라인 검색 시스템  불리안 모델에 기반 • 불리안 모델의 우선 요인 - 재정적 고려(탐색 소프트웨어와 데이터베이스 구조의 주요 변경 비용) - 서비스 쟁점(기존 시스템에서 훈련 받은 고객들) - 대안들을 지지하는 증거의 부족 최신정보검색론 Chapter 14 11

begin 61 File 61:LISA(LIBRARY&INFOSCI) 1969-1988/May (c) 1998 Reed Reference Publishing Set Items Description -- ---- ---------- ? ss (document or information or text)(w)retrieval s1 s2 7363 92299 DOCUMENT INFORMATION s3 s4 s5 6219 29302 15338 TEXT RETIEVAL (DOCUMENT OR INFORMATION OR TEXT)(W)RETRIVAL ? ss opac? ? or online(w)public(w)access(w)catalog?

s6 1111 OPAC? ?

s7 s8 s9 20922 32238 16388 ONLINE PUBLIC ACCESS s10 s11 18798 424 CATALOG?

ONLINE(W)PUBLIC(W)ACCESS(W)CATALOG?

s12 1246 OPAC? ?

OR ONLINE(W)PUBLIC(W)ACCESS(W)CATALOG?

? s s5 and s12 15338 1246 s13 146 ? s s13/ ti, de s14 100 s5 s12 s5 AND s12 s13/ TI, DE 그림 14.6 DIALOG 탐색 예 최신정보검색론 Chapter 14 12

14.2.4 자연언어 탐색

• 기존의 불리안 탐색엔진에 추가  중복 제거, 검색 집합의 순위화 , 정렬화 WESTLAW(법학 정보 판매자)  DIALOG  LEXIS-NEXIS  WIN 시스템 TARGET FREESTYLE • WIN 과 FREESTYLE 은 자연언어 질의 • TARGET 은 탐색에 유용하지 않은 용어 제거 명령 제공 최신정보검색론 Chapter 14 13

? target Input search terms separated by spaces (e.g., DOG CAT FOOD).

You can enhance your TARGET search with the following options: - PHRASES are enclosed in single quotes (e.g., 'DOG FOOD') - SYNONYMS are enclosed in parentheses (e.g., (DOG CANINE)) - SPELLING variations are indicated with a ?

(e.g., DOG? to search DOG, DOGS) - Terms that MUST be present are flagged with an asterisk (e.g., DOG *FOOD) Q = QUIT H = HELP ? komodo dragon food diet nutrition your TARGET search request will retrieve up to 50 of the Statistically most relevant records.

Searching 1997-1998 records only ...Processing Complete Your search retrieved 50 records.

Press ENTER to browse results QUIT H = HELP 그림 14.7

C = Customize display Q = DIALOG상에서의 TARGET 탐색 예 최신정보검색론 Chapter 14 14

14.3 온라인 공공 접근 목록(OPAC)

• 온라인 목록의 역사 [Hildreth] - 1세대 : [OPAC] 저자, 제목, 제언 번호 탐색  자동화 형태의 구식 기술(카드형태 ) - 2세대 : [확장된 탐색 기능] 키워드, 기본적인 불리안 탐색  화면 표시 형태 선택(Short,Medium,Long), 개선된 유 용성(알기쉬운 오류 메시지, 전문가/초보자에 따른 대화) 2세대 시스템의 문제: 실패한 탐색, 항해 혼란, 주제 색인 어휘의 문제, 지나치게 크고 나쁘게 구성된 검색 집합 - 3세대 : 탐색 전략 지원, 자유 텍스트/통제 어휘 접근 방법의 통합 확장된 목록 레코드, 교차 데이터베이스 접근, 자연언어 입 력, 개인화 된 화면 표시, 문맥 의존 오류 교정 최신정보검색론 Chapter 14 15

14.3 온라인 공공 접근 목록(OPAC) (계속) 최근 도서관 시스템 개발의 강조점 : 새로운 개방 시스템 구조 안에서 도서관 관리 시스템의 재배치 -

그래픽 사용자 인터페이스(GUI) - Z39.50 지원 - 전자형태 - 하이퍼텍스트 링크 - Dublin Core(멀티미디어 자료를 위해 개발중인 메타 데이터 표준) - JAVA 프로그래밍의 편입 - EOSi의 Q 시리즈와 같은 고급 탐색 기능 탑재 최신정보검색론 Chapter 14 16

14.3.1 OPAC과 그 내용

• MARC 레코드 : 온라인 목록을 지원하는 많은 도서관의 협동을 이루는 기반구조 • MARC의 데이터 포맷 - Information Interchange Format(ANSI Z39.2) - Format for information Exchange(ISO 2709) • MARC 의 변형 : USMARC, UKMARC, KOMARC • MARC의 구성 (3부분) - 고정길이(24문자) 리더 - 레코드 각 필드에 대한 3자리 태그/ 그 필드의 문자 길이를 나타내는 레코드 디렉토리 - 데이터 필드와 서브필드 최신정보검색론 Chapter 14 17

0 0 7 2 3 cam 22002418a 4500001001300000008004100013005001700054 010001800071020003300089040001300122050002600135082001 700161 100002000178245007400198250001200272260005200284300003 400336 504006400370650004100434 001 0013 97002718 008 0041 005 0017 970417s1997 ilua 19971128134653.1

b 001 0 eng 010 0018 020 0033 040 0013 050 0026 082 0017 100 0020 245 0074 250 0012 260 0052 300 0034 504 0064 $a 97002718 $a0838907075 (acid-free paper) $aDLC$cDLC 00$aZ699.35.M28$bH34 1997 00$a025.3/16$221 1 $aHagler, Ronald.

14$aThe bibliographic record and information technology / $cRonald Hagler.

$3rd ed.

$aChicago :$bAmerican Library Association,$c1997.

$axvi, 394 p. :$bill. ;$c24 cm.

$aIncludes bibliographical references (p.375-380) and index.

그림 14.8 MARC 레코드 예 18

14.3.2 OPAC과 최종 사용자

• 실질적인 최종 사용자 – 공식적인 훈련을 받지 않은 사람 : MARC 레코드는 상세하고 복잡하여 직관이지 못함 • OPAC 에서의 일반적인 탐색 : 주제 탐색 • OPAC 탐색의 실패 - 공집합 - 정보 과부하 (쉽게 조사될 수 있는 양보다 훨씬 많은 참조들이 검색) 최신정보검색론 Chapter 14 19

14.3.3 OPAC: 판매자와 생산자

• 특수한 OPAC 시장

시장 점유를 위하여 경쟁하는 한정된 수의 판매자 들에 의해 개발되고 판매 • 도서관은 항시 변화 상태에 있어서 옛 것들이 폐용 되거나 지원되지 않게 되면 시스템을 개량하거나 새로운 시스템을 도입 • 예 [그림 14.9 (21Page)] 많은 학술 도서관들은 유서 깊은 메인 프레임 기반 NOTIS 소프트웨어 에 바탕을 둔OPAC을 사용하고 있어서, 적당한 대체를 찾을 시점이 되었다.따라서 많은 판매자들은 틈새 시장인 학술 도서관, 공공도서관, 학교와 특수 도서관들을 겨냥한다. 이러한 판매상들을 소개한그림이다. 최신정보검색론 Chapter 14 20

Endeavor Information Systems, Inc.

상당한 학술 도서관 고객과 함께, Endeavor는 많은 NOTIS 시스템을 대신해 왔다.

이것의 시스템인 Voyager는 DBMS로 Oracle를 채택한 다단계(multi-tier) 구조에 기반하며, 공공 접근 클라이언트와 서버는 Z39.50을 따른다. 탐색 엔진은 자연언어 질의와 결과를 표시하기 위한 연관성 순위화를 지원한다.

URL:http://www.endinfosys.com

Innovative Interfaces, Inc. (III) 이 산업의 큰 회사인 III는 학술 도서관 고객을 기반으로, 공공 도서관 고객을 확보하고 있다. 이 회사의 가장 최신 시스템인 Millennium은 INNOPAC 도서관 관리 시스템에 기초하지만, Java로 개발된 모듈들로 이루어진 가벼운(thin) 클라이언트 구조를 추가했다. INNOPAC은 자체 탐색 엔진과 Fulcrum Technologies로부터 사용 허가된 탐색엔진을 함께 사용한다. Millennium의 연관성 순위화는 전문 탐색에 대해 제공된다.

URL:http://www.iii.com

EOS International (EOSi) EOSi는 소규모 도서관들을 주 대상으로 하며, 특수 도서관, 학술 도서관, 공공 도서관, 학교 도서관 고객을 기반으로 한다. 도서관 관리 시스템 도구인 Q 시리즈는 3 단 계 ( Three-tier) 클 라 이 언 트 / 서 버 구조 를 이 용하 며 , 탐 색 엔 진 은 Excalibur Technologies로부터 라이센스를 받은 Excalibur RetrievalWare이다. 표준 불리언 탐색이 가능하지만, 자연언어 입력, 사전 기반 질의 확장, 나쁜 자료를 위한 퍼지 탐색, 연관성 순위화 출력 등의 고급 기능이 지원된다.

URL:http://www.eosintl.com

최신정보검색론 그림 14.9 도서관 관리 시스템 판매자들 Chapter 14 21

14.3.4 판매자 OPAC에 대한 대안

• 초기 OPAC은 열성적인 아마추어들에 의해 개발되었지만, 현재는 제 3자가 턴키 시스템을 지원 • 연구 중심으로 개발된 시스템 런던 City 대학  Virginia Tech  캘리포니아 대학  UC Berkeley 분관(branch)  Okapi 시스템 MARIAN MELVYL 시스템 Cheshire II 시스템 • Cheshire II 시스템 - Z39.50 , SGML 표준 이용 - 수학, 통계학, 천문학 도서관을 위한 설계 - 서지, 전문, 멀티미디어 자원의 통합 접근을 제공 - 확률 순위화와 불리안 탐색 최신정보검색론 Chapter 14 22

14.4 도서관과 전자도서관 프로젝트

도서관의 전자 정보에 의한 경계가 없는 접근 OPAC이 아니라 도서관 웹 페이지를 도서관 이용자를 위한 관문으로 본다. 이용자는 웹 페이지를 통하여 도서관 목록, 네트워크에 연결된 정보 자원, 지역적으로 생산된 정보에 대한 접근 허가를 얻는다.

• 웹 – 지역적인 OPAC, 저널 전문, 신문, 과학, 인류학, 비즈니스 분야의 원격제어가 가능한 데이터베이스 접근을 제공 - 텍스트 뿐만 아니라 멀티미디어 형태도 이용 가능 - 자원과 컬렉션의 관점에서 통합을 제공 - 표준형태의 탐색 구조  이러한 특성 때문에 OPAC 과 원격 데이터베이스로의 정보 검색 사이의 전통적인 구분이 사라짐 최신정보검색론 Chapter 14 23

14.5 연구 동향 및 쟁점

• 자동화 환경에서 통합의 용이성과 사용의 편의성을 제공하는 시스템 • 표준의 개발과 응용 • 사용의 편의성, 사용자 중심의 연구와 설계

최신정보검색론 Chapter 14 24