Z39.50とその動向

Download Report

Transcript Z39.50とその動向

Z39.50とその動向
インテック・ウェブ・アンド・ゲノム・インフォマティクス
株式会社
技術部 石田 茂
1
2001.9.21
Web & Genome
内容







2
Z39.50とは何か?
Z39.50はどのように使用するのか?
市場動向
Z39.50はどのように機能するのか?
Z39.50とILL(図書館間相互貸借)
国内利用に向けて必要な環境(合意)
Z39.50の将来
2001.9.21
Web & Genome
Z39.50とは何か?

ネットワークベースの情報検索プロトコル



OSI参照モデル7層 - ASN.1、BER
サーバ/クライアント型
ANSI/NISO Z39.50-1995 (ISO
23950:1998)
NISO - National Information Standards Organization
 ISO - International Standards Organization
米国議会図書館にMaintenance Agency設置



3
Ray Denenberg がまとめ役
2001.9.21
Web & Genome
ZIG - Z39.50 Implementors Group





4
Z39.50システムの開発者グループ
改正、修正、問題認識ならびに提起等を議論
実装者合意を作成
5ヶ月に一度の会合(北米、EU、ワシントンDC)
コンセンサス主導の作業方針
2001.9.21
Web & Genome
開発経緯

1978-82


1982-83


NISOに再提出。Z39.50-1988として承認
1979-89

5
開発継続
1988


ANSI Z39に提出.Z39.50-1984.承認投票に失敗
1984-87


Linked Systems Project Protocol
1983-84


初期の開発/調査研究
Z39 SC D
2001.9.21
Web & Genome
開発経緯

1984-91


1990





6
ZIG(実装者グループ)設立
1989-90


ISO SR → ISO 10162/10163 Search & Retrieve (1993)
Z39.50 Maintenance Agency設立
1992

Z39.50-1992 (version 2)

version 3開発

Z39.50-1995

ISO 23950
1990-95
1995
1998
2001.9.21
Web & Genome
目的

クライアント・サーバシステム間で情報検索の相互連携性を
確保する

ベンダー間の相互連携


組織間の相互連携



公共図書館と大学図書館
様々なコミュニティにおける図書館
コミュニティ間の相互連携

7
様々な図書フォーマット
ユーザグループ間の相互連携


様々なDBとユーザIF
図書館、出版社、 DBサービス、美術・博物館等
2001.9.21
Web & Genome
どのように使用するか?

抽象化DB

標準化されたアクセスポイント



標準化された検索式
標準化された返戻形式




8
属性集合
スキーマ
選択可能なレコード構文
返戻時にレコードの選択が可能
レコード内容に左右されない検索処理
2001.9.21
Web & Genome
どのように使用するか?

抽象化されたDBは、実際のDBのフロントエ
ンドとして実装される。
Z39.50クライアント
アプリ
機能
9
Z39.50サーバ
Z39.50
クライアント
Z39.50
サーバ
2001.9.21
DB
Web & Genome
補足機能






10
走査
永続的検索結果集合
定期的検索実行
蔵書注文
DB更新
仕様導出、発動
2001.9.21
Web & Genome
相互連携にみる特徴

DB毎に異なる機能


DB毎に異なる情報形式


11
アクセスポイント等の属性集合、実装特徴
US MARC, UNIMARC, SUTRS, GRS-1
所蔵情報の内包、分離
2001.9.21
Web & Genome
Profile

標準仕様の使用方法に関する合意規定






12
どのアクセスポイントが有効?
どの属性が有効?
レコード構文には何が指定できる?
どの(補足)機能が一般に利用できる?
どのオプションが利用できる?
特定分野向けのデータは許容される?
2001.9.21
Web & Genome
Profile例

ATS-1



GILS


13
Author, Title, Subject
初期の図書向け簡易仕様 (廃止)
行政情報所在案内サービス
汎用的な情報所在案内サービスの参照モデル
2001.9.21
Web & Genome
Profile例

CIMI



14
美術館情報をコンピュータ上で交換するためのコ
ンソーシアムが作成
テキスト以外に画像情報も検索対象とする
CIP

Catalogue Interoperability Protocol

国際的な地球観測衛星委員会が作成

地理空間情報の検索にも利用される
2001.9.21
Web & Genome
Profile例

GEO


STAS


15
地理空間情報を対象
科学工学向け属性集合を規定
正確にはProfileではない
2001.9.21
Web & Genome
主要な図書館向けProfile

ONE





CENL



16
OPAC Network Europe
1996年作成
ノルウェー、ドイツ、英国で利用
アクセスポイントと要素集合に関する最小規定
Conference of European National Librarians
1997年作成、1998年後半に批准
ONE profileの拡張版
2001.9.21
Web & Genome
主要な図書館向けProfile


Finnish Z39.50 profile
Danish Z39.50 profile


17
国際的なONE profileに対して、分類方式に関する国内
仕様を追加規定
CENLとONEの拡張版
2001.9.21
Web & Genome
主要な図書館向けProfile

Union Catalogue Profile



18
Union catalogue向けに要求仕様を定義
オーストラリアで作成
1998年に受理
2001.9.21
Web & Genome
Z39.50の難点



複雑なプロトコル
難解な用語
元はISO/OSI規格に準拠



19
TCP/IP上で実装
難解な理論ベースのプロトコル
様々な抽象化レベル
2001.9.21
Web & Genome
Z39.50の難点

機能的に収斂した製品が未だ無い

今後、MozillaのRDF実装が該当?

適切な専門化が極少数
製品の長期的なサイクルを考慮
標準化の前に仕様上の十分な探索がされていない

広く普及させることで困難な問題点を解決!


20
2001.9.21
Web & Genome
Z39.50の適用方法



21
サーバ(Target)
ゲートウェイ
クライアント(Origin)
2001.9.21
Web & Genome
サーバ(Target)





抽象化DBを実装
特殊な開発作業
ツールキットのカスタマイズ
サーバモジュールの準備
DBコンフィグレーション

22
Z39.50サーバ
Z39.50
サーバ
DB
実際のDBを抽象化DBとしてどのように表現するか?
2001.9.21
Web & Genome
ゲートウェイ



IFに二つの顔を持つ
Z39.50サーバに対して、Z39.50クライアント
として通信する顔
一般的なクライアントと通信する顔

23
クライアントプロトコルにはHTML, Telnet,
Z39.50…
2001.9.21
Web & Genome
Webゲートウェイ
Z39.50サーバ
Webブラウザ
HTTP
サーバ
24
ビジネス Z39.50
ロジック クライアント
2001.9.21
Web & Genome
横断的ゲートウェイ
Z39.50サーバ
Z39.50
クライアント
Z39.50クライアント
Z39.50サーバ
Z39.50
サーバ
ビジネス Z39.50
ロジック クライアント
Z39.50
クライアント
25
2001.9.21
Z39.50サーバ
Web & Genome
高度なゲートウェイ

複数のZ39.50サーバと接続する




両方のIFに様々なプロトコルに対応する

26
並列検索
連続検索
検索結果のマージ
SQL, LDAP, HTML, DNS…
2001.9.21
Web & Genome
高度なゲートウェイ
Z39.50サーバ
Z39.50クライアント
Z39.50
サーバ
Z39.50
クライアント
Webブラウザ
SQLサーバ
ビジネス
SQL
ロジック クライアント
HTTP
サーバ
専用システム
27
専用
プロトコル
サーバ
2001.9.21
LDAP
クライアント
LDAPサーバ
Web & Genome
クライアント(Origin)

グラフィカルなユーザIFのプロトコル処理部



ユーザから複雑さは隠されている
拡張コンフィグレーションの必要性
同時に複数のサーバに接続する場合あり
Z39.50クライアント
アプリ
機能
28
Z39.50
クライアント
2001.9.21
Web & Genome
市場動向

統合システム

図書館システム
海外の主要なシステムは全てZ39.50機能をもつ
 専用クライアントあるいはWebゲートウェイ
 小規模システムにもZ39.50を採用するものあり
 多くのシステムはVersion 2 を採用する

 INNOPAC等の米国製システムに多い
29
2001.9.21
Web & Genome
市場動向



スタンドアロン製品
ツールキットレベル製品
システムインテグレーション・コンサルタント






30
Crossnet (UK)
Fretwell-Downing (UK)
Indexdata (Denmark)
Sunstone (Sweden)
Blueangel Technologies (US)
Finsiel (Italy)
2001.9.21
Web & Genome
市場動向(国内)
主な機能
Server
Web
G/W
NACSIS-ELS/ NII国立
情報学研究所
○
(NII内)
○
(NII内)
○
INNOPAC/ Innovative
Interface Inc. 日本IBM
○
○
○
○
○
メーカ/
サービスベンダー
LibCruiser Pro/ NTT東日本
Gateway-CAT/ 丸善
JOIS with STN/ JST科学技術
振興事業団
InfoLib-Global Finder/
日商岩井インフォコム
SiteSearch/
OCLC, 紀伊国屋
ERL/
Silver Platter, 紀伊国屋
Ovid/ Ovid Technologies Inc,
ユサコ
Telnet
G/W
○
(丸善内)
○
(JST内)
○
(JST内)
○
○
○
○
○
○
○
○
○
日本語
○
○
(丸善経由)
○
Proxy
○
○
採用機関/特徴
早稲田大学
東京工業大学、図書館
情報大学、神戸大学
OpenText
RLG Zephyer
Server
大学系図書館(多数)
CAS Server
○
○
OpenText
大学系図書館(多数)
○
CharsetandLanguageNego(3)
○
UTF8/ISO2022-JP対応
NACSIS-CAT,MARC21対応
新日鉄ソリューション大分
31
外部連携
大学系図書館(多数)
○
LibVision V3(LVZ)/
日本IBM、紀伊国屋、
検索エンジン
2001.9.21
Web & Genome
Z39.50はどのように機能するか?

機能とサービス

32
機能は一つ以上のサービスから構成される
2001.9.21
Web & Genome
初期化機能

初期化サービス

Z-アソシエーションの確立
クライアント
初期化要求
サーバ
Version、ID/パスワード、オプション、
メッセージサイズ、実装情報
初期化応答
結果、Version、オプション、
メッセージサイズ、実装情報
33
2001.9.21
Web & Genome
初期化機能

使用可能なサービスとオプションを交渉する
クライアントは“初期化要求”内のリストで様々なサー
ビスを要求する
 サーバは自身の機能・能力と比較調整し、可能なサー
ビスならびにオプションを初期化応答でクライアントに
返す

34
2001.9.21
Web & Genome
検索機能

検索サービス
クライアント
検索要求
検索式タイプ、検索式、DB,
結果集合名
サーバ
検索応答
ヒット件数、返戻レコード件数、
ステータス情報、(レコード)
35
2001.9.21
Web & Genome
返戻機能

返戻サービス
クライアント
返戻要求
レコード件数、開始順位、
結果集合名
サーバ
返戻応答
レコード件数、ステータス、
(レコード)
36
2001.9.21
Web & Genome
返戻機能

セグメントサービス


レコードを“セグメント”することで、初期化時に設
定したメッセージサイズよりも大きいレコードを転
送することができる
二つのレベル
Level 1: 一つのセグメントに複数のレコードを格納
 Level 2: 一つのレコードを細分化して各セグメントに
格納

37
2001.9.21
Web & Genome
検索結果集合削除機能

削除サービス
クライアント
サーバ
削除要求
結果集合リスト
削除応答
ステータス
38
2001.9.21
Web & Genome
アクセス制御機能

アクセス制御サービス
クライアント
サーバ
要求(一般)
アクセス制御要求
セキュリティ申請
アクセス制御応答
セキュリティ申請応答
応答(一般)
39
2001.9.21
Web & Genome
課金・リソース制御機能



リソース制御サービス
トリガリソース制御サービス
リソース報告サービス


40
リソースの使用を制御、報告する複雑な機能
主に課金情報を作成するために使用される
2001.9.21
Web & Genome
ソート機能

ソートサービス
ソート要求
ソート対象の結果集合、
ソート済結果集合、
ソート方式
クライアント
サーバ
ソート応答
ステータス
41
2001.9.21
Web & Genome
走査機能

走査サービス
クライアント
サーバ
走査要求
DB、単語リスト、開始位置、
単語数、(ステップサイズ)
走査応答
ステータス、単語数、(単語)
42
2001.9.21
Web & Genome
拡張サービス機能

拡張サービス







タスクパッケージ

43
永続的検索結果集合
永続的検索式
定期的検索実行
蔵書注文
DB更新
仕様導出、発動
拡張サービス要求を作成、修正、削除するために使用
2001.9.21
Web & Genome
説明機能

説明サービス

サーバ情報のアクセス手段を提供する
DB
 アクセスポイント
 検索言語
 要素集合
 ...

44
2001.9.21
Web & Genome
終了処理

完了サービス

45
Z-アソシエーションを終了する
2001.9.21
Web & Genome
属性集合

使用可能な、ドメイン固有の抽象化されたア
クセスポイント

BIB-1
STAS

46
2001.9.21
Web & Genome
転送プロトコル

TCP/IP (通常)


ISO OSI

47
TCP予約ポート番号210
現在、殆ど使用されていない
2001.9.21
Web & Genome
BER

基本符号化規則



Basic Encoding Rules
転送データの符号化方式
可読形式のコードではない




48
コンピュータのみ解釈可能
型
長さ
値
2001.9.21
Web & Genome
ASN.1

抽象構文記法1


Abstract Syntax Notation 1
データ型を定義する記述言語

実装方式とは独立した表現形式
Permissions ::= SEQUENCE OF SEQUENCE{
userId
[1] IMPLICIT InternationalString,
allowableFunctions
[2] IMPLICIT SEQUENCE OF INTEGER{
delete
(1),
modifyContents
(2),
modifyPermissions
(3),
present
(4),
invoke
49
2001.9.21
(5)}}
Web & Genome
APDU

Application Protocol Data Unit

要求と応答を含むデータパッケージ
InitializeRequest ::= SEQUENCE{
referenceId
protocolVersion
options
preferredMessageSize
exceptionalRecordSize
idAuthentication
implementationId
implementationName
implementationVersion
userInformationField
otherInfo
50
ReferenceId OPTIONAL,
ProtocolVersion,
Options,
[5]
IMPLICIT INTEGER,
[6]
IMPLICIT INTEGER,
[7]
ANY OPTIONAL, -- see note below
[110] IMPLICIT InternationalString OPTIONAL,
[111] IMPLICIT InternationalString OPTIONAL,
[112] IMPLICIT InternationalString OPTIONAL,
[11] EXTERNAL OPTIONAL,
OtherInformation OPTIONAL}
--Note:
-- For idAuthentication, the type ANY is retained
-- for compatibility with earlier versions.
-- For interoperability, the following is recommended:
-IdAuthentication [7] CHOICE{
-open
VisibleString,
-idPass SEQUENCE {
-groupId
[0]
IMPLICIT InternationalString OPTIONAL,
-userId
[1]
IMPLICIT InternationalString OPTIONAL,
-password [2]
IMPLICIT InternationalString OPTIONAL },
-anonymous
NULL,
-other
EXTERNAL
-- May use access control formats for 'other'. See Appendix 7 ACC.
2001.9.21
Web & Genome
検索式

検索式タイプ






Type-0: 二者間の専用タイプ
Type-1: RPN (標準)
Type-2: ISO 8777
Type-100: Z39.58
Type-101: 拡張RPN (v 2)
Type 102: Ranked List query


51
重み付け検索
Relevance Feedback(関連検索)
2001.9.21
Web & Genome
Type-1検索式

構成要素



52
AND,OR,NOT論理演算子と連携した一つ以上
のオペランド
オペランドは二項関係の再帰表現を構成する
オペランドは7つの要素から構成される
2001.9.21
Web & Genome
Type-1オペランド

0. Term


1.Use Attributes


アクセスポイント
2.Relation Attributes


53
検索語
各アクセスポイントにおけるTermとデータの関係
<、=、接辞処理等
2001.9.21
Web & Genome
Type-1オペランド

3.Position Attributes



4.Structure Attributes


54
Termのアクセスポイント中の位置
フィールドの先頭、サブフィールドの先頭等
Termの扱い方
フレーズ、単語、日付、正規化名称等
2001.9.21
Web & Genome
Type-1オペランド

5.Truncation Attributes



6.Completeness Attributes


55
短絡形等の適用方法
左側短絡、左右短絡、短絡なし、正規表現
Termが照合される対象
サブフィールドの一部、サブフィールド全体、フィー
ルド全体
2001.9.21
Web & Genome
検索式の例
AND
George Alec Effinger
56
Islam
1:1003
1:1035
2:3
2:3
3:1
3:3
4:1
4:101
5:100
5:100
6:1
6:2
2001.9.21
Web & Genome
検索結果集合



57
デフォルト結果集合
名前付き結果集合
永続的結果集合
2001.9.21
Web & Genome
DBスキーマ

抽象化DBのレイアウトを定義

要素(返戻時の抽象化された項目)


58
要素仕様
要素集合名
2001.9.21
Web & Genome
タグ

要素または部分構造に一意にラベル付ける
識別子
schemaIdentifier
datatype: OBJECT IDENTIFIER
59
2001.9.21
Web & Genome
タグ集合

特定のデータ構造のための識別子の集合
1.schemaIdentifier
datatype: OBJECT IDENTIFIER
2.elementsOrdered
datatype: BOOLEAN
3.elementOrdering
datatype: INTEGER
4.defaultTagType
datatype: INTEGER
60
2001.9.21
Web & Genome
構成仕様

61
返戻したいデータ構造の一部分(あるいは全
体)を指示する方法
2001.9.21
Web & Genome
実装と連携の現実


62
Z39.50は幾つかのレベルで相互連携を許容
する、情報検索の複雑な標準仕様である。
真の相互連携システムの実現には、多くの知
識と実証作業が必要となる。
2001.9.21
Web & Genome
Z39.50とILL(図書館間相互貸借)

Z39.50と ISO ILL(ISO 10160/10161)を連携
するための仕様


63
Z39.50/ILL Profile 1/2
検索、返戻、所蔵確認(Z39.50)~注文、貸出、
返却(ILL)までの一連の処理をネットワーク経由
で連携
2001.9.21
Web & Genome
ILLプロトコル



ISO 10160/10161-1
Peer-to-Peer
全サービスは非確認型


OSIプロトコル


Prompt-1応答
ディレクトリ情報

64
MIME-encoded SMTPまたはTCP/IP
セキュリティ


ASN.1、BERまたはEDIFACT
APDU転送


“要求”に対する“応答”を必要としない
外部オブジェクト
2001.9.21
Web & Genome
Z39.50でILL

Z39.50蔵書注文



ISO ILLと連携
Z39.50/ILL Profile 1



ISO ILLプロトコルAPDUを転送するためのZ39.50蔵書注文拡張
サービスを使用するProfile
ISO 10161で定義される全トランザクション
Z39.50/ILL Profile 2

65
拡張サービスによる要求・応答
Z39.50蔵書注文でILL-Request APDUでパラメータを指定する
Profile
2001.9.21
Web & Genome
使用手順





66
Z39.50で検索
所蔵スキーマを用いて、Z39.50により所蔵情報を
返戻
Z39.50拡張サービスからILL Request
Z39.50拡張サービスからILL Answer
Z39.50/ILL Profile 1
2001.9.21
Web & Genome
使用手順


Request後の使用手順
Status request:


Z39.50サーバのタスクDBからの応答:

67
STATUS-QUERY
STATUS-OR-ERROR-REPORT
2001.9.21
Web & Genome
1.1 Search
1.2 Retrieve
Holdings:
Directory
U. of Penn
Union
Catalogue
(RLIN)
Colorado State
Brown U.
2.1.1
2.3.2 ILL-ANSWER:
Harvard Law
(RLG
ILL Manager)
will- supply
2.3.1 ILL-REQUEST
Z39.50 query
2.1.2 Response:
Checked Out
2.2.1
Brown U.
(via OCLC
Central ILL
system)
2.2.3 ILL-
Z39.50 query
REQUEST
U. Penn
catalogue
2.2.2 Response:
Item Available
Colorado
State U.
(RSS)
68
2001.9.21
2.3.4 ILL-ANSWER
unfilled (n.o.s.)
貸出処理:
ILL Protocol
& Z39.50
Web & Genome
Local
ISO ILL
Application
Library Consortia
MnSCU/
PALS
LIDDAS
Bibliographic Utilities
CIC
Distributed
System
OCLC
Central ILL,
DRSS
RLG
RLIN
Communications
Network
NLM’s
ISO ILL
Gateway
National Libraries
NAVIS
(Canada)
Kinetica
(Australia)
Te Puna
(N.Z.)
Docline
69
2001.9.21
BLDSC
ISO ILL
Gateway
LIBRIS
(Sweden)
BLDSC
ART System
Web & Genome
国内利用に向けて必要な環境
(合意)
70
2001.9.21
Web & Genome
言語面

現状の検索式、診断レコードの国際化


8bitバイナリデータは扱える
文字集合の符号化方式と言語の交渉


日本語の場合


複数の分かち書きの可能性
多くの異表記



71
ISO2022、ISO10646-1
ローマ字、片仮名、漢字
複雑な典拠コントロール
アクセスポイント、レコード構文の対応
2001.9.21
Web & Genome
言語面

検索式に対するZIGの考え


72
欧米のZIGにはアジア圏を考慮する必然性が無い
国際的に普及の兆し
各言語から特性を反映
2001.9.21
Web & Genome
MARC


海外では“MARC=ISO2709準拠”
日本語表現可能なMARC



書誌目録の観点から


73
Japan/MARC
MARC21(UTF-8,ISO2022-JP)
NACSIS/CAT
MARCベンダー独自のMARC
2001.9.21
Web & Genome
新規レコード構文を登録する場合




レコード構文の識別子(OID)
属性集合の定義、拡張(必要に応じて)
要素集合の定義(B…)
書誌目録の場合



74
所蔵レコードの取り込み方法
ILLとの連携の可能性
合意形成作業が(労多くとも)最も重要
2001.9.21
Web & Genome
実運用システムの課題

ベンダー間で相互連携性を検証




日本語対応システム


ユーザフレンドリな日本語クライアント(ゲートウェイ)
Z39.50の開発動機を思い起こしたい

75
NIIの取り組みは、レコード数と将来の相互連携数の規模
から有望な実証事例
ネイティブなレコード構文による書誌目録の流通を促進
相互連携性テストスーツ・仕様を規定
ネットワーク経由の共同目録作成作業を支援する
2001.9.21
Web & Genome
Z39.50の将来

Z39.50-200x(V4)Draft


ZNG - Z39.50 Next Generation






76
現在作業中
XML,URI,SOAP,HTTP
Stateless
ASN.1,BER,RPN Queryを使用しない
Explain機能を普及させたい
抽象構文、スキーマは使用し続ける
Z39.50MAは公式には参加していない(LCボランティア)
2001.9.21
Web & Genome
Z39.50の将来




77
Webと親和性の高い、実装の容易なプロトコ
ルが欲しい
Statelessでいい、必要ならセッション管理を
付けよう
各目録規則を適切に扱う前提は崩したくない
目録規則と流通方式(検索/返戻)の各技術を
相互に独立して発展させたい
2001.9.21
Web & Genome
Z39.50の将来



78
現在のZ39.50規格は、長年の図書館界にお
ける情報検索の研究成果
検索式、レコード構文の高度な、特筆すべき
拡張性
ネットワーク図書館を構成する、現時点の有
望な、洗練されたフレームワークであることに
変わりはない!
2001.9.21
Web & Genome
参照文献






79
August 1999 Z39.50 Tutorial in Stockholm
January 2000 ZIG Meeting in San Antonio
ANSI/NISO Z39.50-1995(JIS X 0806:1999)
ISO 10160/10161-1 Interlibrary Loan Service
Definition and Protocol Specification
Z39.50/ILL Profile ½
The ZNG Initiative “Z39.50 Next Generation”
2001.9.21
Web & Genome
質疑応答
80
2001.9.21
Web & Genome