Transcript Z39.50とその動向
Z39.50とその動向
インテック・ウェブ・アンド・ゲノム・インフォマティクス
株式会社
技術部 石田 茂
1
2001.9.21
Web & Genome
内容
2
Z39.50とは何か?
Z39.50はどのように使用するのか?
市場動向
Z39.50はどのように機能するのか?
Z39.50とILL(図書館間相互貸借)
国内利用に向けて必要な環境(合意)
Z39.50の将来
2001.9.21
Web & Genome
Z39.50とは何か?
ネットワークベースの情報検索プロトコル
OSI参照モデル7層 - ASN.1、BER
サーバ/クライアント型
ANSI/NISO Z39.50-1995 (ISO
23950:1998)
NISO - National Information Standards Organization
ISO - International Standards Organization
米国議会図書館にMaintenance Agency設置
3
Ray Denenberg がまとめ役
2001.9.21
Web & Genome
ZIG - Z39.50 Implementors Group
4
Z39.50システムの開発者グループ
改正、修正、問題認識ならびに提起等を議論
実装者合意を作成
5ヶ月に一度の会合(北米、EU、ワシントンDC)
コンセンサス主導の作業方針
2001.9.21
Web & Genome
開発経緯
1978-82
1982-83
NISOに再提出。Z39.50-1988として承認
1979-89
5
開発継続
1988
ANSI Z39に提出.Z39.50-1984.承認投票に失敗
1984-87
Linked Systems Project Protocol
1983-84
初期の開発/調査研究
Z39 SC D
2001.9.21
Web & Genome
開発経緯
1984-91
1990
6
ZIG(実装者グループ)設立
1989-90
ISO SR → ISO 10162/10163 Search & Retrieve (1993)
Z39.50 Maintenance Agency設立
1992
Z39.50-1992 (version 2)
version 3開発
Z39.50-1995
ISO 23950
1990-95
1995
1998
2001.9.21
Web & Genome
目的
クライアント・サーバシステム間で情報検索の相互連携性を
確保する
ベンダー間の相互連携
組織間の相互連携
公共図書館と大学図書館
様々なコミュニティにおける図書館
コミュニティ間の相互連携
7
様々な図書フォーマット
ユーザグループ間の相互連携
様々なDBとユーザIF
図書館、出版社、 DBサービス、美術・博物館等
2001.9.21
Web & Genome
どのように使用するか?
抽象化DB
標準化されたアクセスポイント
標準化された検索式
標準化された返戻形式
8
属性集合
スキーマ
選択可能なレコード構文
返戻時にレコードの選択が可能
レコード内容に左右されない検索処理
2001.9.21
Web & Genome
どのように使用するか?
抽象化されたDBは、実際のDBのフロントエ
ンドとして実装される。
Z39.50クライアント
アプリ
機能
9
Z39.50サーバ
Z39.50
クライアント
Z39.50
サーバ
2001.9.21
DB
Web & Genome
補足機能
10
走査
永続的検索結果集合
定期的検索実行
蔵書注文
DB更新
仕様導出、発動
2001.9.21
Web & Genome
相互連携にみる特徴
DB毎に異なる機能
DB毎に異なる情報形式
11
アクセスポイント等の属性集合、実装特徴
US MARC, UNIMARC, SUTRS, GRS-1
所蔵情報の内包、分離
2001.9.21
Web & Genome
Profile
標準仕様の使用方法に関する合意規定
12
どのアクセスポイントが有効?
どの属性が有効?
レコード構文には何が指定できる?
どの(補足)機能が一般に利用できる?
どのオプションが利用できる?
特定分野向けのデータは許容される?
2001.9.21
Web & Genome
Profile例
ATS-1
GILS
13
Author, Title, Subject
初期の図書向け簡易仕様 (廃止)
行政情報所在案内サービス
汎用的な情報所在案内サービスの参照モデル
2001.9.21
Web & Genome
Profile例
CIMI
14
美術館情報をコンピュータ上で交換するためのコ
ンソーシアムが作成
テキスト以外に画像情報も検索対象とする
CIP
Catalogue Interoperability Protocol
国際的な地球観測衛星委員会が作成
地理空間情報の検索にも利用される
2001.9.21
Web & Genome
Profile例
GEO
STAS
15
地理空間情報を対象
科学工学向け属性集合を規定
正確にはProfileではない
2001.9.21
Web & Genome
主要な図書館向けProfile
ONE
CENL
16
OPAC Network Europe
1996年作成
ノルウェー、ドイツ、英国で利用
アクセスポイントと要素集合に関する最小規定
Conference of European National Librarians
1997年作成、1998年後半に批准
ONE profileの拡張版
2001.9.21
Web & Genome
主要な図書館向けProfile
Finnish Z39.50 profile
Danish Z39.50 profile
17
国際的なONE profileに対して、分類方式に関する国内
仕様を追加規定
CENLとONEの拡張版
2001.9.21
Web & Genome
主要な図書館向けProfile
Union Catalogue Profile
18
Union catalogue向けに要求仕様を定義
オーストラリアで作成
1998年に受理
2001.9.21
Web & Genome
Z39.50の難点
複雑なプロトコル
難解な用語
元はISO/OSI規格に準拠
19
TCP/IP上で実装
難解な理論ベースのプロトコル
様々な抽象化レベル
2001.9.21
Web & Genome
Z39.50の難点
機能的に収斂した製品が未だ無い
今後、MozillaのRDF実装が該当?
適切な専門化が極少数
製品の長期的なサイクルを考慮
標準化の前に仕様上の十分な探索がされていない
広く普及させることで困難な問題点を解決!
20
2001.9.21
Web & Genome
Z39.50の適用方法
21
サーバ(Target)
ゲートウェイ
クライアント(Origin)
2001.9.21
Web & Genome
サーバ(Target)
抽象化DBを実装
特殊な開発作業
ツールキットのカスタマイズ
サーバモジュールの準備
DBコンフィグレーション
22
Z39.50サーバ
Z39.50
サーバ
DB
実際のDBを抽象化DBとしてどのように表現するか?
2001.9.21
Web & Genome
ゲートウェイ
IFに二つの顔を持つ
Z39.50サーバに対して、Z39.50クライアント
として通信する顔
一般的なクライアントと通信する顔
23
クライアントプロトコルにはHTML, Telnet,
Z39.50…
2001.9.21
Web & Genome
Webゲートウェイ
Z39.50サーバ
Webブラウザ
HTTP
サーバ
24
ビジネス Z39.50
ロジック クライアント
2001.9.21
Web & Genome
横断的ゲートウェイ
Z39.50サーバ
Z39.50
クライアント
Z39.50クライアント
Z39.50サーバ
Z39.50
サーバ
ビジネス Z39.50
ロジック クライアント
Z39.50
クライアント
25
2001.9.21
Z39.50サーバ
Web & Genome
高度なゲートウェイ
複数のZ39.50サーバと接続する
両方のIFに様々なプロトコルに対応する
26
並列検索
連続検索
検索結果のマージ
SQL, LDAP, HTML, DNS…
2001.9.21
Web & Genome
高度なゲートウェイ
Z39.50サーバ
Z39.50クライアント
Z39.50
サーバ
Z39.50
クライアント
Webブラウザ
SQLサーバ
ビジネス
SQL
ロジック クライアント
HTTP
サーバ
専用システム
27
専用
プロトコル
サーバ
2001.9.21
LDAP
クライアント
LDAPサーバ
Web & Genome
クライアント(Origin)
グラフィカルなユーザIFのプロトコル処理部
ユーザから複雑さは隠されている
拡張コンフィグレーションの必要性
同時に複数のサーバに接続する場合あり
Z39.50クライアント
アプリ
機能
28
Z39.50
クライアント
2001.9.21
Web & Genome
市場動向
統合システム
図書館システム
海外の主要なシステムは全てZ39.50機能をもつ
専用クライアントあるいはWebゲートウェイ
小規模システムにもZ39.50を採用するものあり
多くのシステムはVersion 2 を採用する
INNOPAC等の米国製システムに多い
29
2001.9.21
Web & Genome
市場動向
スタンドアロン製品
ツールキットレベル製品
システムインテグレーション・コンサルタント
30
Crossnet (UK)
Fretwell-Downing (UK)
Indexdata (Denmark)
Sunstone (Sweden)
Blueangel Technologies (US)
Finsiel (Italy)
2001.9.21
Web & Genome
市場動向(国内)
主な機能
Server
Web
G/W
NACSIS-ELS/ NII国立
情報学研究所
○
(NII内)
○
(NII内)
○
INNOPAC/ Innovative
Interface Inc. 日本IBM
○
○
○
○
○
メーカ/
サービスベンダー
LibCruiser Pro/ NTT東日本
Gateway-CAT/ 丸善
JOIS with STN/ JST科学技術
振興事業団
InfoLib-Global Finder/
日商岩井インフォコム
SiteSearch/
OCLC, 紀伊国屋
ERL/
Silver Platter, 紀伊国屋
Ovid/ Ovid Technologies Inc,
ユサコ
Telnet
G/W
○
(丸善内)
○
(JST内)
○
(JST内)
○
○
○
○
○
○
○
○
○
日本語
○
○
(丸善経由)
○
Proxy
○
○
採用機関/特徴
早稲田大学
東京工業大学、図書館
情報大学、神戸大学
OpenText
RLG Zephyer
Server
大学系図書館(多数)
CAS Server
○
○
OpenText
大学系図書館(多数)
○
CharsetandLanguageNego(3)
○
UTF8/ISO2022-JP対応
NACSIS-CAT,MARC21対応
新日鉄ソリューション大分
31
外部連携
大学系図書館(多数)
○
LibVision V3(LVZ)/
日本IBM、紀伊国屋、
検索エンジン
2001.9.21
Web & Genome
Z39.50はどのように機能するか?
機能とサービス
32
機能は一つ以上のサービスから構成される
2001.9.21
Web & Genome
初期化機能
初期化サービス
Z-アソシエーションの確立
クライアント
初期化要求
サーバ
Version、ID/パスワード、オプション、
メッセージサイズ、実装情報
初期化応答
結果、Version、オプション、
メッセージサイズ、実装情報
33
2001.9.21
Web & Genome
初期化機能
使用可能なサービスとオプションを交渉する
クライアントは“初期化要求”内のリストで様々なサー
ビスを要求する
サーバは自身の機能・能力と比較調整し、可能なサー
ビスならびにオプションを初期化応答でクライアントに
返す
34
2001.9.21
Web & Genome
検索機能
検索サービス
クライアント
検索要求
検索式タイプ、検索式、DB,
結果集合名
サーバ
検索応答
ヒット件数、返戻レコード件数、
ステータス情報、(レコード)
35
2001.9.21
Web & Genome
返戻機能
返戻サービス
クライアント
返戻要求
レコード件数、開始順位、
結果集合名
サーバ
返戻応答
レコード件数、ステータス、
(レコード)
36
2001.9.21
Web & Genome
返戻機能
セグメントサービス
レコードを“セグメント”することで、初期化時に設
定したメッセージサイズよりも大きいレコードを転
送することができる
二つのレベル
Level 1: 一つのセグメントに複数のレコードを格納
Level 2: 一つのレコードを細分化して各セグメントに
格納
37
2001.9.21
Web & Genome
検索結果集合削除機能
削除サービス
クライアント
サーバ
削除要求
結果集合リスト
削除応答
ステータス
38
2001.9.21
Web & Genome
アクセス制御機能
アクセス制御サービス
クライアント
サーバ
要求(一般)
アクセス制御要求
セキュリティ申請
アクセス制御応答
セキュリティ申請応答
応答(一般)
39
2001.9.21
Web & Genome
課金・リソース制御機能
リソース制御サービス
トリガリソース制御サービス
リソース報告サービス
40
リソースの使用を制御、報告する複雑な機能
主に課金情報を作成するために使用される
2001.9.21
Web & Genome
ソート機能
ソートサービス
ソート要求
ソート対象の結果集合、
ソート済結果集合、
ソート方式
クライアント
サーバ
ソート応答
ステータス
41
2001.9.21
Web & Genome
走査機能
走査サービス
クライアント
サーバ
走査要求
DB、単語リスト、開始位置、
単語数、(ステップサイズ)
走査応答
ステータス、単語数、(単語)
42
2001.9.21
Web & Genome
拡張サービス機能
拡張サービス
タスクパッケージ
43
永続的検索結果集合
永続的検索式
定期的検索実行
蔵書注文
DB更新
仕様導出、発動
拡張サービス要求を作成、修正、削除するために使用
2001.9.21
Web & Genome
説明機能
説明サービス
サーバ情報のアクセス手段を提供する
DB
アクセスポイント
検索言語
要素集合
...
44
2001.9.21
Web & Genome
終了処理
完了サービス
45
Z-アソシエーションを終了する
2001.9.21
Web & Genome
属性集合
使用可能な、ドメイン固有の抽象化されたア
クセスポイント
BIB-1
STAS
46
2001.9.21
Web & Genome
転送プロトコル
TCP/IP (通常)
ISO OSI
47
TCP予約ポート番号210
現在、殆ど使用されていない
2001.9.21
Web & Genome
BER
基本符号化規則
Basic Encoding Rules
転送データの符号化方式
可読形式のコードではない
48
コンピュータのみ解釈可能
型
長さ
値
2001.9.21
Web & Genome
ASN.1
抽象構文記法1
Abstract Syntax Notation 1
データ型を定義する記述言語
実装方式とは独立した表現形式
Permissions ::= SEQUENCE OF SEQUENCE{
userId
[1] IMPLICIT InternationalString,
allowableFunctions
[2] IMPLICIT SEQUENCE OF INTEGER{
delete
(1),
modifyContents
(2),
modifyPermissions
(3),
present
(4),
invoke
49
2001.9.21
(5)}}
Web & Genome
APDU
Application Protocol Data Unit
要求と応答を含むデータパッケージ
InitializeRequest ::= SEQUENCE{
referenceId
protocolVersion
options
preferredMessageSize
exceptionalRecordSize
idAuthentication
implementationId
implementationName
implementationVersion
userInformationField
otherInfo
50
ReferenceId OPTIONAL,
ProtocolVersion,
Options,
[5]
IMPLICIT INTEGER,
[6]
IMPLICIT INTEGER,
[7]
ANY OPTIONAL, -- see note below
[110] IMPLICIT InternationalString OPTIONAL,
[111] IMPLICIT InternationalString OPTIONAL,
[112] IMPLICIT InternationalString OPTIONAL,
[11] EXTERNAL OPTIONAL,
OtherInformation OPTIONAL}
--Note:
-- For idAuthentication, the type ANY is retained
-- for compatibility with earlier versions.
-- For interoperability, the following is recommended:
-IdAuthentication [7] CHOICE{
-open
VisibleString,
-idPass SEQUENCE {
-groupId
[0]
IMPLICIT InternationalString OPTIONAL,
-userId
[1]
IMPLICIT InternationalString OPTIONAL,
-password [2]
IMPLICIT InternationalString OPTIONAL },
-anonymous
NULL,
-other
EXTERNAL
-- May use access control formats for 'other'. See Appendix 7 ACC.
2001.9.21
Web & Genome
検索式
検索式タイプ
Type-0: 二者間の専用タイプ
Type-1: RPN (標準)
Type-2: ISO 8777
Type-100: Z39.58
Type-101: 拡張RPN (v 2)
Type 102: Ranked List query
51
重み付け検索
Relevance Feedback(関連検索)
2001.9.21
Web & Genome
Type-1検索式
構成要素
52
AND,OR,NOT論理演算子と連携した一つ以上
のオペランド
オペランドは二項関係の再帰表現を構成する
オペランドは7つの要素から構成される
2001.9.21
Web & Genome
Type-1オペランド
0. Term
1.Use Attributes
アクセスポイント
2.Relation Attributes
53
検索語
各アクセスポイントにおけるTermとデータの関係
<、=、接辞処理等
2001.9.21
Web & Genome
Type-1オペランド
3.Position Attributes
4.Structure Attributes
54
Termのアクセスポイント中の位置
フィールドの先頭、サブフィールドの先頭等
Termの扱い方
フレーズ、単語、日付、正規化名称等
2001.9.21
Web & Genome
Type-1オペランド
5.Truncation Attributes
6.Completeness Attributes
55
短絡形等の適用方法
左側短絡、左右短絡、短絡なし、正規表現
Termが照合される対象
サブフィールドの一部、サブフィールド全体、フィー
ルド全体
2001.9.21
Web & Genome
検索式の例
AND
George Alec Effinger
56
Islam
1:1003
1:1035
2:3
2:3
3:1
3:3
4:1
4:101
5:100
5:100
6:1
6:2
2001.9.21
Web & Genome
検索結果集合
57
デフォルト結果集合
名前付き結果集合
永続的結果集合
2001.9.21
Web & Genome
DBスキーマ
抽象化DBのレイアウトを定義
要素(返戻時の抽象化された項目)
58
要素仕様
要素集合名
2001.9.21
Web & Genome
タグ
要素または部分構造に一意にラベル付ける
識別子
schemaIdentifier
datatype: OBJECT IDENTIFIER
59
2001.9.21
Web & Genome
タグ集合
特定のデータ構造のための識別子の集合
1.schemaIdentifier
datatype: OBJECT IDENTIFIER
2.elementsOrdered
datatype: BOOLEAN
3.elementOrdering
datatype: INTEGER
4.defaultTagType
datatype: INTEGER
60
2001.9.21
Web & Genome
構成仕様
61
返戻したいデータ構造の一部分(あるいは全
体)を指示する方法
2001.9.21
Web & Genome
実装と連携の現実
62
Z39.50は幾つかのレベルで相互連携を許容
する、情報検索の複雑な標準仕様である。
真の相互連携システムの実現には、多くの知
識と実証作業が必要となる。
2001.9.21
Web & Genome
Z39.50とILL(図書館間相互貸借)
Z39.50と ISO ILL(ISO 10160/10161)を連携
するための仕様
63
Z39.50/ILL Profile 1/2
検索、返戻、所蔵確認(Z39.50)~注文、貸出、
返却(ILL)までの一連の処理をネットワーク経由
で連携
2001.9.21
Web & Genome
ILLプロトコル
ISO 10160/10161-1
Peer-to-Peer
全サービスは非確認型
OSIプロトコル
Prompt-1応答
ディレクトリ情報
64
MIME-encoded SMTPまたはTCP/IP
セキュリティ
ASN.1、BERまたはEDIFACT
APDU転送
“要求”に対する“応答”を必要としない
外部オブジェクト
2001.9.21
Web & Genome
Z39.50でILL
Z39.50蔵書注文
ISO ILLと連携
Z39.50/ILL Profile 1
ISO ILLプロトコルAPDUを転送するためのZ39.50蔵書注文拡張
サービスを使用するProfile
ISO 10161で定義される全トランザクション
Z39.50/ILL Profile 2
65
拡張サービスによる要求・応答
Z39.50蔵書注文でILL-Request APDUでパラメータを指定する
Profile
2001.9.21
Web & Genome
使用手順
66
Z39.50で検索
所蔵スキーマを用いて、Z39.50により所蔵情報を
返戻
Z39.50拡張サービスからILL Request
Z39.50拡張サービスからILL Answer
Z39.50/ILL Profile 1
2001.9.21
Web & Genome
使用手順
Request後の使用手順
Status request:
Z39.50サーバのタスクDBからの応答:
67
STATUS-QUERY
STATUS-OR-ERROR-REPORT
2001.9.21
Web & Genome
1.1 Search
1.2 Retrieve
Holdings:
Directory
U. of Penn
Union
Catalogue
(RLIN)
Colorado State
Brown U.
2.1.1
2.3.2 ILL-ANSWER:
Harvard Law
(RLG
ILL Manager)
will- supply
2.3.1 ILL-REQUEST
Z39.50 query
2.1.2 Response:
Checked Out
2.2.1
Brown U.
(via OCLC
Central ILL
system)
2.2.3 ILL-
Z39.50 query
REQUEST
U. Penn
catalogue
2.2.2 Response:
Item Available
Colorado
State U.
(RSS)
68
2001.9.21
2.3.4 ILL-ANSWER
unfilled (n.o.s.)
貸出処理:
ILL Protocol
& Z39.50
Web & Genome
Local
ISO ILL
Application
Library Consortia
MnSCU/
PALS
LIDDAS
Bibliographic Utilities
CIC
Distributed
System
OCLC
Central ILL,
DRSS
RLG
RLIN
Communications
Network
NLM’s
ISO ILL
Gateway
National Libraries
NAVIS
(Canada)
Kinetica
(Australia)
Te Puna
(N.Z.)
Docline
69
2001.9.21
BLDSC
ISO ILL
Gateway
LIBRIS
(Sweden)
BLDSC
ART System
Web & Genome
国内利用に向けて必要な環境
(合意)
70
2001.9.21
Web & Genome
言語面
現状の検索式、診断レコードの国際化
8bitバイナリデータは扱える
文字集合の符号化方式と言語の交渉
日本語の場合
複数の分かち書きの可能性
多くの異表記
71
ISO2022、ISO10646-1
ローマ字、片仮名、漢字
複雑な典拠コントロール
アクセスポイント、レコード構文の対応
2001.9.21
Web & Genome
言語面
検索式に対するZIGの考え
72
欧米のZIGにはアジア圏を考慮する必然性が無い
国際的に普及の兆し
各言語から特性を反映
2001.9.21
Web & Genome
MARC
海外では“MARC=ISO2709準拠”
日本語表現可能なMARC
書誌目録の観点から
73
Japan/MARC
MARC21(UTF-8,ISO2022-JP)
NACSIS/CAT
MARCベンダー独自のMARC
2001.9.21
Web & Genome
新規レコード構文を登録する場合
レコード構文の識別子(OID)
属性集合の定義、拡張(必要に応じて)
要素集合の定義(B…)
書誌目録の場合
74
所蔵レコードの取り込み方法
ILLとの連携の可能性
合意形成作業が(労多くとも)最も重要
2001.9.21
Web & Genome
実運用システムの課題
ベンダー間で相互連携性を検証
日本語対応システム
ユーザフレンドリな日本語クライアント(ゲートウェイ)
Z39.50の開発動機を思い起こしたい
75
NIIの取り組みは、レコード数と将来の相互連携数の規模
から有望な実証事例
ネイティブなレコード構文による書誌目録の流通を促進
相互連携性テストスーツ・仕様を規定
ネットワーク経由の共同目録作成作業を支援する
2001.9.21
Web & Genome
Z39.50の将来
Z39.50-200x(V4)Draft
ZNG - Z39.50 Next Generation
76
現在作業中
XML,URI,SOAP,HTTP
Stateless
ASN.1,BER,RPN Queryを使用しない
Explain機能を普及させたい
抽象構文、スキーマは使用し続ける
Z39.50MAは公式には参加していない(LCボランティア)
2001.9.21
Web & Genome
Z39.50の将来
77
Webと親和性の高い、実装の容易なプロトコ
ルが欲しい
Statelessでいい、必要ならセッション管理を
付けよう
各目録規則を適切に扱う前提は崩したくない
目録規則と流通方式(検索/返戻)の各技術を
相互に独立して発展させたい
2001.9.21
Web & Genome
Z39.50の将来
78
現在のZ39.50規格は、長年の図書館界にお
ける情報検索の研究成果
検索式、レコード構文の高度な、特筆すべき
拡張性
ネットワーク図書館を構成する、現時点の有
望な、洗練されたフレームワークであることに
変わりはない!
2001.9.21
Web & Genome
参照文献
79
August 1999 Z39.50 Tutorial in Stockholm
January 2000 ZIG Meeting in San Antonio
ANSI/NISO Z39.50-1995(JIS X 0806:1999)
ISO 10160/10161-1 Interlibrary Loan Service
Definition and Protocol Specification
Z39.50/ILL Profile ½
The ZNG Initiative “Z39.50 Next Generation”
2001.9.21
Web & Genome
質疑応答
80
2001.9.21
Web & Genome