総合目録データベースZ39.50ゲートウェイサーバの概要

Download Report

Transcript 総合目録データベースZ39.50ゲートウェイサーバの概要

総合目録データベース
Z39.50ゲートウェイサーバの概要
- CATP→MARC21フォーマット変換を中心に-
国立情報学研究所 開発・事業部
コンテンツ課 阿蘓品治夫
[email protected]
1
目次
経緯
システム構成
基本仕様
CATP→MARC21変換
課題
2
経緯
– プロトタイプ版
• 平成13年6月から公開中
• CATP 教育用サーバが検索対象
– 改訂版
• プロトタイプ版の仕様を改良
• CATP業務用サーバが検索対象
• プロトタイプに代わり、平成14年3月リリース予定
3
システム構成
4
基本仕様
• Z39.50サポート
–Ver.2 準拠、Init, Search, Present の3サービス
• 検索 Search
–検索質問/検索属性集合
• Query-type1 と Bib-1で行う。
- 各属性の詳細はWebで公開中
–対象
• 図書書誌・所蔵 及び 雑誌書誌・所蔵
- デフォルトで図書・雑誌両方を検索、個別指定可とする予定
- プロトタイプ版は教育用サーバ
5
基本仕様
• 返戻 Present
– 項目
• エレメントセットネーム B(簡略)、F(詳細)に対応
- BはCATPのEdit-Type 1 に相当
– レコード構文
• MARC21、NACSIS-CATP(当面SUTRSと同形式)、
SUTRS
– 提供文字セット (Portで振り分け)
• UTF-8 、ISO2022-JP
- プロトタイプ版で提供中のEUCは提供中止予定
6
CATP→MARC21変換仕様
• 方針
– タイトル等のローマ字表示を実現(ヨミから
ローマナイズ形を自動作成)
– ローマ字形と対になる日本語形はタグ880に
割当
– 変換仕様をプロト版より詳細化(PTBL等)
7
CATP→MARC21変換仕様
• ローマナイズ
– 修正ヘボン式(LC採用方式)
<例> 北海道 hokkaid (014D) 新聞 shinbun
- ISO2022-JPの場合は長音符号省略
– 「ヨミ」フィールドからローマナイズデータを作成
• 対象フィールド:
本タイトル(TRR)、内容著作注記(CWR)、
その他のタイトル(VTR)、親書誌タイトル(PTBTRR)、
著者標目形(AHDNGR)、統一書名標目形(UTHDNGR)、
件名(SHR)
8
CATP→MARC21変換仕様
• MARC21 フィールド880への割当
– 「ヨミ」がある場合=日本語形がある場合
• ローマナイズ形を、245等に割当てる
• TR、CWA、VTA等(日本語形)は880に割当てる
• 「ヨミ」そのものは、割当てず、捨てる
9
CATP→MARC21変換仕様
(880フィールド割当例)
CATP<BN00028060>
:
TR:東京文壇事始 : 明治の回想/ 巌谷大四著||トウ
キョウ ブンダン コトハジメ : メイジ ノ カイソウ
PUB:東京 : 角川書店 , 1984.12
PHYS:270p ; 19cm
NOTE:参考文献:p270
PTBL:角川選書||カドカワ センショ <BN00028071>
152//a
AL:巌谷, 大四(1915-)||イワヤ, ダイシ <DA00033826>
CLS:NDC8:910.26 CLS:NDLC:KG314
SH:NDLSH:日本文学 -- 歴史 -- 明治時代||ニホンブ
ンガク -- レキシ -- メイジジダイ//L
MARC21
:
245 10 $6880-01 $a Tōkyō bundan kotohajime :$b meiji
no kaisō
880 10 $6245-01/$1 $a 東京文壇事始:$b明治の回想/
$c 巌谷大四著
260 ## $a 東京 $b 角川書店 $c 1984.12.
300 ## $a 270p; $c 19cm.
440 #0 $6880-02 $a Kadokawa sensho $v 152
880 #0 $6440-02/$1 $a 角川選書 $v 152
500 ## $a 参考文献:p270
650 #4 $6880-03 $aNihonbungaku -- rekishi -- meijijidai
880 #4 $6650-03/$1 $a日本文学 -- 歴史 -- 明治時代
700 10 $6880-04 $a 巌谷, 大四(1915-)
880 10 $6700-04/$1 $a Iwaya Daishi
852 $a 名大(FA002407) $b 中央館 $i 910.26||I
B27765
10
CATP→MARC21変換仕様
• MARC21 フィールド880への割当方式
– 「ヨミ」が無い場合(=データ内容が欧文の場
合)
880への割当ては発生しない。
– 「その他のヨミ」(ピンイン等)データがある場合
• 「その他のヨミ」フィールドのデータをローマナイズ
形として使用する。
対象フィールド TRVR、CWVR、VTVR・・・・
11
CATP→MARC21変換仕様
– 主なフィールドの変換ルール
• 巻冊次等(VOL) → 020
VOL: ISBN: PRICE: XISBN: (リピータブル)
MARC21 020 ## $aISBN(VOL)$cPRICE$z XISBN (リピータブル)
CATP
• 内容著作注記(CW) → 505 (880割当有)
CATP
MARC21
CWT: CWA: CWR: CWVR (リピータブル)
505 6880-XX $gCWT(:△より前) .$tCWTR(:△より後)
/$rCWA .--$g .$ /$r.-- (1フィールドで表現)
12
CATP→MARC21変換仕様
– 主なフィールドの変換ルール
• 親書誌(PTBL) → 440 (880割当有)
PTBTR: PTBRR: PTBRVR: PTBNO
MARC21 440 #0 6880-XX $a PTBTRR $v PTBNO (リピータブル)
* 中位書誌(PTBNOに記録)が存在する場合440の繰返で対処
CATP
• 図書所蔵データ → 852
LIBABL、FANO、LOC、VOL、CLN、RGTN
MARC21 852 ## $a LIBABL(FANO) $b LOC $I VOL CLN RGTN
*複数の巻冊を所蔵する(VOL CLN RGTN の組が複数)場合、$I
の繰返しで対処
CATP
13
CATP→MARC21変換仕様
– 主なフィールドの変換ルール
• 雑誌所蔵データ → 852 と 866の対
CATP
MARC21
LIBABL、FANO、LOC、HLV、HLYR、CON
852 ## $a LIBABL(FANO) $b LOC $I RGTN
866 #0 $a HLV(HLYR)CONT
14
課題・検討事項
– ヨミの無いCATPフィールドへの対処
• 出版事項(PUB)
– UMARC21 タグの順序
• 245等一般記述項目の直後に880を返すか(出せるか)
• タグはあくまで、タグの番号順に出すのが正統か
– その他
• 更新 DatabeseUpdateの利用可能性を検討 等
15