MARC21による国内交換フォーマットの提案

Download Report

Transcript MARC21による国内交換フォーマットの提案

MARC21による国内交換フォーマットの提案
丸善株式会社 情報システム統括室
佐藤 康之
2002年11月
第5回ライブラリーシステム研究会
国内交換のために求められることは?
 日本語書誌独特の並列記述に対応できること
 漢字かな混じり(標準記述)
 カタカナ読み(配列)
 ローマ字読み(配列及び万国共通のアクセスポイント)
 分かち書き(索引語抽出)
 既存の目録レコードが流用できること
 国内の各種MARCからの機械的な変換
 必要最低限の記述の追加
 国際標準との互換性が維持されること
 UTF-8対応
 逐次変換(On the fly)を可能とする容易な変換ロジック
 アクセスポイント(検索対象)の共通化
 拡張への容易な対応 Ex) XML、デジタルコンテンツ、メタデータ
 著者、件名典拠などの国際標準化への寄与
第5回ライブラリーシステム研究会
MARC21 Multiscript モデルの検討
 MARC21 Concise Bibliographic: Multiscript Records
 http://lcweb.loc.gov/marc/bibliographic/ecbdmulti.html
 モデル A
 ラテンへの字訳・音訳による記述と母国語による記述の併記
 Field 880 Alternate Graphic Representation と Control Subfield $6 によ
るリンク
 例1、例2:ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述
 例3:非ラテン系言語による通常(Regular)フィールド記述
 モデル B
 シンプルな多言語記述
 880、$6 を使用しない(リンクを持たない)
 例1:英語の場合
 例2:ロシア語の場合
第5回ライブラリーシステム研究会
Control Subfield $6 - LINKAGE
 $6<linking tag>-<occurrence number>/<script identification code>/<field orientation
code>
 Linking tag
 リンクする通常(Regular)フィールドのタグ
 Occurrence number
 1レコード中の各リンク関係を識別する2桁の番号
 00 は通常(Regular)フィールドなし
 Script identification code
 記述の識別コード






(3 : Arabic
(B : Latin
$1 : Chinese, Japanese, Korean
(N : Cyrillic
(2 : Hebrew
(S : Greek
 Field orientation code
 記述の向き
 r : 右から左
第5回ライブラリーシステム研究会
モデル A : 例1 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3277.htm)
 ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述
第5回ライブラリーシステム研究会
モデル A : 例2 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3277.htm)
 ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述
 右から左へ記述する言語の場合 – 880 の $6 に注目
第5回ライブラリーシステム研究会
モデル A : 例3 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3277.htm)
 非ラテン系言語による通常(Regular)フィールド記述
第5回ライブラリーシステム研究会
モデル B : 例1、2 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3278.htm)
第5回ライブラリーシステム研究会
日本語の記述を想定すると?
 モデル B
 シンプルな多言語記述
 リンクを持たないため、カタカナ読み・ローマ字読みが記述しにくい
 インディケータ又はサブフィールドの拡張が必要?
 モデル A : 例1、2
 ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述
 北米における CJK(中国、韓国、日本)レコードの標準
 カタカナ読みは記述しにくい
 ローマ字読み、漢字かな混じりは記述できる
 $6 の Script identification code の拡張が必要?
 通常(Regular)フィールドへのラテン以外の記述が制限される
 既存のレコードから変換する場合、ローマ字形の自動生成又は記述の追加
が必要
第5回ライブラリーシステム研究会
国内交換のための提案




MARC21 Multiscript モデル A : 例3
日本語による通常(Regular)フィールド記述
Field 880 と Control Subfield $6 による カタカナ読み・ローマ字読みの対応
$6 Script identification code を拡張できれば、分かち書きも対応可能
第5回ライブラリーシステム研究会
実装例
第5回ライブラリーシステム研究会