Power Pointファイル
Download
Report
Transcript Power Pointファイル
JEPAX 説明会
下川 和男 ・ 渋谷 誠
EAST Co.,Ltd.
1
JEPAXの目的
出版社が社内に保有する「テキスト系」
デジタルデータの標準交換フォーマット
• 対象は、文庫、新書、一般書など
• 辞書、雑誌、新聞などは対象外
各種の配布フォーマットに変換可能
Free & Open
2
JEPAXのコンセプト
シンプルなタグ
• XMLを使用→将来性、拡張性、豊富なツール
• 文書の論理構造を規定
「交換」≠「配布」フォーマット
外字の扱いを規定
• 外字の指定方法を規定、欧文外字も
国際化への対応
• Unicodeも使用可能
3
配布フォーマットへの変換
標準で以下の変換が可能(XSLフィルター)
HTML → ブラウザーで読める
Open eBook(予定)
T-Time → 出版には、Publishers Kitが必要
Book Jacket(凸版殿)
文庫DTD(大日本スクリーン殿)
• 電子書籍コンソーシアム・テキスト(交渉中)
• Net EB(電子ブックコミッティー殿、交渉中)
4
Free & Open
自由にJEPAX仕様を利用できる
誰に何の料金も支払う必要がない
Free & Openの対象は
• JEPAX仕様、JEPAXという名称
• XSLフィルターのサンプル
• HTML、T-Time、Open eBookなど
5
仕様説明
6
交換フォーマットの必要性
最終フォーマットによらず必要な作業
• ルビ、外字を探す
• 段落を区切って見出しを取り出す
• 書誌情報を作成
これらが完了後の状態で保存、交換
安心して使える共通フォーマット
• 表計算のCSV、ワープロのRTFのようなもの
7
HTMLではだめなのか?
増えすぎてしまったタグ
日本語用仕様の欠如
論理構造定義が弱い
書誌情報も必要
8
設計方針
XML準拠
簡潔さ
論理構造重視―スタイル指定の排除
変換の容易性
9
文書形式
検証済みXML文書
• DTDは仕様とともに公開
<!DOCTYPE jepax PUBLIC “-//JEPA//DTD JEPAX 1.0//JA”
“http://x.jepa.or.jp/jepax/jepax10.dtd” >
ファイルのEncoding
• Unicode(UTF-16)を推奨
• 他のEncodingも許容する
• 使用文字が外字の指定方法
• 明確なガイドラインを提示
10
全体構造
トップレベルの5つの要素
jepax
bookinfo
front
back
body
11
div要素
div
+
+
div
head
title
subtitle author
p
ol
pre
ul
note
graphic
table
dl
ブロック要素の繰り返し
12
論理構造の表現
div要素ひとつだけを使う
入れ子にして階層を表現
属性値 type = で意味を付加
•
•
•
•
•
“part”, “chapter”, “section”
“foreword”, “backword”
“appendix”, “index”, “glossary”, “toc”
“quote”, “cover”
その他任意の文字列
13
階層定義の例
<div type=”chapter”>
<head>
<title>第一章 電子出版の歴史</title>
</head>
<div type=”section”>
<head>
<title>1.黎明期</title>
<subtitle>CD-ROM辞書の時代</subtitle>
</head>
・・・
(本文)
・・・
</div>
</div>
14
ブロック要素
パラグラフ
• p
整形テキスト
• table,caption,tr,th,td
• pre
リスト
• ol,ul,li
• dl,dt,dd
表
グラフィック
• graphic, img
注
• note
15
インライン要素(1)
em
• 強調
• 属性値 rend = <文字列>で強調方法を指定
• “italic”, “bold”, “gothic”, “underline”, “sidedot”
<em rend=“sidedot”>何の料金も</em>支払う必要がない
span
• いろいろな目的で使える汎用マークアップ
• 属性値 class = <文字列>で意味を指定
<span class=”URL” >http://www.jepa.or.jp/</span>
16
インライン要素(2)
sup,sub
• 上付、下付
ref
• 参照(内部リンク)
• 属性値 idref = <IDREF>で参照先を指定
• 属性値 type = <文字列>で参照先の種別を指定
• “figure”, “photo”, “artwork”, “table”, “note”
<ref idref=”fig13” type=”figure”>図13</noteref>参照
17
インライン要素(3)
ruby,rb.rt
• ルビ
• W3C案に準拠
<ruby><rb>株式会社</rb><rt>かぶしきがいしゃ</rt></ruby>
mlg
• 割注
18
インライン要素(4)
yoko
• 縦中横
<yoko>’99</yoko>年
tate
• 和文扱いの欧文
<tate>PTA</tate>
swdir, ht, vt
• 縦横による文字列切り替え
<swdir><ht>上の</ht><vt>右の</vt></swdir>表において
19
外字
Unicodeにもない文字
正確な字形を指定したい
udc要素を使って指定
• 属性値 set=<文字列> で文字集合
• 属性値 number=<文字列> で番号
<udc set="mojikyo" number="95284"/>
20
書誌情報
Dublin Core Initiative の15要素
分離して利用されることを想定
• namespaceを使用(prefix “bi”)
• JIS1,2水準の範囲のコードに限定
•
•
•
•
•
•
•
bi:title
bi:creator
bi:subject
bi:description
bi:publisher
bi:contributor
bi:date
•
•
•
•
•
•
•
•
bi:type
bi:format
bi:identifier
bi: source
bi:language
bi: relation
bi: coverage
bi:rights
21
外字の扱い
22
文字の種類(1)
ASCII
ASCII以外の欧文文字
• 通常は表示できない
半角カタカナ
• 表示できない環境もある
JIS1,2水準
23
文字の種類(2)
Windows拡張
• 13区記号、IBM/NEC拡張漢字
• Windowsでだけ表示可能
その他のUnicode範囲の文字
• JIS補助漢字も含まれる
• Unicodeフォントがあれば
Windowsで表示可能
24
文字の種類(3)
その他の文字
• Unicodeにない文字
• あっても希望する字形と異なる場合
• 通常の文字としては表示は不可能
25
文字指定の方法(1)
通常の文字コード
• 環境によっては表示できないこともある
ISOの文字名称
• 欧文のみ
• á; ü
26
文字指定の方法(2)
UCS文字番号
• XMLの仕様で規定されている方法
• ㈱
<UDC>タグ
• JEPAXで規定した方法
• <udc set="mojikyo" number="47268" />
27
JEPAXの指針
3つのレベルのガイドライン
• 完全Unicode環境用
• Windows環境用
• 汎用環境用
相互変換は可能
28
表示環境と文字指定
表示環境
Encoding
Unicode
Windows
汎用
Unicode
ASCII
非 ASCII 欧文
半角カタカナ
JIS1,2 水準
Windows 拡張
上記以外の Unicode
上記以外
文字コー ド
Unicode,
Shift-JIS
文字コー ド
Unicode,JIS,
Shift-JIS,EUC
文字コー ド
文字コー ド
ISO 文字名
ISO 文字名
文字コー ド
文字コー ド
UCS 番号
文字コー ド
文字コー ド
文字コー ド
文字コー ド
文字コー ド
UCS 番号
UCS 番号
UCS 番号
UCS 番号
<udc>タグ
<udc>タグ
<udc>タグ
29
ツール紹介とデモ
30
XML Notepad
XMLエディタ
Microsoftがβ版公開中
• http://msdn.microsoft.com/xml/notepad/intro.asp
日本語が入力できない
• 表示だけならできる
DTDを指定して文書構造の検証も可能
31
iHTML
XSLTプロセッサ
• XSLファイルで変換方法を指定して、XMLファ
イル同士を変換
インフォテリアがβ版公開中
• http://www.infoteria.com/jp/download/index2.html
32
Internet Explorer 5.0
XML対応ブラウザ
Microsoftが無償提供中
• http://www.microsoft.com/windows/ie_intl/ja/default.htm
ただの XML ファイル
• 構造解析してツリー表示
XSLファイルを指定したXMLファイル
• XSLに従ってHTMLに変換して表示
33
今昔文字鏡
9万字の文字を収録、分類
エーアイ・ネットの製品
フォントは公開
• TrueTypeとGIFのビットマップ
文字鏡研究会
• http://www.mojikyo.gr.jp/index_j.htm
34
まとめ
35
お願いしたい事
1.0版策定へのご意見
出版社、印刷会社殿へ
• JEPAXコンテンツの試作
ビュアー会社殿へ
• フィルター開発への協力
36
今後の議論
メーリングリスト(ML)を使用
• 対象:JEPA+EB、EBJ、EPWING参加会社
• http://x.jepa.or.jp/jepax/ml.htm
個別メールも歓迎
• [email protected]まで
JEPA委員会で、9月中に仕様を決定
37