XMLについて

Download Report

Transcript XMLについて

文書情報標準化WG
検討テーマ
実施(検討)テーマ
分
野
項
目
電子文書の交換
官ー民、民-民文書交換
の現状調査
電子文書の管理
文書電子化手法・蓄積方
法の調査、研究
概
成
要
・官ー民、民-民文書交換の
現状調査
・実態調査結果
・民-民文書標準化の可能 ・標準化可能文書の選定(民-民文書)
性の検討
・SGML/XMLに関する調査
・文書の電子化手法の調査
・国内外における文書の電子化動向調査
電子文書の管理
〃
・文書蓄積方法の研究
電子文書の管理
〃
・グループウエアによる文書
管理の研究
電子データの利用
電子文書の利用技術の研
究
果
・文書交換・蓄積方法の調査
・文書管理システム・プロトタイプの開発
・組織間にまたがる簡便な文書データベース構築ノウ
ハウ蓄積
・文書の共有化による業務の改革ノウハウの蓄積
・施工計画書の作成指針
・計画書のプロトタイプの作成 ・施工計画書のSGML/XMLのDTD
・入力ツール(開発が生じる)
電子データの利用
〃
・CORINSデータの検討
・CORINSデータのSGML/XMLのDTDの作成
・変換コンバータのシステム仕様
電子データの標準化
〃
・文書標準化のガイドライン
・ガイドラインの検討
発表内容
 SGML/XMLについて
 XMLのデモ
 グループウエアについて
SGML/XMLについて
1999.5.19
文書情報標準化WG
情報の交換とは

言葉で伝える
• 相手に話して伝える
• 例えば、電話が今までのビジネスで伝達手段
として多く使われてきた。

文字で伝える
• 紙に文字を書き込んで伝える
• 例えば、ビジネス上の文書を作成して、相手
に発送して、読んでもらうことで情報伝達を
行ってきた。
文字で伝えることをもう少し考え
てみましょう。

伝える側も受け取る側も文字が理解でき
なければ情報伝達はできません。

お互いの立場がよく理解されていれば、よ
り正確な情報伝達が可能です。

日本においては、日本語が分かっていれ
ば問題ありません。
では、これが理解できますか
日時 1999.6.1
場所 ○○会館
つきましては、下記の要領に
て歓迎会を開催したいと思い
ますので宜しくお願いします。
いつもご苦労様です。
○○さんが1999.5.19付
けで当部署に配属になりまし
た。
○○さんの歓迎会について
歓迎会の案内状のようです
が、よく分かりません。
文書には順序が重要です
○○さんの歓迎会について
いつもご苦労様です。
○○さんが1999.5.19付け
で当部署に配属になりました。
つきましては、下記の要領に
て歓迎会を開催したいと思い
ますので宜しくお願いします。
日時 1999.6.1
場所 ○○会館
文書には構造性が必要です。
タイトル
前文
本文
次に、これが理解できますか
受注者,1999.5.19,虎ノ門
地下鉄工事,ベースコンク
リート鉄筋検査のお願い
,1999.6.1にてB1-1ブロッ
クの鉄筋検査をお願いし
ます。,B1-1構造配筋図,
佐々木一郎,佐藤二郎
内容を理解
してどのよう
な情報か判
断しようとし
ますね
相手からこのような情報をもらった時はどうしますか
帳票は一目見て内容が理解で
きるように作成されています
受注者,1999.5.19,虎ノ門
地下鉄工事,ベースコンク
リート鉄筋検査のお願い
,1999.6.1にてB1-1ブロッ
クの鉄筋検査をお願いしま
す。,B1-1構造配筋図,佐々
木一郎,佐藤二郎
書いている内容に対応した
項目が明記されていれば分
かりやすいですね。
人と機械はどう違うのでしょうか
人
機械
受注者,1999.5.19,虎
ノ門地下鉄工事,ベー
スコンクリート鉄筋検
査のお願い,1999.6.1
にてB1-1ブロックの鉄
筋検査をお願いします
。,B1-1構造配筋図,佐
々木一郎,佐藤二郎
機械は内容を理解できません。そのため、
内容を意味づけする必要があります。
機械に分かるよう記号を付けました。
これは日付です。
受注者,1999.5.19,虎ノ門
地下鉄工事,ベースコンク
リート鉄筋検査のお願い
,1999.6.1にてB1-1ブロッ
クの鉄筋検査をお願いしま
す。,B1-1構造配筋図,佐々
木一郎,佐藤二郎
記号
<DATE>
(マークアップ)
<YEAR>1999</YEAR>
<MONTH> 5 </MONTH>
<DAY> 19 </DAY>
</DATE>
これは工事名です
<CONSTRUCTION>虎ノ門地
下鉄工事</CONSTRUCTION>
機械に分かるように記号が必要です。
マークアップ言語と呼んでいます。
SGML/XMLの必要性
CALSでは、
 不特定多数の人に情報を正確に伝える必
要があります。
• 文書の内容を人に伝えるためには、構造性が
必要です。 DTD 文書型定義

機械を利用して情報を整理・蓄積する必要
があります。
• 文書の内容を機械に伝えるためには、記号が
必要です。
<…>タグ付け
XMLとは


Extensible Markup Language(拡張可能
なマークアップ言語)つまり、マークアップ言語の
一種類です。一般のSGML文書をインターネッ
ト上で利用するために、W3CとSGML関係者に
よって制定された。
1996年後半からワーキングドラフトが提出さ
れ、1998年2月に決定。
SGML/XML/HTML
の位置づけ
インターネットの世界 簡
We b で の デ ー タ 配 信 単
HTML
インターネットは、データ
構造性なし
配信を容易にした。
この技術とSGMLが結
びついたものが、XMLで
あると言える。
XML
操
作
性
難
解
構造性あり
SGML
SGML/XML/HTML
の位置づけ
非定型文書
定型文書
定型データ
RDB
ワープロ
/ DTP
SGML /
XML/
HTML
CSV/
SILK
マークアップ記述言語
SGMLとXMLの比較



SGMLは伝統的出版方法を意識していた。
XMLはインターネットを意識している。
XMLは、SGMLを簡単にしている。
• 文書処理が簡単である。
• ネットワークで文書交換がしやすくしている。
SGML宣言
XML宣言
DTD(文書型定義)
DTD(文書型定義)
文書インスタンス
文書インスタンス
利用状況に
合わせて
省略可能
ページ記述言語
HTMLとXMLの比較
HTMLによる記述
<tr><td>発注組織</td>
<td>10108000</td>
<td>建設省九州地方建設局</td></tr>
<tr> <td>担当事務所名</td>
<td>雲仙復興工事事務所</td></tr>
XMLによる記述
<item><ownern>発注組織</ownern>
<no>10108000</no>
<owner>建設省九州地方建設局</owner></item>
<item> <officen>担当事務所名</officen>
<office>雲仙復興工事事務所</office></item>
XLS(レイアウト表記)
スタイルを表現する固定タグを使用。
データの意味は分からない。
1つ1つのタグが意味を持つ
タグ名の付け方は自由
レイアウト表記はXLSによる。
ページ記述言語
HTMLとXMLの比較




HTMLは、文書のレイアウトを指定します。
XMLは、文書の意味を指定します。
HTMLは、ブラウザに表示、閲覧するた
めに使われます。
XMLは、単に表示、閲覧だけではなく、
文書の意味を表わすタグを利用した様々
な使い方ができます。
データ記述言語
CSVとXMLの比較
受注情報
工事名
発注者
請負金額
受注者
○○工事
建設省
1,000,000,000
○○建設
××工事
東京都
30,000,000
△△建設
△△工事
運輸省
400,000,000
CSVによる記述
受注情報,,
工事名,発注者,請負金額,受注者
○○工事,建設省,“1,000,000,000”,○○建設
××工事,東京都 ,“30,000,000”,△△建設
△△工事,運輸省,“400,000,000”,××ー建設
表現は簡潔だがデータの意味は不明
××ー建設
XMLによる記述
<?XML VERSION=“1.0” ?>
<title>受注情報</ title >
<pname>工事名</ pname E>
<owner>発注者</ owner >
<yen>請負金額</yen>
<contractor>受注者</contractor>
<item>
<pname>○○工事</pname>
<owner>建設省</owner>
<yen> 1,000,000,000</yen>
<contractor>○○建設
</contractor>………
表現は長いが1つ1つのタグが意味を持つ
XMLの特徴

2面性をもつ
• 構造化されたデータ(データ記述言語)
• ブラウザで表現可能(ページ記述言語)

データ交換言語としての利用
• CSVに比べてより多くの情報を持つ
• EDIデータとして使用可能

Web用言語としての利用
• スタイルシートにより様々なレイアウトが可能
• 検索が容易
XMLの応用

Webでの配信としての利用
• IE5.0で可能。拡大・増加傾向

データベースの交換データ形式
• データが意味を持つため、中間ファイル
形式としての利用が容易。
あなたのデータは、

データ形式の表現言語
• データベースとして直接利用。
旅立ちできますか
XMLデータは親鳥の
もとから巣立つことが
できます。
これまでのWWW
ブラウザ
HTML
データベース
&
アプリケーション
WWW
サーバ
ブラウザ
ブラウザ
これからのWWW
JavaScript
CSS
XSL
ブラウザ
XML
データベース WWW
&
サーバ
アプリケーション
アプリケーション
ブラウザ
アプリケーション
ブラウザ
アプリケーション
XML対応ブラウザ IE5.0



XMLプロセッサを実装
CSS1.0をサポート
XSLをサポート
(IE4.01から一部実装)
ブラウザでも
•見栄え良く表示すること、
•検索して表示こと
が可能となります。
XMLプロセッサとは

XMLデータを直接扱うプログラムの総称

まず、XMLデータの論理構造の確認と把握を行う。
次に、アプリケーションプログラムは、XMLプロ
セッサによって指定された構文(言語)によって
データを読み、データを表示させることができる。

言い換えれば、特定のアプリケーションに依存しな
い “共通のXML処理を行うプログラム” である。
XMLプロセッサとは
料理との比較
XMLデータ
論理構造の確認と把握
データの抽出/論理構造
の変換
データの表示/検索/DBと
の連携
素
材
レシピに沿った素材が揃っ
ているかチェック
下ごしらえする
本格的な料理は、料理の鉄
人に任せる
(専門アプリケーション)
CSS1.0とは


Cascading Style Sheetは、HTML用
のスタイル言語として開発され、1996.12に
W3Cの勧告になった。
簡単な指定機構により、書き手/読み手双方
の表示に対する要求を実現することが可能。
要素の内容
色、フォント指定
マージ
XSLとは

XSL(eXtensible Stylesheet
Language)は、XML文書の体裁を指定する
機能と文書構造の変換を指定する機能を持つ

CSS(Cascading Style Sheets)も考慮

記述にはXML構文を使用する
デジタル写真管理XMLデータ
のWebブラウザ上での表示

建設省発注工事におけるデジタル写真管理
情報基準の写真属性情報ファイルのDTDに
準拠して作成された電子データ(XMLデータ
と画像データ)を利用。

前述のXMLプロセッサを利用して、Webブラ
ウザ上で表示や検索できるようにした。
デジタル写真管理XMLデータ
デジタル写真管理のデモ

IE4&5のXMLプロセッサを利用
XMLプロセッサの働き

例:IE5のMSXML.DLL
ブラウザと連携した働き
XMLデータ
論理構造の
確認と把握
当PGの処理範囲
データ抽出
処理
表示
適
XMLデータ
データ構造変更
MSXML.DLL
表示
補足:XML実装の関する標準化

例:IE5のMSXML.DLL
ブラウザと連携部分
• データの記述方法の標準化
> XMLデータの仕様
• オブジェクト(XMLデータ)の扱い方の標準化
> JavaScript等のよるデータ抽出方法
• ブラウザへの表示方法の標準化
> XSLによるHTMLファイルへの構造変換
> CSSの利用
補足:XML実装の関する標準化
•
厨房の作業に例えると、材料の確認と下ごしらえ
は、XMLプロセッサが行い、料理そのものは、ブ
ラウザが担当する。
•
この両者の間の取り決めのが、XML実装にお
ける標準化であると言える。
XML- まとめ1
SGMLの問題点
実装に関する標準がな
かった


XMLとは、SGMLの実装部分をインター
ネットの技術をもとづいて規格化(勧告
W3C Recommendation)したもの
SGML(父親)とインターネット(母親)と両
親して生まれた正当な後継者
• その表現でいくと、HTMLは母方(インターネット)の
従兄弟であろう。

XML実装は、今後インターネットの技術をベー
スにして進む。
XMLの強み
インターネットをベースにし
た実装
XML- まとめ2


XMLの導入によって、特定の処理システム
に依存しない “データベース構造を持った電
子データ” の流通が促進される。
今回の建設省のデジタル写真管理XML
データ導入は、この動きに沿ったものである。
あなたのデータは、旅立ちできますか
XMLデータは親鳥のもとから巣立つことができます。