Transcript XMLについて
文書情報標準化WG 検討テーマ 実施(検討)テーマ 分 野 項 目 電子文書の交換 官ー民、民-民文書交換 の現状調査 電子文書の管理 文書電子化手法・蓄積方 法の調査、研究 概 成 要 ・官ー民、民-民文書交換の 現状調査 ・実態調査結果 ・民-民文書標準化の可能 ・標準化可能文書の選定(民-民文書) 性の検討 ・SGML/XMLに関する調査 ・文書の電子化手法の調査 ・国内外における文書の電子化動向調査 電子文書の管理 〃 ・文書蓄積方法の研究 電子文書の管理 〃 ・グループウエアによる文書 管理の研究 電子データの利用 電子文書の利用技術の研 究 果 ・文書交換・蓄積方法の調査 ・文書管理システム・プロトタイプの開発 ・組織間にまたがる簡便な文書データベース構築ノウ ハウ蓄積 ・文書の共有化による業務の改革ノウハウの蓄積 ・施工計画書の作成指針 ・計画書のプロトタイプの作成 ・施工計画書のSGML/XMLのDTD ・入力ツール(開発が生じる) 電子データの利用 〃 ・CORINSデータの検討 ・CORINSデータのSGML/XMLのDTDの作成 ・変換コンバータのシステム仕様 電子データの標準化 〃 ・文書標準化のガイドライン ・ガイドラインの検討 発表内容 SGML/XMLについて XMLのデモ グループウエアについて SGML/XMLについて 1999.5.19 文書情報標準化WG 情報の交換とは 言葉で伝える • 相手に話して伝える • 例えば、電話が今までのビジネスで伝達手段 として多く使われてきた。 文字で伝える • 紙に文字を書き込んで伝える • 例えば、ビジネス上の文書を作成して、相手 に発送して、読んでもらうことで情報伝達を 行ってきた。 文字で伝えることをもう少し考え てみましょう。 伝える側も受け取る側も文字が理解でき なければ情報伝達はできません。 お互いの立場がよく理解されていれば、よ り正確な情報伝達が可能です。 日本においては、日本語が分かっていれ ば問題ありません。 では、これが理解できますか 日時 1999.6.1 場所 ○○会館 つきましては、下記の要領に て歓迎会を開催したいと思い ますので宜しくお願いします。 いつもご苦労様です。 ○○さんが1999.5.19付 けで当部署に配属になりまし た。 ○○さんの歓迎会について 歓迎会の案内状のようです が、よく分かりません。 文書には順序が重要です ○○さんの歓迎会について いつもご苦労様です。 ○○さんが1999.5.19付け で当部署に配属になりました。 つきましては、下記の要領に て歓迎会を開催したいと思い ますので宜しくお願いします。 日時 1999.6.1 場所 ○○会館 文書には構造性が必要です。 タイトル 前文 本文 次に、これが理解できますか 受注者,1999.5.19,虎ノ門 地下鉄工事,ベースコンク リート鉄筋検査のお願い ,1999.6.1にてB1-1ブロッ クの鉄筋検査をお願いし ます。,B1-1構造配筋図, 佐々木一郎,佐藤二郎 内容を理解 してどのよう な情報か判 断しようとし ますね 相手からこのような情報をもらった時はどうしますか 帳票は一目見て内容が理解で きるように作成されています 受注者,1999.5.19,虎ノ門 地下鉄工事,ベースコンク リート鉄筋検査のお願い ,1999.6.1にてB1-1ブロッ クの鉄筋検査をお願いしま す。,B1-1構造配筋図,佐々 木一郎,佐藤二郎 書いている内容に対応した 項目が明記されていれば分 かりやすいですね。 人と機械はどう違うのでしょうか 人 機械 受注者,1999.5.19,虎 ノ門地下鉄工事,ベー スコンクリート鉄筋検 査のお願い,1999.6.1 にてB1-1ブロックの鉄 筋検査をお願いします 。,B1-1構造配筋図,佐 々木一郎,佐藤二郎 機械は内容を理解できません。そのため、 内容を意味づけする必要があります。 機械に分かるよう記号を付けました。 これは日付です。 受注者,1999.5.19,虎ノ門 地下鉄工事,ベースコンク リート鉄筋検査のお願い ,1999.6.1にてB1-1ブロッ クの鉄筋検査をお願いしま す。,B1-1構造配筋図,佐々 木一郎,佐藤二郎 記号 <DATE> (マークアップ) <YEAR>1999</YEAR> <MONTH> 5 </MONTH> <DAY> 19 </DAY> </DATE> これは工事名です <CONSTRUCTION>虎ノ門地 下鉄工事</CONSTRUCTION> 機械に分かるように記号が必要です。 マークアップ言語と呼んでいます。 SGML/XMLの必要性 CALSでは、 不特定多数の人に情報を正確に伝える必 要があります。 • 文書の内容を人に伝えるためには、構造性が 必要です。 DTD 文書型定義 機械を利用して情報を整理・蓄積する必要 があります。 • 文書の内容を機械に伝えるためには、記号が 必要です。 <…>タグ付け XMLとは Extensible Markup Language(拡張可能 なマークアップ言語)つまり、マークアップ言語の 一種類です。一般のSGML文書をインターネッ ト上で利用するために、W3CとSGML関係者に よって制定された。 1996年後半からワーキングドラフトが提出さ れ、1998年2月に決定。 SGML/XML/HTML の位置づけ インターネットの世界 簡 We b で の デ ー タ 配 信 単 HTML インターネットは、データ 構造性なし 配信を容易にした。 この技術とSGMLが結 びついたものが、XMLで あると言える。 XML 操 作 性 難 解 構造性あり SGML SGML/XML/HTML の位置づけ 非定型文書 定型文書 定型データ RDB ワープロ / DTP SGML / XML/ HTML CSV/ SILK マークアップ記述言語 SGMLとXMLの比較 SGMLは伝統的出版方法を意識していた。 XMLはインターネットを意識している。 XMLは、SGMLを簡単にしている。 • 文書処理が簡単である。 • ネットワークで文書交換がしやすくしている。 SGML宣言 XML宣言 DTD(文書型定義) DTD(文書型定義) 文書インスタンス 文書インスタンス 利用状況に 合わせて 省略可能 ページ記述言語 HTMLとXMLの比較 HTMLによる記述 <tr><td>発注組織</td> <td>10108000</td> <td>建設省九州地方建設局</td></tr> <tr> <td>担当事務所名</td> <td>雲仙復興工事事務所</td></tr> XMLによる記述 <item><ownern>発注組織</ownern> <no>10108000</no> <owner>建設省九州地方建設局</owner></item> <item> <officen>担当事務所名</officen> <office>雲仙復興工事事務所</office></item> XLS(レイアウト表記) スタイルを表現する固定タグを使用。 データの意味は分からない。 1つ1つのタグが意味を持つ タグ名の付け方は自由 レイアウト表記はXLSによる。 ページ記述言語 HTMLとXMLの比較 HTMLは、文書のレイアウトを指定します。 XMLは、文書の意味を指定します。 HTMLは、ブラウザに表示、閲覧するた めに使われます。 XMLは、単に表示、閲覧だけではなく、 文書の意味を表わすタグを利用した様々 な使い方ができます。 データ記述言語 CSVとXMLの比較 受注情報 工事名 発注者 請負金額 受注者 ○○工事 建設省 1,000,000,000 ○○建設 ××工事 東京都 30,000,000 △△建設 △△工事 運輸省 400,000,000 CSVによる記述 受注情報,, 工事名,発注者,請負金額,受注者 ○○工事,建設省,“1,000,000,000”,○○建設 ××工事,東京都 ,“30,000,000”,△△建設 △△工事,運輸省,“400,000,000”,××ー建設 表現は簡潔だがデータの意味は不明 ××ー建設 XMLによる記述 <?XML VERSION=“1.0” ?> <title>受注情報</ title > <pname>工事名</ pname E> <owner>発注者</ owner > <yen>請負金額</yen> <contractor>受注者</contractor> <item> <pname>○○工事</pname> <owner>建設省</owner> <yen> 1,000,000,000</yen> <contractor>○○建設 </contractor>……… 表現は長いが1つ1つのタグが意味を持つ XMLの特徴 2面性をもつ • 構造化されたデータ(データ記述言語) • ブラウザで表現可能(ページ記述言語) データ交換言語としての利用 • CSVに比べてより多くの情報を持つ • EDIデータとして使用可能 Web用言語としての利用 • スタイルシートにより様々なレイアウトが可能 • 検索が容易 XMLの応用 Webでの配信としての利用 • IE5.0で可能。拡大・増加傾向 データベースの交換データ形式 • データが意味を持つため、中間ファイル 形式としての利用が容易。 あなたのデータは、 データ形式の表現言語 • データベースとして直接利用。 旅立ちできますか XMLデータは親鳥の もとから巣立つことが できます。 これまでのWWW ブラウザ HTML データベース & アプリケーション WWW サーバ ブラウザ ブラウザ これからのWWW JavaScript CSS XSL ブラウザ XML データベース WWW & サーバ アプリケーション アプリケーション ブラウザ アプリケーション ブラウザ アプリケーション XML対応ブラウザ IE5.0 XMLプロセッサを実装 CSS1.0をサポート XSLをサポート (IE4.01から一部実装) ブラウザでも •見栄え良く表示すること、 •検索して表示こと が可能となります。 XMLプロセッサとは XMLデータを直接扱うプログラムの総称 まず、XMLデータの論理構造の確認と把握を行う。 次に、アプリケーションプログラムは、XMLプロ セッサによって指定された構文(言語)によって データを読み、データを表示させることができる。 言い換えれば、特定のアプリケーションに依存しな い “共通のXML処理を行うプログラム” である。 XMLプロセッサとは 料理との比較 XMLデータ 論理構造の確認と把握 データの抽出/論理構造 の変換 データの表示/検索/DBと の連携 素 材 レシピに沿った素材が揃っ ているかチェック 下ごしらえする 本格的な料理は、料理の鉄 人に任せる (専門アプリケーション) CSS1.0とは Cascading Style Sheetは、HTML用 のスタイル言語として開発され、1996.12に W3Cの勧告になった。 簡単な指定機構により、書き手/読み手双方 の表示に対する要求を実現することが可能。 要素の内容 色、フォント指定 マージ XSLとは XSL(eXtensible Stylesheet Language)は、XML文書の体裁を指定する 機能と文書構造の変換を指定する機能を持つ CSS(Cascading Style Sheets)も考慮 記述にはXML構文を使用する デジタル写真管理XMLデータ のWebブラウザ上での表示 建設省発注工事におけるデジタル写真管理 情報基準の写真属性情報ファイルのDTDに 準拠して作成された電子データ(XMLデータ と画像データ)を利用。 前述のXMLプロセッサを利用して、Webブラ ウザ上で表示や検索できるようにした。 デジタル写真管理XMLデータ デジタル写真管理のデモ IE4&5のXMLプロセッサを利用 XMLプロセッサの働き 例:IE5のMSXML.DLL ブラウザと連携した働き XMLデータ 論理構造の 確認と把握 当PGの処理範囲 データ抽出 処理 表示 適 XMLデータ データ構造変更 MSXML.DLL 表示 補足:XML実装の関する標準化 例:IE5のMSXML.DLL ブラウザと連携部分 • データの記述方法の標準化 > XMLデータの仕様 • オブジェクト(XMLデータ)の扱い方の標準化 > JavaScript等のよるデータ抽出方法 • ブラウザへの表示方法の標準化 > XSLによるHTMLファイルへの構造変換 > CSSの利用 補足:XML実装の関する標準化 • 厨房の作業に例えると、材料の確認と下ごしらえ は、XMLプロセッサが行い、料理そのものは、ブ ラウザが担当する。 • この両者の間の取り決めのが、XML実装にお ける標準化であると言える。 XML- まとめ1 SGMLの問題点 実装に関する標準がな かった XMLとは、SGMLの実装部分をインター ネットの技術をもとづいて規格化(勧告 W3C Recommendation)したもの SGML(父親)とインターネット(母親)と両 親して生まれた正当な後継者 • その表現でいくと、HTMLは母方(インターネット)の 従兄弟であろう。 XML実装は、今後インターネットの技術をベー スにして進む。 XMLの強み インターネットをベースにし た実装 XML- まとめ2 XMLの導入によって、特定の処理システム に依存しない “データベース構造を持った電 子データ” の流通が促進される。 今回の建設省のデジタル写真管理XML データ導入は、この動きに沿ったものである。 あなたのデータは、旅立ちできますか XMLデータは親鳥のもとから巣立つことができます。