資訊組織研究

Download Report

Transcript 資訊組織研究

資訊組織研究
Metadata Encoding Systems:
XML
課程老師:張迺貞
組員:黃淑珍097153108
吳雅瑜097153119
曲惠君097153113
蔡佩珊097153115(報告人)
大綱











XML的定義
SGML、HTML、XML三者關係
XML的特色
Well-Formed介紹
DTD介紹
XML實例說明
XML Schema介紹
XML文件編輯工具
XML的應用方向
參考資料
Q&A
XML的定義

eXtensible Markup Language 可擴展標示語言。

W3C在1998年2月10日通過的建議書
World Wide Web Consortium(全球資訊網協會),
宗旨是擬定諸多全球資訊網的公共標準,提升網
路的互通性,帶動Web發展。

XML具備了SGML所沒有的簡易性與靈活性,又
有著HTML所欠缺的擴展性與結構性,因此促使
XML的誕生,廣泛利用。
XML能做什麼?

XML並不是一個程式語言,就像HTML一樣,
XML本身並不能獨立作任何事,XML只是提供描
述、紀錄、處理和發行資訊的標準方法,必須搭
配其他相關的延伸技術或軟體工具。

擁有許多強大的應用,例如超越像HTML在網頁
呈現效果、資料管理與交換功能、遠端程式呼叫
的封裝技術等等。
SGML、HTML、XML三者關係

XML掌握了SGML其延展性、文件自我描述特性、
以及其強大的文件結構化功能,但XML卻摒除了
SGML過於龐大複雜、不易學習及使用,以及未獲
普及化的缺點。

XML的長處則是對文件資料進行結構性的描述,
XML可以彌補HTML缺乏彈性、無法自訂控制標籤、
只能應用在資料顯示的缺點。

所以,XML是取SGML之長,補HTML之短。
XML與HTML特性比較
HTML
XML
標籤集與每個標籤的意義是固 允許使用者根據需要,自行定
擴展性 定的,使用者無法自行定義標 義標籤與屬性。
籤或屬性。
不支援結構描述,只支援資料 能描述各種複雜的文件結構。
結構性 的呈現。
沒有提供嚴格的語法檢驗,內 包含一個資料型別定義(DTD)
定的資料型別定義(DTD)只著 或XML Schema,應用程式對
確認性 重於標籤的定義,而非結構的 文件能夠進行結構確認。
定義。
XML的特色
可擴展性 (Extensibility)
 結構性(Structure)
 嚴格的語法規範(Well-formedness)
 可確認性(Validation)
 自我描述性
 資料和樣式分離原則

電子文件三要素
Presentation 表現
Structure 結構
Content內容
XML相關延伸技術圖
Well-Formed的意義

是一套編寫XML文件最基本的規則,一個
完好的(Well-Formed )XML文件必須遵守
下列規則:
1. 包含一個以上的元素
2. 僅有一個根元素
3. 所有的元素都有起始標籤與結束標籤
4. 空標籤必須遵守特殊的XML語法
5. 所有標籤必須呈巢狀結構
6. 英文字母大小寫有別
XML文件-範例
版本資訊
文件宣告
僅一個根元素
包含多個元素
字碼宣告
獨立性
<?xml version=“1.0” econding=“Big=5” stahdalone=“yas”?>
<書籍>
<ISBN>957-01-8202-4</ISBN>
<書名>XML標準與技術簡介</書名>
<作者>
<姓名>余顯強</姓名>
<作者>
<出版社>數位典藏訓練推廣分項計畫</出版社>
<定價>200</定價>
</書籍>
所有的元素都有起始標籤與結束標籤

空標籤必須遵守特殊的XML語法
特殊字元
代替符號
&
>
<
“
‘
&amp
&gt
&lt
&qout
&apos
XML:
<書名>XML&qout;標準與技術簡介;&qout</書名>
呈現:
XML “標準與技術簡介“

所有標籤必須呈巢狀結構
錯誤:
<ISBN>957-01-8202-4<書名></ISBN>XML標準與技術簡介</書名>
正確:
<ISBN>957-01-8202-4</ISBN><書名>XML標準與技術簡介</書名>

英文字母大小寫有別
錯誤: <Name> XML標準與技術簡介</name>
正確: <Name> XML標準與技術簡介</Name>
什麼是DTD?

XML可根據其結構性蓋分為兩類:
1. 完好的(Well-Formed )XML文件
2. 有效的(Valid) XML文件

XML文件除了滿足語法規則(Well-Formed)外,仍
必須具備結構的規範才行。

文件類型定義(Document Type Definition,簡稱DTD) ,
主要用途在於定義文件中的元素型態、結構、範
圍、順序等,用來驗證XML文件。
DTD實體的宣告

內部實體:
該實體之宣告與使用皆在XML文件中。

外部實體:
如同引用外部DTD般,在XML文件之外
引用一個獨立的檔案。
內部DTD語法
內部DTD語法如下:
開始宣告DTD
根元素名稱
<!DOCTYPE element-name [
<!ELEMENT element-name element-definition >
開始元素設定
………….
元素名稱
元素定義
]>
1. <!DOCTYPE:開始宣告DTD
2. element-name:根元素名稱
3. [ 設定敘述的開始
4. <!ELEMENT…..關於元素設定的敘述
5. ]>:結束DTD宣告
內部DTD語法-範例
根元素
元素
子元素
<?xml version=“1.0” standalone=“yes”?>
<!DOCTYPE NTNU [
<!ELEMENT NTNU (student)>
<!ELEMENT student (id, name, birth)>
<!ELEMENT id (#PCDATA)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT birth (#PCDATA)>
]>
<NTNU>
<student>
<id>097153000</id>
<name>王小明</name>
<birth>10/10/1985</birth>
</student>
</NTNU>
PCDATA:Parse Character Data 可剖析的資料
外部DTD語法
外部DTD語法如下:
開始宣告DTD
根元素名稱
外部DTD所在位址
<!DOCTYPE element-name SYSTEM DTD-URL>
1. <!DOCTYPE:開始宣告DTD
2. element-name:根元素名稱
3. SYSTEM:該DTD為私人所使用
4. DTD-URL:外部DTD檔案所在位址
5. >:結束DTD宣告
外部DTD語法-範例
根元素
外部所在位址
<?xml version=“1.0” standalone=“no”?>
<!DOCTYPE NTNU SYSTEM “chap1-1.dtd“>
<NTNU>
<student>
<id>097153000</id>
<name>王小明</name>
<birth>10/10/1985</birth>
</student>
</NTNU>
獨立之chap1-1.dtd文件
<?xml version=“1.0” encording=“UTF-8”?>
<!ELEMENT NTNU (student)>
<!ELEMENT student (id, name, birth)>
<!ELEMENT id (#PCDATA)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT birth (#PCDATA)>
什麼是XML Schema?

W3C在2001年5月2日通過的建議標準。

XML Schema定義(XML Schema)的縮寫為
XSD。

目的:與DTD相同,都是定義XML文件結
構的標準。
XML Schema的特性
1.
2.
3.
本身就是一份well-formed的XML文件
支援更多XML元素的資料型態
XML Schema支援名稱空間(Namespace)
和DTD比較,XML Schema的優點:
1.
2.
3.
4.
使用標準的XML來定義整個XML Schema,不僅編
輯容易,也能夠透過標準的剖析器來解析。
能明確的設定結構中的元素量,亦能宣告節點的內
容為封閉式(僅能包含特定宣告的子元素),或是開
放式(能夠包含任何子元素)的結構。
透過名稱空間(Namespace)的使用,能在相同的文
件中載入多個XML Schemas。
能夠在XML Schema內定義原型(archetype),提供
基本的繼承(inheritance)、封裝(encapsulation)等
物件導向功能。
XML的應用方向
XML與電子出版
 XML與電子商務
 XML與圖書資訊組織與資料交換


XML (Topic Maps)在數位圖書館的應用
XML文件編輯工具(一)
 XML
Spy
http://www.altova.com/
(可有30天免費試用)
專門用來編輯XML的整合環境,可編輯XML、
DTD、XSD、XSL,提供三種顯示方式,包括顯
示原始碼、顯示表格和瀏覽器預覽,除了編輯
XML,亦可檢查DTD/Schema的文件編輯與格式
驗證、XSL的編輯與轉換。
XML文件編輯工具(二)
 Microsoft
XML Notepad
http://www.microsoft.com/downloads/details.aspx?FamilyID=72d6aa49787d-4118-ba5f-4f30fe913628&DisplayLang=en
(免費)
一種小而簡單XML編輯器,提供XML樹狀結構
及條例式的輸入介面,讓使用者能快速地編輯
XML文件,但需配合IE5.0以上來使用,才能剖析
XML文件是否為well-formed。
XML文件編輯工具(三)
 XML
writer
http://xmlwriter.net/
(免費)
專門為撰寫XML、XSL、XQL的網頁設計師與
網頁程式設計師所開發的軟體,可檢查錯誤的語
法,如果有錯誤,會在Error Message中出現你哪
一行出現錯誤,可將XML的格式轉換成HTML的
格式,以方便IE瀏覽。
參考文獻




林信成(民88)。XML相關技術下一代Web出版趨
勢之研究。教育資料與圖書館學,2,184-210。
余顯強(民93)。XML標準與技術簡介。台北市:
數位典藏訓練推廣分項計畫。
宋瓊玲(民93)。「XML技術與圖書館應用研習班」
研習心得 。國立中央大學圖書館通訊,39,8-12。
陳昭珍(民91年)。檔案管理運用研討會論文。
XML, Metadata與檔案資料數位化」。
Q&A