3. The TEI Header / TEI標頭

Download Report

Transcript 3. The TEI Header / TEI標頭

TEI 工作坊
3. The TEI Header
TEI 標頭
Oct 2006
頭和身體
●
TEI 基本架構如下 :
<TEI>
<teiHeader>
....
</teiHeader>
<text>
<body>.... </body>
</text>
</TEI>
Why Metadata 上層資訊 ?
●
●
●
●
●
Identification of the text / 識別文本
Documentation of its structure and
organization / 記錄其架構
Documentation of interpretive scheme/s
applied / 記錄詮釋性的計畫
Statement of rights (reproduction, ownership
etc.) / 陳述關於複製、所有權等條件
Brief characterization for search engines /
為 搜尋工具提供關鍵詞等
4 Parts
< 檔案描述 >/<fileDesc>
< 編碼描述 >/<encodingDesc> ?
< 文件背景描述 >/<profileDesc> ?
< 修訂描述 >/<revisionDesc> ?
< 檔案描述 >/<fileDesc>
●
包含對電子檔案的完整書目敘述。
<題名陳述>/<titleStmt>
匯集關於作品標題與作品智慧內容責任歸屬的資訊
<版本陳述>/<editionStmt>
匯集文件某一版本的相關資訊。
<檔案大小>/<extent>
描述電子文件儲存在某一承載媒介時的約略大小,標以任何適用的單位。
<出版陳述>/<publicationStmt>
匯集電子文件或其他類型文件的出版或發行相關資訊。
<集叢陳述>/<seriesStmt>
若出版品隸屬於某叢書,在此(/此元素)則匯集該叢書的相關資訊。
<附註陳述>/<notesStmt>
收集其他部分的書目描述中所未記載的任何文件相關附註。
<來源描述>/<sourceDesc>
提供所製電子文件的一個或數個來源文件的書目描述
最小的 <tei 標頭 >
<teiHeader><fileDesc>
<titleStmt>書名,作者, 編輯者</titleStmt>
<publicationStmt>檔案的出版,發行,發行條件
</publicationStmt>
<sourceDesc>文本來源</sourceDesc>
</fileDesc> </teiHeader>
●
Check the P5 template in XML Copy Editor.
●
And one more example...
<teiHeader><fileDesc>
<titleStmt><title>七大寺年表</title>
<author>慧珍 (1118-1169)</author>
<respStmt><resp>digitized by</resp>
<name>Marcus Bingenheimer</name></respStmt>
</titleStmt>
<publicationStmt><distributor>Oxford Text
Archive</distributor>
</publicationStmt>
<sourceDesc><bibl> 大日本仏教全書 [Complete Works of
Japanese Buddhism]. 100 vols., Suzuki Research
Foundation - edition 鈴木学術財団, Tokyo: Kōdansha
講談社, 1972. No. 647 </bibl>
</sourceDesc>
</fileDesc></teiHeader>
4 Parts
< 檔案描述 >/<fileDesc>
< 編碼描述 >/<encodingDesc> ?
< 文件背景描述 >/<profileDesc> ?
< 修訂描述 >/<revisionDesc> ?
< 編碼描述 >/<encodingDesc>
●
< 編碼描述 >/<encodingDesc> 標明文件轉錄時所遵
循的方法與編輯原則,ㄧ般非常推薦使用此元素。
<計畫描述>/<projectDesc>
詳述將電子檔案編碼的目標或目的,以及其他關於檔案匯集或收集程序的
任何資訊。
<取樣宣告>/<samplingDecl>
以篇章描述的方式說明建立文集或文選時文件取樣的原理與方法。
<編輯宣告>/<editorialDecl>
提供文件編碼時使用的編輯原則與實行方法的細節。
<標誌宣告>/<tagsDecl>
提供關於應用在 XML 文件中的標誌的詳細資訊。
<參照宣告>/<refsDecl>
標明本文件與某一個權威參照標準的關係。
<分類宣告>/<classDecl>
例
:
<teiHeader>
<fileDesc> .... </fileDesc>
<encodingDesc>
<editorialDecl>
<normalization>
<p>所有的汉字都转成简体字!
</p>
</normalization>
<quotation marks="all" form="std">
<p>所有的双引号都转成&quot;</p>
</quotation>
</editorialDecl>
</encodingDesc>
</teiHeader>
或:
<teiHeader>
<fileDesc>
.... </fileDesc>
<encodingDesc><editorialDecl>
<p>所有的双引号都转成&quot;</p>
<p>所有的汉字都转成简体字</p>
<p>加標點符號</p>
<p>異體字標準化</p>
</editorialDecl></encodingDesc>
</teiHeader>
4 Parts
< 檔案描述 >/<fileDesc>
< 編碼描述 >/<encodingDesc> ?
< 文件背景描述 >/<profileDesc> ?
< 修訂描述 >/<revisionDesc> ?
< 文件背景描述 >/<profileDesc>
●
< 背景描述 > ( <profileDesc> )讓描繪文件多面向
特性的資訊可以被記錄在一個單一架構之中。
<建置資訊>/<creation>
包含關於文件建置的資訊。
<使用語言>/<langUsage>
描述文件中出現的語言、次要語言、語體形式、方言等。
<分類用詞(文件分類)>/<textClass>
匯集以標準分類架構、索引典等來描述文件性質或主題的資訊。
例
:
<teiHeader>
<fileDesc> .... </fileDesc>
<profileDesc>
<langUsage>
<language ident="en">English</language>
<language ident="zh-tw">台灣國語</language>
<language ident="zh-cn">普通話兒</language>
</langUsage>
</profileDesc>
</teiHeader>
4 Parts
< 檔案描述 >/<fileDesc>
< 編碼描述 >/<encodingDesc> ?
< 文件背景描述 >/<profileDesc> ?
< 修訂描述 >/<revisionDesc> ?
< 修訂描述 >/<revisionDesc>
●
< 修訂描述 > ( <revisionDesc> )提供一個變更紀錄,可用
來記載文件中每次的更改內容。變更紀錄可包含一連串的元
素 < 變更 > ( <change> ),每一項該元素皆包含:
變更紀錄可包含一連串的元素<變更>/<change>,每一項該元素皆
包含:
<日期>/<date>
以任何形式來標明日期。
<責任陳述>/<respStmt>
當未使用有關作者、編者等特定元素,或這些元素內容不足
時,在此補充說明負責文件、編輯、記錄或是集叢等的知識
內容相關人員的責任。
<項目>/<item>
標誌列表中的一個元件。
例
:
<teiHeader>
<fileDesc> .... </fileDesc>
<revisionDesc>
<change>
<date>2006-02</date>
<respStmt>
<resp>編輯</resp><name>李小姐</name></respStmt>
<item>tei 標頭變更</item></change>
<change>
<date>2005-12</date>
<respStmt>
<resp>編輯</resp><name>王先生</name></respStmt>
<item>基本 Tei Lite 標記</item></change>
</revisionDesc>
</teiHeader>
術語
●
●
●
元素名稱以 Desc (description 描述)結尾
者,內含篇章描述。
元素名稱以 Stmt (statement 陳述)結尾者,
通常內含一群記錄某些結構化資訊的元素。
元素名稱以 Decl (declaration 宣告)結尾
者,內含特定的編碼方式資訊。
Revision
●
再復習一邊用 “ teiP5visualization.html”
Practice
●
●
●
打開 “ poemChin.xml”
以 <head>, <lg>, <l> and <p> 改進他的
markup. Validate.
把文章裡面所提供的的上層資訊移到
teiHeader. What goes in <titleStmt>, what in
<publicationStmt> what in <sourceDesc>?
Document your encoding in an
<encodingDesc>.
© marcus bingenheimer 2005-2008