簡報檔(ppt) - TaiBIF台灣生物多樣性資訊機構

Download Report

Transcript 簡報檔(ppt) - TaiBIF台灣生物多樣性資訊機構

GBIF 發布生物多樣性資料 Darwin
Core Archive 格式與 IPT2 資料發布
平台介紹
賴昆祺
中央研究院生物多樣性研究中心
2013/11/21
大綱
•
•
•
•
•
•
四個資料分享流程
六個非用Darwin core 的理由
十分鐘教你看懂Darwin core
八個使用Darwin core archive要注意的事情
一個好工具分享--IPT 介紹
一個用DwC-A經典範例--Data paper投稿範例
先別說這個了,
你聽過Darwin core嗎?
是
否
你聽過Darwin core Archive嗎?
是
否
您認為這麼辛苦整理資料,
是為了?
給其他有需要的人看,方便閱讀
給機器看,加速資料分享
計畫要求
學名檢查
工具
http://taibif.tw/BDTools
輸入
同物
分類
錯字
正確
學名
異名
位階
檢查
學名
地理座標檢核
• 上傳EXCEL檔案,檔案中包含三個欄位資
訊,分別為loc(地點文字說明)、x(經度)、
y(緯度)
資料發佈流程
Darwin core
Archive
資料分享工具
52 country participants,
38 international
organizations;
417,529,910 indexed
records, 10,004 datasets,
464 publishers
利用IPT上傳研究成果中名錄資料
/出現記錄
從Word/
Excel
檔整理
利用IPT上傳研究成果中名錄資料
/出現記錄
利用EXCEL
建檔
參考Darwin core 定
義與說明
利用IPT上傳研究成果中名錄資料
/出現記錄
工具的檢查
利用IPT上傳研究成果中名錄資料
/出現記錄
IPT
資料發佈
Darwin core Archive 的重要性
• 1.生物多樣性資料分享的國際標準
– ABCD
• > 1200 詞彙(欄位)
• Shared via BioCase
– Darwin core (v 1.2)
• 48 詞彙(欄位)
• Shared via by DiGIR
– Darwin Core (v. 1.4)
• 46 詞彙(欄位)
• Shared via Tapir
– Darwin Core (TDWG Standard, since 2009)
• 172詞彙(欄位)
BY Kyle Braak
Darwin core Archive 的重要性
• 1. 生物多樣性資料分享的國際標準
By GBIF Annual Report 2012
有哪些組織在用Darwin core
• 美國生物多樣性典藏數位化計畫
(Advancing Digitization of Biodiversity
Collections)
• 澳洲生物地圖集(Atlas of Living Australia,
ALA)
• 台灣數位典藏國家型計畫
Darwin core Archive 的重要性
• 1. 生物多樣性資料分享的國際標準
• 2. 結構化資料
台灣石珊瑚誌
Darwin core Archive 的重要性
• 1. 生物多樣性資料分享的國際標準
• 2. 結構化資料
台灣真菌誌
Darwin core Archive 的重要性
• 1. 生物多樣性資料分享的國際標準
• 2. 結構化資料
台灣蝽象誌
學名
學名
學名
中文名
圖檔名稱
圖檔名稱
科名
描述
中文名
同物異名
分布
文獻
標本採集號
棲地
描述
描述
文獻
分布
分布
註解
棲地
文獻
Darwin core Archive 的重要性
• 1. 生物多樣性資料分享的國際標準
• 2. 結構化資料
ScientificName
vernacularName
taxonRank
scientificNa
meAuthors
hip
locality
Cycas
taitungensis
臺東蘇鐵
species
C. F. Shen
Taiwan
Hemimyzon
taitungensis
臺東間爬岩鰍
species
Tzeng &
Shen, 1981
Tachia
River
Pocillopora
damicornis
細枝鹿角珊瑚
species
Linnaeus,
1758
Widely
distribute
d IndoPacific
……..
………..
………
………….
……….
threatS
tatus
VU
………….
Darwin core Archive 的重要性
• 1. 生物多樣性資料分享的國際標準
• 2. 結構化資料
• 3. 回傳一致的搜尋結果
Darwin core Archive 的重要性
• 1. 生物多樣性資料分享的國際標準
• 2. 結構化資料
• 3. 回傳一致的搜尋結果
• 4. 學術出版
Darwin core Archive 的重要性
1. 生物多樣性資料分享的國際標準
2. 結構化資料
3. 回傳一致的搜尋結果
4. 學術出版
Time of publication
• 5. 資料備份
生物多樣性面臨的危機
•環境破壞、物種滅絕
•累積的資料知識失落
Information Content
•
•
•
•
Specific details
General details
Retirement or
career change
Accident
Death
Time
Darwin core Archive 的重要性
•
•
•
•
•
1. 生物多樣性資料分享的國際標準
2. 結構化資料
3. 回傳一致的搜尋結果
4. 學術出版
5. 資料備份
6.資料可再利用與分析,
Ecological Niche Model
Analysis /
Applications
Darwin core archive
Darwin core archive
Darwin
Core
Darwin core archive
物種出現紀錄(Primary Biodiversity
Data)
• 物種出現紀錄包含博物館動物
標本、植物標本、生態調查與
物種觀察等資料。
10 分鐘看懂 Darwin core
類別
說明
詞彙
Record-level
terms
Occurrence
關於採集或觀測資
料的收藏紀錄
關於物種在自然、
館藏、或資料集中
的出現紀錄資訊
關於某次採集或觀
測行為的事件紀錄
地理與位置資訊
Modified、Language、institutionCode、
collectionCode(館藏代碼)等
catalogNumber(編目號)、recordedBy、
individualCount、Preparations(製備過程)等
Event
Location
Identification
Taxon
eventDate(事件日期)、Habitat(採集環境描
述)等
Country、County、locality、
minimumElevationInMeters、
minimumDepthInMeters、decimalLatitude、
decimalLongitude、
coordinateUncertaintyInMeters等
關於採集或觀測資 identifiedBy、dateIdentified等
料的鑑定資訊
關於採集或觀測資 scientificName、kingdom、Phylum、Class、
料的分類資訊
Order、Family、genus、specificEpithet、
infraspecificEpithet等
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
dcterms:modified:最後修正日期
資料中的任何欄位修正完成時的日期及
時間。使用ISO-8601格式,如:1994-1105
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
dcterms:rights:資料授權的方式
如:創用CC 姓名標示、姓名標示─非商業性
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
basisOfRecord:資料基底,如:
PreservedSpecimen- 標本收藏
FossilSpecimen- 化石標本
LivingSpecimen- 活體標本
HumanObservation- 人為觀測
MachineObservation- 機器觀測
StillImage- 靜態影像
SoundRecording- 錄製聲音
OtherSpecimen- 其它標本
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
recordedBy:資料記錄者
為主要的採集者或觀測者
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
samplingProtocol:採集方法
如採集時使用方法或步驟的名稱、參考
或簡短描述。例如:紫外光陷阱、霧
網、底拖網
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
eventDate:資料發生日期
如採集日期,1997-12-02
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
locality:位置、採集地,如里龍山
decimalLatitude:十進位緯度,採集或觀測事
件發生地點中心位置的緯度,以十進位表示
decimalLongitude:十進位經度,採集或觀測
事件發生地點中心位置的經度,以十進位表示
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
scientificName:學名,
該分類群最低階層的完整名稱,應採用最
近被接受的分類方式,盡可能地精確,包
含作者、發表年代、看法引證來源、不確
定性的指示。
例如: "Coleoptera" (目), "Vespertilionidae" (科),
"Manis" (屬), "Ctenomys sociabilis" (屬 + 種小名),
"Ambystoma tigrinum diaboli" (屬 + 種小名 + 亞種
小名), "Quercus agrifolia var. oxyadenia (Torr.) J.T.
Howell" (屬 + 種小名 + 種下階層 + 種下名 + 學名作
者
Darwin core is divided into classes
and terms
• http://rs.tdwg.org/dwc/terms/index.htm
taxonRank:分類等級
該分類群最低階層的等級,如
"subspecies", "varietas", "forma",
"species", "genus“, “family”
Darwin core extension
• http://rs.tdwg.org/dwc/terms/index.htm
paleontology - 古生物學常用詞彙已經被
整合到 GeologicalContext
Darwin core 的近期發展
• Darwin core 與基因多樣性的標準
Darwin core 的更改記錄
• http://rs.tdwg.org/dwc/terms/history/index.htm
8 個運用Darwin core要注意的事情(1)
• 對於分享的每一筆記錄,需要產生一個獨特
唯一的”核心 ID(core ID)”
– 流水編號
– lsid
core ID
scientificName
vernacularName recordedBy
urn:lsid:coatbp.sinica.e
du.tw:observation:1
Grammoplites
scaber
橫帶牛尾魚
邵廣昭
urn:lsid:coatbp.sinica.e
du.tw:observation:2
Begonia
厚壁秋海棠
silletensis (A. DC.)
C. B. Clarke
彭鏡毅
8 個運用Darwin core要注意的事情(2)
• 盡可能使用Darwin core 欄位
name
俗名
Grammoplites scaber
橫帶牛尾魚 邵廣昭
Begonia silletensis (A.
DC.) C. B. Clarke
厚壁秋海棠 彭鏡毅
collector
scientificName
vernacularNa
me
recordedBy
Grammoplites scaber
橫帶牛尾魚
邵廣昭
Begonia silletensis (A.
DC.) C. B. Clarke
厚壁秋海棠
彭鏡毅
8 個運用Darwin core要注意的事情(3)
• 不要使用類別名稱,如Occurrence, Event,
MaterialSample, Location, Taxon
Taxon
Location
Event
Grammoplites scaber
台灣
標本採集
Begonia formosana
(Hayata) Masam.
水鴨腳
自然觀察
scientificName
locality
basisOfRecord
Grammoplites scaber
台灣
標本採集
Begonia formosana
(Hayata) Masam.
水鴨腳
自然觀察
8 個運用Darwin core要注意的事情(4)
• 使用Darwin core已經定義的說明
scientificName
locality
basisOfRecord
Grammoplites scaber
台灣
標本採集
Begonia formosana
(Hayata) Masam.
水鴨腳
自然觀察
scientificName
locality
basisOfRecord
Grammoplites scaber
台灣
PreservedSpecimen
Begonia formosana
(Hayata) Masam.
水鴨腳
HumanObservation
8 個運用Darwin core要注意的事情(5)
• 盡可能的填上所調查資料屬性
scientificName
vernacularName recordedBy
Grammoplites scaber
橫帶牛尾魚
邵廣昭
Begonia silletensis (A. DC.)
C. B. Clarke
厚壁秋海棠
彭鏡毅
scientific vernacul
Name
arName
recorded decimalL decimalL eventDat kingdom associat
By
ongitude atitude
a
dMedia
橫帶牛
尾魚
邵廣昭
121.22
22.46
2001-10- 動物界
11
1.Jpg
Begonia 厚壁秋
silletensi 海棠
s (A. DC.)
彭鏡毅
120.111
24.892
1998-10- 植物界
23
2.jpg
Grammo
plites
scaber
8 個運用Darwin core要注意的事情(6)
• 格式需要符合定義的規範
scientificName
eventData
decimalLatitude
Grammoplites scaber
11-11-11
N 22.47
Begonia silletensis (A.
DC.) C. B. Clarke
102-11-11
22。41’36
scientificName
eventData
decimalLatitude
Grammoplites scaber
2011-11-11
22.47
Begonia silletensis (A. DC.) 2013-11-11
C. B. Clarke
22.68
8 個運用Darwin core要注意的事情(7)
• 若有些資料被想公開,可以
用 informationWithheld 來加以說明
– 如:此物種為瀕危物種,因此座標隱藏(location
information not given for endangered species)
scientificName
decimalLongitude
decimalLatitude
Grammoplites
scaber
Begonia silletensis 121.11
(A. DC.) C. B.
informationW
ithheld
location
information
not given for
endangered
species
22.68
8 個運用Darwin core要注意的事情(8)
• 若有些資料欄位目前對應不到Darwin core,
這些欄位是可以保留,但發佈的時候,這些
資料會被忽略
“Wingspan” is not a Darwin Core term
Resources
Darwin core 中文說明:
http://www.taibif.tw/taibif_search/dwcDescribe.php
開啟EXCEL 將資料鍵入
資料整合發布工具(Integrated
Publishing Toolkit, IPT)
資料整合發布工具(Integrated
Publishing Toolkit, IPT)
Ecological Metadata Language (EML)
Sections of metadata
•
•
•
•
•
•
•
•
•
•
•
•
Basic Metadata
Geographic Coverage
Taxonomic Coverage
Temporal Coverage
Keywords
Associated Parties
Project Data
Sampling Methods
Citations
Collection Data
External Links
Additional Metadata
58
Darwin core archive 架構
Darwin core archive 架構
Darwin core archive 架構
Darwin core archive 架構
Darwin core archive 架構
Darwin core archive 架構
Darwin core archive 架構
Darwin Core Archive:
Benefits
•
•
•
•
Simple format (text files)
Efficient harvesting (single file)
Efficient storage (compressed)
Easy access (no special software required)
What is 'Data Paper' ?
• Searchable / online accessible datasets
– Should always be linked to
the published datasets they
described.
• Metadata described
– Contains facts about data.
– Rather than reporting a
research investigation.
• Scholarly publication /
scholarly credit
67
68
Ecological Research
http://www.springer.com/life+sciences/ecology/journal/11284
69
Produce manuscript for data paper
70
71
72
73
RTF file
74
Pensoft Publisher
(http://www.pensoft.net)
75
Create Account: register
76
Create Account: step 1
77
Create Account: step 2
78
Create Account: step 3
79
Create Account: finish
80
81
82
83
84
85
Enter metadata (cont.)
86
Upload submission
87
88
89
90
91
92
工作坊
你會學到什麼?
繳交資料格式及綜合介紹
meta
data
物種調
查資料
一份
DwC-A
生物多
樣性檢
核工具
利用IPT上傳研究成果與原始分布資料
建立資源集
• 介面介紹
• 帳號申請
建立物出現
紀錄
• 上傳一份DwC
• Darwin Core
Mappings
Metadata填
寫
利用IPT上傳研究成果中名錄資料
從word 檔整理
利用EXCEL建檔
名錄
發佈名錄資料
上傳名錄
TaiBIF
網
站
介
紹
您認為這麼辛苦整理資料,
是為了?
給其他有需要的人看,方便閱讀
給機器看,加速資料分享
計畫要求
謝謝聆聽
Thank you for your attention
100