透過 GBIF.org 及其附屬服務公開的資料,都是 GBIF 會員網絡和資料發布者們經由共享的規則及慣例,從世界各地數以百計的機構獲取數以千計的資料集加以描述、紀錄、建構而成。 而共享的資料標準,使得推動彙整 GBIF 索引中數以億計的基礎生物多樣性資料成為可能。
在生物多樣性的領域,主要負責開發及維護資料標準的是生物多樣性資訊標準組織。 作為國際生命科學聯盟的附屬機構,該非營利的科學及教育協會專注於開發生物及生物多樣性資料的交換標準。 生物多樣性的社群成員一般將此組織稱為TDWG(音同 Tad-Wig),因其前身為分類學資料庫工作小組(Taxonomic Databases Working Group)。
經常使用的標準規範
達爾文核心集(Darwin Core)
達爾文核心集標準(Darwin Core Standard, DwC)提供一個穩定、直觀及可塑的框架來編譯不同、多變來源的生物多樣性資料。 絕大多數由 GBIF.org 分享的資料集都是以達爾文核心集檔案格式(Darwin Core Archive format, DwC-A)發布。
- 什麼是達爾文核心集?它為何重要?
- 介紹:調查活動資料
- iOBIS 達爾文核心集手冊
- 達爾文核心集辭彙 (連結至 Gcube 維基)
EML: 生態詮釋資料語言
生態詮釋資料語言(Ecological Metadata Language, EML),是一種詮釋資料規範。 它使用一系列模組化、可擴展的 XML 文件類型來記錄生態資料集的資訊。 GBIF.org 所有資料集的描述都依賴詮釋資料;也就是說,關於資料的資訊都使用此開源 EML 標準—它是由生物複雜性知識網絡所管理及維護。 每個達爾文核心集資料檔案的組成部件中都包含一個 EML 文件(以XML 格式撰寫)。
BioCASe / ABCD
生物典藏存取服務(Biological Collection Access Service),又稱 BioCASe,是一個連結國際間自然史典藏、動植物園、研究機構所有生物典藏資料的網絡。 BioCASe 仰賴生物典藏資料取用交換標準(Access to Biological Collections Data, ABCD),亦是由 TDWG 所管理。