標準データ形式

標準データ形式を共有することで、GBIFインデックスにおいて何億もの生物多様性情報の一次レコードを集めることに成功しました。

Detail of *Elodea*
コカナダモ属 の細胞および葉緑体の拡大写真(著作者:Brandon Zierer、ライセンス:CC BY-NC-SA 2.0

GBIF.orgを通して利用可能なデータおよび関連サービスは、世界中の何百もの機関から引き出された何千もの異なるデータセットを記述し、記録し、構造化するための共有ルールおよび規則をGBIFネットワークの参加団体およびデータ発行者が適用してきたことによる成果です。共通の標準形式のおかげで、GBIFインデックスにおいて何億もの生物多様性情報の一次レコードを集めることに成功しました。

生物多様性分野において、標準データ形式の開発および維持を主に担っている団体はBiodiversity Information Standardsです。この非営利な科学・教育協会は、International Union of Biological Scienceの関係団体として生物および生物多様性データ交換のための標準データ形式の開発に焦点を当てています。生物多様性コミュニティのメンバーはこの団体をTDWG(タドウィグと発音)と呼んでいます(団体の前身であるTaxonomic Databases Working Groupを思い起こす意味も込めて)。

よく使われる標準形式

ダーウィンコア

ダーウィンコアスタンダード(DwC)は、多様で変化する情報源から生物多様性データを集める上で安定した、直接的で柔軟なフレームワークを提供します。GBIF.orgで共有されているデータセットの多くはダーウィンコアアーカイブフォーマット(DwC-A)を用いて出版されています。

ダーウィンコアとは何ですか?なぜ重要なのですか?
サンプリングイベントデータの紹介
iOBISダーウィンコアマニュアル
ダーウィンコアの用語(Gcube Wiki経由)

EML:生態学メタデータ言語

生態学メタデータ言語またはEMLとは、生態学分野のデータセットに関する情報を記述するためのメタデータ標準であり、モジュール式で拡張されたXMLドキュメントタイプの一つです。GBIF.orgにおけるデータセットの全ての記述はメタデータに準拠しています。メタデータとはデータについての情報で、The Knowledge Network for Biocomplexityにより維持管理されているオープンソースのEML標準形式を使用しています。ダーウィンコアアーカイブは構成ファイルの一つとして(EML形式で記述された)EMLファイルを含みます。

GBIFメタデータプロファイル:ハウツーガイド
EML標準形式

BioCASe / ABCD

Biological Collection Access Serviceは、一般的にはBioCASeと呼ばれ、自然史博物館、植物園、動物園および研究機関から集められた生物コレクションデータをつなぐ国際ネットワークです。BioCASeは同じくTDWGが管理するAccess to Biological Collections Data (ABCD) data exchange standardに準拠しています。

BioCASeプロトコル
GBIF.orgを介したBioCASeデータへのユーザのアクセス状況