オーストラリアと米国のチームによるこの研究では、地理的、遺伝的および形質に基づいて、植物学的データの最も包括的な情報源の間で網羅性と重複度を比較し、世界の植物に関する知見において現在存在しているものと欠落しているものについて、実施可能な方針を与えてくれます。
彼らの分析では、約2億1500万のGBIF.orgからの植物レコードを取り出し、それらの範囲をGenBankとTRYで集められたデータと比較し、PlantListにおける350,699の種名ひとつずつを次の3つのグループの1つに分類しました:1)生息地、遺伝子、形質のうち少なくともいくつかの知見がある広くカバーされている種(17.7%);2)少なくとも一つのデータ源から欠落していて部分的にカバーされている種(55.6%);3)種名以外の情報がない種(26.7%)。
GBIFネットワークは最も完全に種をカバーしていますが(73.3%)、その結果は植物学的知見においてよく知られているが未だに定量化されていないいくつかの不足分を描き出しています。
データ収集と標本のデジタル化にとって明確な目標を提供することで、著者らは彼らが述べた「克服できないタスクと思われるものを、埋めるべきギャップを示した扱いやすいリストに変える」という楽観的な期待が可能であることを示しました。