Hébergement de données

Un guide rapide pour prendre de bonnes décisions sur la façon d'héberger les données partagées avec le GBIF

wikimedia-servers
Wikimedia Foundation servers. Photo 2012 Victor Grigas, Wikimedia Foundation, licensed under CC BY-SA 3.0.

GBIF.org est un index de données sur la biodiversité publié par l'intermédiaire d'un réseau mondial d'infrastructures nationales, thématiques et de projets. Dans ce système interconnecté, il est essentiel pour les fournisseurs de données de s'assurer que les données qu'ils partagent disposent d'un point d'accès stable et persistant. Cette exigence est un défi pour de nombreuses institutions, en particulier celles qui sont nouvelles sur le GBIF et peuvent ne pas avoir les installations pour héberger et maintenir des données sur des serveurs toujours en ligne.

Une manière de commencer à résoudre le défi est de distinguer entre la publication de données et l'hébergement de données. Bien que ces activités sont connectées, il n'y a pas d'exigence formelle ou technique au fait que la même institution doive accomplir les deux tâches (même si c'est généralement le cas).

La publication de données est l'acte d'organiser et de partager des données standardisées pour être utilisées à travers le réseau GBIF. Une institution devient un fournisseur de données GBIF en remplissant un formulaire d'inscription en ligne et en recevant une approbation, soit par le biais de l'un des Participants nationaux et organisationnels du réseau GBIF ou du Comité Directeur des Noeuds (Nodes Steering Group).

L'hébergement de données est l'acte de stocker les données sur une plateforme web stable et accessible. Bien qu'il n'y ait pas d'arrangement standard pour la fourniture de ce service, l'hébergement de données représente un engagement significatif qui nécessite un engagement dévoué et une capacité à long terme de maintenir une plateforme persistante et hautement fiable connectée à Internet.

Quel que soit l'hébergeur des jeux de données, le GBIF s'emploie à créditer à la fois l'institution qui publie les données et son pays d'enregistrement. Ce qui suit est un guide rapide permettant de prendre des décisions éclairées sur la façon d'héberger les données partagées avec le GBIF.


Étapes d'hébergement

Une fois que vos données ont été organisées dans un format de données pris en charge, procédez comme suit :

  1. Devenez un fournisseur de données GBIF en complétant le formulaire d'inscription du fournisseur
  2. Trouvez une plateforme de publication, IPT ou autre, dans l'ordre de préférence : a. Hébergé par votre institution b. Hébergé par un noeud national (si votre pays est un participant GBIF) c. Hébergé par un autre Participant GBIF ou un autre fournisseur de données (par exemple un centre d'hébergement de données) d. Hébergement par vous-même : configurez votre propre plateforme de publication avec un IPT ou une autre installation dans votre institution (cela nécessite un accès Internet stable et continu) e. Si aucun des éléments ci-dessus ne s'applique, envoyez un message au service d'aide GBIFen expliquant vos besoins. Nous trouverons une IPT pour vous !
  3. Accéder à l'IPT et à la formation de base
  4. Commencez à publier vos jeux de données

Options d'hébergement de données

Hébergement de données par l'institution du fournisseur de données

Les fournisseurs de données ayant la capacité d'héberger leurs propres données peuvent installer leur propre Outil de Publication Intégrée (Integrated Publishing Toolkit, IPT) ou toute autre plateforme de publication de données (voir plus d'information ci-dessous)

Hébergement de données en dehors de l'institution du fournisseur de données

Les fournisseurs de données ayant une limite de capacité technique, ou qui ne souhaitent pas maintenir leurs propres plateformes de publication de données, peuvent choisir d'avoir leurs données hébergées en externe. Cela vous ne vous fera pas perdre du temps et de l'argent à configurer et maintenir votre propre instance IPT, et vous devriez être en mesure de recevoir du support du service d'assistance dans votre propre langue, à condition que l'hôte de données le fournisse. Bien que de nombreux arrangements d'hébergement existent, les organisations choisissent normalement de travailler avec un hébergeur de données qui partage un lien institutionnel, national, régional ou thématique.

Si votre pays est déjà un Participant GBIF, la première option à considérer est de savoir si le nœud national GBIF offre une solution d'hébergement de données. L'hébergement de vos données par votre nœud national facilite la collecte de données d'intérêt national, vous permet de vous connecter à un réseau local de fournisseurs de données et vous fournit un accès à l'assistance proposé par votre nœud.

Pour les cas où l'hébergement des données n'est pas disponible à partir d'un nœud national, le GBIF a une liste de centres d'hébergement de données fiable ****. Ces hébergeurs de données répondent à un ensemble de critères stricts qui incluent

  • Maintenir et administrer de manière constance un IPT en ligne
  • Démontrer un parcours d'hébergement des données efficace et réussi
  • Répondre aux demandes assistance de manière rapide et bien informée.

Le GBIF recommande fortement d'utiliser un centre d'hébergement de confiance qui peut vous créer un compte sur leur IPT, ce qui vous permettra de gérer et de publier vos propres jeux de données via GBIF.org.

Une dernière option est que le GBIF lui-même héberge des données à l'aide d'une plateforme de publication hébergée sur le cloud. Le Secrétariat du GBIF maintient des installations IPT hébergées sur le cloud, p.ex. pour le programme BID, mettant à la disposition des fournisseurs un hébergement de données en utilisant du matériel, des logiciels et des services de stockage partagés. Les utilisateurs du service reçoivent une solution d'hébergement de données robuste et sans coût qui est facile à migrer vers une installation auto-hébergée dans le futur. Cependant, les nœuds nationaux et les centres d'hébergement de données sont susceptibles de fournir davantage de services et d'assistance pratiques pour la publication des données et le contrôle de la qualité. En conséquence, les fournisseurs de données ne devraient normalement utiliser l'IPT de GBIF hébergé sur le cloud que s'ils ne sont pas en mesure de trouver une solution satisfaisante parmi les autres options d'hébergement.


Introduction à l'IPT : Outil de Publication Intégré (Integrated Publishing Toolkit)

L'IPT est un logiciel libre développé et soutenu par le Secrétariat du GBIF que les organisations du monde entier utilisent pour publier et partager des jeux de données sur la biodiversité via le réseau GBIF. L'IPT peut également fonctionner comme dépôt pour les données référencées dans un article, comme dans cet exemple d'une installation IPT hébergée par le réseau Canadensys.

En savoir plus sur les exigences techniques pour l'hébergement d'un IPT

Mode test

L'IPT peut être installé en mode test, ce qui signifie que ses ressources hébergées ne seront pas indexées ou accessibles au public en effectuant une recherche sur GBIF.org. Si vous décidez d'installer votre propre IPT, GBIF vous recommande d'essayer d'abord le mode test afin de comprendre le processus d'inscription. Le mode test est conçu pour évaluer l'IPT ou l'utiliser dans un contexte de formation. Les inscriptions réalisées en mode test seront dirigées auprès d'un registre GBIF de test et les données ne seront jamais indexées.

Une fois que vous êtes sûr que l'IPT fonctionne comme vous le souhaitez, vous devrez réinstaller le logiciel en mode Production pour que les données puissent être découvertes via le GBIF. Le mode production enregistre les jeux de données et les publie afin qu'ils soient indexés et accessibles publiquement via GBIF.org.

L'instance IPT et son organisation associée doivent tous deux être enregistrés auprès du GBIF. Si votre organisation n'est pas encore enregistrée, il vous sera demandé de compléter cette étape et de fournir des informations de base via un court formulaire dans l'IPT. Apprenez en plus sur comment cela fonctionne dans le Manuel de l'Utilisateur de l'IPT


Conditions d'utilisation

L'utilisation d'un hébergeur de données externe par un fournisseur de données devrait être négociée entre les parties concernées, idéalement avec un accord de service qui décrit les conditions et les obligations à la fois pour le fournisseur de données et l'hébergeur des données. L'utilisation de l'IPT du GBIF hébergé sur le cloud sera régie par le Contrat de Publication de Données du GBIF.