Valoriser ses données

Déposer ses données en ligne : où et comment ?

Publiées en tant que corollaire des publications ou bien distinctes de celles-ci, les données peuvent être mises en valeur par plusieurs biais : en complément des articles (via les supplementary materials lorsque les volumes sont modestes), dans des entrepôts de données ou encore sous la forme de « data papers ». Une étude conduite par l’Institut Alan Turing conclut à un taux de citation supérieur de 25 % pour les publications incluant un lien vers des données déposées au sein d’un entrepôt. 

Il existe de nombreux entrepôts de données généralistes (comme Zenodo), nationaux, institutionnels ou thématiques.

En France, l’entrepôt pluridisciplinaire Recherche Data Gouv permet aux chercheurs de déposer leurs jeux de données. Recherche Data Gouv offre une modération garantissant une qualité dans la description des données, ce qui facilite leur réutilisabilité.

Il est généralement recommandé de privilégier un entrepôt disciplinaire ou thématique, reconnu dans sa communauté.
Nous vous proposons ci-dessous un recensement des entrepôts capables d’accueillir des données en chimie et en physique. Le choix à opérer dépend de plusieurs critères, qui sont à la discrétion des chercheurs :

  • Vos données peuvent-elles être publiées sans contrainte ou doivent-elles au contraire être accessibles au cas par cas, voire placées sous embargo ?
  • Souhaitez-vous que vos données soient modérées afin que la qualité des métadonnées renseignées soit vérifiée ? Que l’entrepôt soit certifié ?
  • Acceptez-vous que l’entrepôt soit adossé à un éditeur privé ?
  • Souhaitez-vous lier les données déposées avec vos publications ?

Pour aider les équipes de recherche à identifier un entrepôt dans leur discipline, le collège des Données de la recherche du Comité Science Ouverte propose une méthode d’identification des entrepôts thématiques de confiance, ainsi qu’une première liste d’entrepôts découlant de la grille des critères d’analyse.

Cette liste est évolutive, non exhaustive et a vocation à être progressivement complétée par le collège des Données de la Recherche. Elle est accessible ici et sur la page “Entrepôts de confiance” du portail Recherche Data Gouv.

Si il n’existe pas d’entrepôt disciplinaire approprié, il est recommandé de déposer les jeux de données via l’entrepôt national Recherche Data Gouv.

BindingDB

Catalysis-Hub

Chemotion-repository

ChemSpider

EELS Data Base

IMEx Consortium

ioChem-BD

Materials Cloud Archive

Nanomaterial Registry (NanoHub)

National Centers for Environmental Information (NCEI)

NMRshiftDB

nmrXiv

Open Reaction Database

PANGAEA

StrendaDB

SupraBank

VAMDC Consortium