Adopter un plan de gestion des données

Ce qu’exigent les financeurs

Sommaire

Les exigences européennes :

Le programme Horizon Europe

Dans le cadre de sa politique science ouverte, Horizon Europe recommande pour les projets financés :

  • l’accès immédiat (sans embargo), aux publications scientifiques et aux données de recherche et l’application de licences ouvertes
  • la rédaction d’un plan de gestion des données mettant en œuvre les principes FAIR
  • l’application pour la diffusion des données du principe “aussi ouvert que possible, aussi fermé que nécessaire”, notamment pour les données nécessaires pour valider les conclusions des publications.

« FAIR (Findable, Accessible, Interoperable and Re-usable data) and open data sharing should become the default for the results of EU-funded scientific research. »

Les coûts de gestion des données pourront être éligibles à financement. Par contre les frais de publication d’articles dans les revues non intégralement en accès ouvert ne seront plus pris en charge.

La science ouverte sera désormais prise en compte dans les critères d’évaluation des projets soumis et dans les indicateurs de bilan.

Un guide sur OpenAire permet aux chercheurs d’appliquer les exigences d’Horizon Europe sur la gestion des données

Le programme H2020

L’adoption d’un plan de gestion des données, préalable à l’ouverture des données scientifiques lorsque les conditions sont réunies, a d’abord été cantonnée à quelques domaines soutenus par le programme H2020, avant d’être étendue à tous les projets à partir de 2017.
Tout bénéficiaire d’un financement H2020 doit donc désormais présenter un plan de gestion des données (en voici un modèle) dans les six mois suivant le démarrage du projet. Il doit être mis à jour au fur et à mesure, en fonction des décisions entérinées (dépôt de brevet, ajout de nouveaux partenaires etc.). Lorsqu’aucun motif valable ne s’y oppose (propriété intellectuelle, secret défense etc.), les données doivent être mises à disposition, surtout lorsque celles-ci “valident les résultats présentés dans des publications scientifiques”. 

Ces exigences s’appliquent également aux chercheurs lauréats des bourses octroyées par l’ERC (European Research Council), qui représente un pilier important du programme H2020 (17% du budget total). L’ERC a mis au point son propre canevas de PGD, disponible ici

Les coûts liés à l’ouverture des données, y compris ceux générés par la mise en place d’un plan de gestion, sont éligibles aux financements H2020. Deux licences de diffusion sont recommandées (CC0 et CC-BY), lesquelles renvoient à une conception très large de la réutilisation des données, couvrant les usages à but commercial. Ce choix découle de la vision selon laquelle la science ouverte serait un levier d’innovation pour le secteur privé.

Conservation des données

Il n’existe pas de directives précises sur la durée de conservation des données après la fin des projets. Dans le projet Magenta, soutenu par H2020 et porté par 10 institutions, dont le CEA, le choix a été fait d’utiliser Zenodo comme instance de conservation de long terme des données issues du projet. 

Zenodo n’a pas été conçu comme une instance d’archivage capable d’assurer la lisibilité des données dans le temps. Pour plus d’informations sur la conservation des données, consultez ces articles

ANR

Dans le cadre de sa politique science ouverte, l’Agence nationale de la recherche (ANR) demande l’élaboration d’un Plan de Gestion des Données (PGD) pour les projets financés à partir de 2019. 

Son adoption est régie par la même logique que pour les projets européens : le document doit être fourni dans les 6 mois qui suivent le démarrage scientifique du projet. Pour les projets de plus de 30 mois, il devra être mis à jour régulièrement et présenté en trois versions différentes. 

Le lancement du portail DMP OPIDoR facilite la rédaction des plans de gestion de données en tant qu’outil collaboratif. Pour plus d’informations, consultez cet article.

Le modèle proposé par l’ANR sert de guide, mais il n’est pas obligatoire. Utiliser un autre modèle, issu de son établissement ou d’un partenaire, reste une option tout à fait valable.

A ce stade, les plans de gestion de données ne constituent pas un critère incontournable de sélection ou de soutien aux différents projets. Ils représentent néanmoins un livrable et pourrait conditionner le versement des 10 % du montant de la subvention restant à verser à la fin du projet. Dans sa foire aux questions, l’ANR indique que l’ouverture des données n’est pas une obligation.

Financement des coûts de gestion des données

Le coût du stockage et de la gestion des données est éligible à financement jusqu’à 5 ans après la clôture du projet. Si ces coûts sont éligibles, ils ne peuvent en revanche pas faire l’objet d’une rallonge budgétaire.

Pour rappe, il est possible d’anticiper le coût induit par la gestion des données à court et long terme (cet aspect peut être intégré à une demande de financement de type ANR). Plusieurs outils permettent d’évaluer ces coûts.

  • Data Management costing tool (université de Delft) : cet outil se présente sous la forme d’une check list détaillant les coûts possibles aux différentes étapes du cycle de vie des données (collecte, nettoyage, etc.). Il s’inspire du guide proposé par UK Data Service.
  • EPFL Library Cost Calculator for Data Management : cet outil de calcul prend en compte les coûts d’infrastructures (serveur de stockage, cahiers de laboratoire électroniques, bases de données, entrepôts de données, archivage à long terme, etc) sur toute la durée du projet.

Autres agences de financement en France

Aux côtés de l’ANR, le réseau des agences de financement de la recherche en France ont publié une feuille de route 2023 pour la science ouverte.

  • Elles recommandent donc l’accès ouvert immédiat, avec la licence CC-BY, aux publications issues des projets qu’elles financent.
  • Elles s’engagent à collaborer à la mise en œuvre de la stratégie de non cession des droits. Elles prévoient de déployer un modèle commun de plan de gestion des données structuré, via DMP OPIDoR.
  • Elles encouragent l’adoption d’un ORCID par les chercheurs, notamment dans le cadre du déploiement du portail appelprojetsrecherche.fr
  • Elles participeront aux réflexions de la Coalition for Advancing Research Assessment (CoARA)

Ces dispositions concernent l’Agence de la transition écologique (ADEME), l’ANRS|Maladies infectieuses émergentes (ANRS-MIE), l’Agence nationale de sécurité sanitaire de l’alimentation, de l’environnement et du travail (Anses), l’Institut national du cancer (INCa).

Fonds national de la recherche suisse

Depuis octobre 2017, la fourniture d’un plan de gestion des données est obligatoire pour les porteurs de projets approuvés. Il conditionne le versement des financements et peut être actualisé tout au long du projet. Sa version finale doit être mise à disposition dans la base de données P3 du FNS.
Pour aider les chercheurs, le FNS a élaboré une checklist pour identifier les entrepôts de données répondant aux principes FAIR. Dans sa déclaration de principe, le Fonds suisse demande aux chercheurs d’archiver les données exploitées dans le cadre de leur recherche, et de les partager dans des entrepôts publics de données, dans des formats accessibles et réutilisables.

Les données devant être partagées correspondent à celles qui sont « nécessaires pour reproduire les résultats publiés ». Par ailleurs, il est indiqué que la « soumission d’un DMP est une condition pour le déblocage des fonds.. » 

National Institutes of Health (NIH)

Les National Institutes of Health (NIH) financent la recherche biomédicale et liée à la santé aux Etats-Unis.

Dans ce cadre, un  « plan de partage des données » est exigé pour les projets soutenus à hauteur de 500 000 dollars minimum. Les coûts afférents (partage et archivage) doivent être indiqués dans la demande de subvention et sont éligibles au financement. La non-publication des données doit être dûment justifiée.

Les exigences sont plus strictes qu’en France : le partage des données doit se faire au plus tard au moment de l’acceptation de la publication des travaux par un éditeur et les titulaires du financement sont tenus de conserver les données pendant trois ans après la clôture du contrat. Les données d’études de grande envergure peuvent être diffusées par vagues au fur et à mesure de leur disponibilité ou de leur publication.

Depuis le 25 janvier 2023, cet organisme durcit les conditions prévues (voir document source) :

1/ Généralisation du data sharing plan pour tous les projets et ce, dès le dépôt de la demande de financement (même si le plan n’est pas pris en compte dans la notation du projet).

2/ Evaluation du plan qui conditionne ensuite le versement des aides au fur et à mesure du projet.

3/ Très forte incitation à l’ouverture, y compris des résultats dits “négatifs” (voir document source).

Autres agences de financement à l’étranger

A l’étranger, plusieurs autres organismes de financement de la recherche ont des recommandations concernant la science ouverte :

  • Pour la Deutsche Forschungsmeinschaft (DFG) : un plan de gestion des données est obligatoire et le partage des données est recommandé.
  • Le Wellcome Trust demande un plan de gestion des résultats de recherche (PGR).

La liste des exigences des principaux financeurs est accessible sur le guide de DoraNum.

Ressources utiles

Europe
France