Bulletin de veille – Mars 2023
L’actualité dans vos domaines
Trois quarts des publications en physique et astronomie sont en accès ouvert. C’est la conclusion de la dernière édition du baromètre de la science ouverte. Au total, 67 % des 160 400 publications scientifiques françaises parues en 2021 sont en accès ouvert en décembre 2022. Les mathématiques, la biologie, la physique et l’astronomie caracolent en tête. La chimie occupe une position intermédiaire, à 71%, enregistrant une progression de presque 4 points depuis l’année dernière. Trois nouveautés sont disponibles dans cette troisième édition : les taux d’ouverture des codes sources et logiciels, des données de la recherche et des thèses de doctorat. Comme pour les publications, le taux d’ouverture des thèses varie considérablement selon les disciplines : 87% pour les thèses de physique contre 58% pour celles de chimie.
Partager les données avec les Data Commons. Les plateformes logicielles appelées « data commons » sont des plateformes cloud dotées d’une structure de gouvernance qui permet à une communauté de gérer, d’analyser et de partager ses données. Dans un article publié sur Scientific Data, une équipe de chercheurs discute du rôle ces plateformes dans le soutien du quatrième paradigme de la science c’est à dire : le partage des données et leur réanalyse dans des contextes différents, avec des objectifs différents et en conjonction avec d’autres jeux de données afin de créer de nouvelles hypothèses et de nouvelles découvertes scientifiques. Plus précisément, ils mettent en évidence 10 points importants de l’utilisation de ces plateformes et ils évoquent également certaines différences entre les data commons et les entrepôts de données.
Une architecture pour le traitement et le partage de données en neurosciences. Cet article présente l’architecture modulaire de traitement des données et la base de données (Alyx) développées dans le cadre du projet International Brain Laboratory. Ces outils permettent de relier la gestion des prélèvements et les métadonnées descriptives associées, le cahier de laboratoire électronique et les notes liées aux expériences ainsi que les fichiers de données. Dans un contexte de collaboration à grande échelle, l’extraction, la gestion et le partage des données en sont facilités.
Nouvelle ontologie en science des matériaux. De nombreux outils destinés à faciliter l’échange et le partage de données computationnelles en science des matériaux ont récemment été développés : plateforme NOMAD (Novel Materials Discovery), MDO (Materials design ontology), ou encore infrastructure Kadi4Mat (associant les fonctionnalités d’un cahier de laboratoire et d’un entrepôt de données). Pour planifier et analyser des expériences, les documenter et faciliter l’interprétation des résultats dans des contextes de partage de données, il est important de disposer d’informations précises sur les équipements de microscopie utilisés, sur leurs propriétés et leur paramétrage. C’est pour cette raison que l’ontologie MSLE décrite dans cet article a été développée.
Un regard positif sur les résultats négatifs. Les résultats négatifs sont souvent négligés : résultats moins cités, moins visibles, voire dissimulés ou “HARKés”(HARK : Hypothesizing After the Results are Known, une pratique contestée de reformulation d’hypothèses après analyse des résultats). Cet article illustre, à partir d’exemples issus du domaine biomédical, les enjeux scientifiques liés à leur publication.
Partenariat Figshare et Nature Publishing Groupe. Nature Photonics devient la 22e revue du groupe Nature à intégrer, dès la soumission d’un article, la possibilité de déposer des données dans l’entrepôt Figshare (également utilisé par d’autres éditeurs). Les données téléchargées sur Figshare et utilisées dans le cadre du peer-review, restent privées jusqu’à la publication. Pour l’instant, comme le précise l’éditeur, les auteurs sont libres d’utiliser ou non cette nouvelle fonctionnalité.
Institutions
Les politiques open access européennes comparées. Basée sur l’analyse de près de 50 documents présentant les politiques de science ouverte d’organismes privés et publics dans plusieurs pays européens (Royaume-Uni, France, Allemagne, Suède, Espagne, Italie, Pays-Bas) cette étude compare ces politiques selon trois principaux thèmes (Open input/data, open process, open output). Les auteurs en appellent à la mise en place d’un cadre international pour la politique de science ouverte et à un renforcement de la politique européenne par l’identification de leviers pertinents.
Les agences de financement renforcent leurs exigences en matière de Science Ouverte. Collaboration à la stratégie de non cession des droits, soutien à l’accès ouvert diamant, déploiement de plans de gestion de données structurés communs, prise en compte des travaux de la coalition CoARA : voici quelques-unes des actions sur lesquelles l’ANR, l’ADEME, l’ANSES, l’Institut National du Cancer et l’ANRS Maladies infectieuses vont s’investir en 2023. Ces engagements sont présentés ici.
Le bilan 2022 de la Coalition S. La coalition S, qui a accueilli en 2022 deux nouveaux membres (Swiss National Science Foundation (SNSF) et l’Australiaʼs National Health and Medical Research Council (NHMRC)) présente son bilan 2022. Sur l’année, le pourcentage d’articles en OA dans le cadre du financement de la coalition est passé à 83 %. L’impact des accords transformants sur les modalités d’ouverture des publications est notable. Parmi les perspectives esquissées pour 2023, la Coalition souhaite continuer à favoriser les modèles de publications innovants, notamment les pre-prints évalués par les pairs. A cet égard, la stratégie de non cession des droits est plus que jamais une priorité pour la coalition : l’enjeu est de proposer un droit de publication secondaire au niveau de l’Europe par exemple via l’octroi de licences statutaires, et des propositions de clauses obligatoires pour les accords d’édition scientifique. Plus d’éléments ici et ici.
Lancement du 3e appel national “Atelier de la donnée”. Le 3e appel à manifestation d’intérêt pour devenir “atelier de la donnée” a été ouvert le 15 mars aux établissements. Rappelons que l’objectif des ateliers est de proposer aux chercheurs un accompagnement de proximité et des services sur tout le cycle de vie de la donnée. Déjà 15 établissements sont labellisés ou sont en voie de labellisation. Aux côtés des centres de ressources et des centres de référence thématiques, les ateliers s’inscrivent dans l’écosystème national de Recherche Data Gouv “au service du partage et de l’ouverture des données de recherche”. Les missions et des exemples de services pour les chercheurs sont détaillés dans le texte de l’appel. Les prochaines étapes pour le développement de cet écosystème sont synthétisées sur ce pdf.
Rapport d’activité du CCSD. Le CCSD publie son rapport d’activité 2022. Quelques chiffres ressortent : pas moins de 137 448 documents ont été déposés en texte intégral dans HAL dont le chiffre de consultations atteint plus de 117 millions. Le CCSD revient sur deux réalisations majeures : l’évolution du formulaire de dépôt et de manière plus générale la révision de l’ergonomie des interfaces d’une part, la création du réseau des ambassadeurs HAL pour renforcer l’accompagnement dans HAL d’autre part. Un point d’étape est fait sur le projet Esuipex + Haliance, fondamental pour enrichir HAL (liens publications et données) et favoriser le dépôt du texte intégral, via la collecte automatique de publications : sa mise en œuvre opérationnelle commence cette année. L’ensemble du rapport est à lire ici.
Études et enquêtes
Participer à l’enquête sur l’usage d’un catalogue des logiciels de l’ESR. Cette enquête, proposée par le collège codes source et logiciels du COmité pour la Science Ouverte (COSO), vise à caractériser les attendus concernant un catalogue des logiciels de l’enseignement supérieur et de la recherche. L’enquête, qui prend entre 10 à 20 mn, est accessible ici jusqu’au 3 avril.
Participer à l’enquête sur les métiers de la donnée. Le Ministère de l’Enseignement Supérieur et de la Recherche lance une enquête destinée à identifier et valoriser les métiers et les compétences associées à la gestion des données, tout au long de leur cycle de vie. Elle s’adresse aux chercheurs, enseignants-chercheurs, personnels d’appui à la recherche et administratifs. Le questionnaire est ouvert jusqu’au 8 avril.
Quelle conformité des entrepôts aux exigences d’Horizon Europe ? Commanditée par l’European Research Council Executive Agency (ERCEA), cette étude analyse 220 entrepôts de données, avec pour objectif d’identifier des entrepôts de confiance (trusted repositories) et d’éprouver leur compatibilité avec les exigences d’Horizon Europe en matière de science ouverte. Elle illustre les difficultés de cet exercice d’évaluation et de comparaison et révèle notamment la faible conformité des entrepôts quant aux exigences en termes de métadonnées. La grille d’analyse qui accompagne le rapport constitue une aide à la sélection d’entrepôts et sera mise à jour au cours du dernier semestre 2023, comme le précise ce billet.
Guides et ressources
Nouvelles ressources DoRANum. En mars, la plateforme de formation DoRANum s’enrichit de 3 nouvelles ressources. La première ressource sur la thématique Data papers : Quand ? Comment ? Pourquoi ? revient sur les webinaires du GTSO Données du consortium Couperin et traite des mécanismes de publication d’un data paper, au travers de 3 interventions, sous forme de retours d’expérience. La deuxième ressource, sur la thématique Le Plan de Gestion de Données pas à pas, est un guide pour mieux comprendre l’intérêt d’un PGD, connaître les modèles de PGD existants, anticiper les coûts liés à la gestion des données. Enfin, la dernière ressource, titrée Faire entrer la science ouverte dans son projet ANR : un guide pratique, a pour but d’accompagner les chercheurs, porteurs de projets ANR, dans la prise en compte des enjeux de la science ouverte dans la phase de montage de leur projet.
Collaboration entre Oracle for Research et Research Data Alliance. Après l’annonce de la collaboration entre RDA et Oracle for Research faite il y a environ un mois, Hilary Hanahoe, secrétaire général de Recherche Data Alliance, propose un podcast intitulé « Making Open Science and Open Data the new normal ». Comment les données et la science ouverte sont encouragées et soutenues dans la communauté mondiale de la recherche, quels sont les principaux défis et avantages, et comment les acteurs de l’industrie comme Oracle for Research contribuent à la mise en œuvre de l’Open Data et de l’Open Science sont les questions abordées dans ce podcast.
Un cours en ligne sur la recherche reproductible. Il est en encore temps de s’inscrire et de suivre le cours du MOOC proposé par l’INRIA et consacré à la recherche reproductible. Ce Mooc propose des principes méthodologiques pour une science ouverte et transparente. Il aborde de manière pratique la prise de notes, le document computationnel, la réplicabilité des analyses. Il est possible de s’inscrire jusqu’au 27 décembre.
Séries « Passeport : initiation à la science ouverte ». Diffusées sur la chaine CanalU, la série « Passeport : initiation à la science ouverte » propose cinq capsules vidéo illustrées par des témoignages de jeunes chercheurs : qu’est-ce que c’est la science ouverte, des ressources ouvertes à découvrir, la gestion des données et le cycle de vie des données, la thèse en accès ouvert, la diffusion des travaux scientifiques en accès ouvert. Cette série illustre les contenus du Passeport pour la science ouverte.
DOAJ : identifier facilement les revues pour lesquelles les auteurs conservent leurs droits. Le répertoire Directory of Open Access Journals (DOAJ) propose un nouveau service : grâce à un filtre, il est désormais facile de repérer les revues qui autorisent les auteurs de conserver leurs droits, ce qui leur permet, par exemple, de déposer leur article dans une archive ouverte de manière immédiate. Il s’agit de revues en libre accès qui ne demandent pas de frais de publication (APC). Quelques chiffres : on compte 7154 revues pour lesquelles l’auteur ne paie pas de frais et conserve tous ses droits et parmi elles, 3400 revues où les articles sont publiés sous licence CC BY.
Commentaires