Bulletin de veille – Juin et Juillet 2023
L’actualité dans vos domaines
PANGAEA, “Data Publisher for Earth & Environmental Science”. Un article publié dans Scientific Data présente de manière très complète PANGAEA, entrepôt en sciences de l’environnement, diffusant des données d’observation et d’expérimentation géo-localisées. Cet entrepôt a obtenu le score le plus élevé en termes de critères FAIR lors de l’évaluation par la Commission Européenne. Certifié entrepôt de confiance par CoreTrustSeal, il fait la part belle à la citabilité, aux métadonnées et aux descriptions riches, à l’interopérabilité. Il utilise les standards et thesaurus propres à la communauté et assure une curation des données de grande qualité. De nombreux guides et wiki permettent aux chercheurs de s’approprier les bonnes pratiques pour la description et la diffusion des données. L’engagement des institutions hôtes (Alfred Wegener Institute, Helmholtz Center for Polar and Marine Research et Center for Marine Environmental Sciences) garantit la reproductibilité et l’utilisabilité à long terme des données diffusées.
Principes pour une science informatique éco-soutenable. Dans un article publié sur la revue Nature Computational Science, un équipe de chercheurs anglais a proposé les principes GREENER pour favoriser la science informatique éco-soutenable. Governance, Responsability, Estimation, Energy and embodied impacts, New collaborations, Education, Research sont les principes qui permettent un changement culturel qui, à son tour, facilitera leur mise en œuvre et déclenche un cercle vertueux.
Gestion des stocks dans un laboratoire. Deux chercheuses en biologie cellulaire proposent dans la revue Nature une méthodologie pour inventorier et suivre l’approvisionnement du matériel disponible. Il s’agit de prendre en compte différents aspects : définition des besoins, mise en œuvre du système et du suivi. Leur propre outil prend la forme d’un simple tableur.
CMDL : Markdown pour la chimie. Une équipe du centre de recherche d’IBM a développé CMDL, un langage destiné à faciliter la représentation des données intégrant les spécificités des polymères, telle la stochasticité, et la documentation des expériences. Dans cet article, les auteurs présentent plusieurs exemples d’utilisation reposant sur des outils développés par IBM (IBM Materials notebook).
Imperial College : deux outils au service de la gestion des données de chimie. Cet article présente les deux outils (un portail/ELN et un entrepôt de données) développés à Imperial College au cours des vingt dernières années pour faciliter la gestion des données en chimie. Utilisés à des fins pédagogiques et de recherche, ces outils ont progressivement intégré des identifiants (DOI, ORCID), des métadonnées enrichies. L’histoire de ces outils est illustrée par de nombreux exemples d’utilisation (workflow, expériences pour l’enseignement ou la recherche).
Vers une catalyse numérique. Un article d’Angewandte Chemie Intl ed. propose une synthèse des défis auxquels la recherche en catalyse est confrontée. La complexité des réactions et la variabilité des conditions expérimentales rendent d’autant plus nécessaires, selon les auteurs, l’automatisation et le recours à des Standard Operating Procedures, à des cahiers de laboratoire favorisant le recueil automatisé de données et de métadonnées de qualité. Les auteurs en appellent à la communauté scientifique pour travailler au développement de standards, de solutions IT et d’entrepôts facilitant le partage et la réutilisation des données. L’article comporte de nombreux exemples abordant les spécificités de différents types de données : données de synthèse, analyses physico-chimiques, analyses fonctionnelles, données computationnelles.
Édition scientifique
Environmental Research: Food Systems. IOP Publishing édite une nouvelle revue en libre accès en sciences de l’environnement : Environmental Research: Food Systems. Cette revue interdisciplinaire se propose de travailler sur la sécurité alimentaire mondiale de manière durable, conformément aux objectifs de développement durable des Nations Unies. Aucun APC ne sera réclamé pour les articles soumis au journal avant 2025. Il est recommandé aux auteurs de partager les données et le code associés aux articles publiés.
Retour du plan S sur les “transformative journals”. Le modèle “Transformative Journal (TJ)” est l’une des stratégies de la cOAlition S pour aider les éditeurs à passer immédiatement et intégralement au libre accès dans un délai contraint ; l’objectif est d’augmenter annuellement la proportion de contenu en libre accès d’au moins 15 %. Les données 2022 montrent que 26 titres (1%) ont basculé en libre accès intégral à partir du 1er janvier 2023, 695 titres (30%) ont atteint ou dépassé leurs objectifs de croissance OA. 1589 titres (68%) n’ont pas atteint leurs objectifs de croissance de l’OA et seront donc retirés du programme TJ. On peut relever que 77 % des titres publiés par Springer Nature n’ont pas atteint leurs objectifs, 63% pour Elsevier et 56% pour l’American Chemical Society.
Transparence des coûts éditoriaux. Six titres de la Société des Mathématiques Appliquées et Industrielles (SMAI) sont publiés par EDP-Sciences selon le modèle Subscribe to Open. Ce programme, lancé il y a 4 ans, a reçu le soutien financier du CNRS, du FNSO et du consortium Couperin. Le rapport de transparence 2023 publié par l’éditeur dévoile notamment le coût moyen de production d’un article (entre 600 et 1200 € selon les titres) et détaille sa structure de coût.
Quelle collaboration entre éditeurs et institutions pour le traitement de la fraude ? Trois universités américaines (Ohio State, Northwestern, et George Washington) ont coordonné un groupe de travail associant des éditeurs afin de proposer des modalités de collaboration dans le traitement des questions de fraude et de plagiat. Si les données sont souvent au centre de ces pratiques, un éditeur doit-il alerter l’institution concernée ? Peut-on attendre qu’une institution ait instruit une situation de fraude pour informer la communauté scientifique ? Des pistes d’amélioration de la collaboration sont esquissées dans cet article publié dans une revue de JAMA Network Open.
Reproductibilité du code : les défis à relever selon le Journal of Cheminformatics. Selon la politique de la revue, les jeux de données, codes et algorithmes nécessaires à la validation des résultats publiés doivent être fournis dans les supplementary materials. Or, comme le souligne cet article, ces fichiers sont souvent insuffisants. Code partiellement mis à disposition sans information sur le workflow ou la licence associés, sans modalité d’installation standardisée (via pip par exemple en python) ou documentation appropriée (tel Sphinx pour Python), sans respect de guidelines garantissant une standardisation code (comme black pour python) : autant de freins à la reproductibilité et à la réutilisation.
Institutions
CNRS et Recherche Data Gouv. Depuis juin 2023, les communautés scientifiques du CNRS qui ne disposent pas encore d’un entrepôt thématique bien identifié et de confiance peuvent déposer leurs données de recherche sur le nouvel espace institutionnel CNRS Research Data au sein de la plateforme nationale Recherche Data Gouv.
Udice soutient la stratégie de non cession des droits. A l’instar de nombreux organismes comme le CNRS, les universités du groupe Udice (Sorbonne Université, PSL, Paris-Saclay, Université Paris Cité, Lyon1, Aix Marseille Université, Université Grenoble Alpes, Université de Bordeaux, Université de Strasbourg, Université Côte d’Azur) se positionnent en faveur de la stratégie de non cession de droits mise en oeuvre par la coalition S. Udice encourage ses communautés de recherche à ne pas céder l’exclusivité de leurs droits et se félicite de l’adoption récente, par le Conseil de l’Union européenne, d’un texte en faveur d’une publication savante de qualité, transparente, ouverte, digne de confiance et équitable. Rappelons qu’un guide est disponible sur le site Ouvrir la science. Pour aider la communauté scientifique à s’approprier cette stratégie, Udice organise un webinaire d’information le 26 septembre 2023. Tous les détails sont à découvrir ici.
Le futur de la recherche européenne. Les travaux de préfiguration du Framework program (FP10) qui remplacera Horizon Europe en 2028 ont débuté. Suite au symposium qui a rassemblé les six principaux organismes de recherche européens en avril dernier, un white paper sur L’avenir de l’Europe de la recherche a été élaboré. Il identifie 7 axes politiques clés et recommandations qui seront soumis à la Direction Générale Recherche et Innovation de la Commission Européenne.
Études et enquêtes
Signature et horodatage des ELN (Electronic Laboratory Notebooks) à l’Université de Lorraine. L’université de Lorraine a mis en place en avril une solution d’ELN : ElabFTW. Une enquête lancée en mai était destinée à mesurer l’usage de la signature des carnets papier et de l’horodatage de ELN. Elle a recueilli 35 réponses d’utilisateurs d’ElabFTW, réalisant en moyenne plus de 100 expériences par an. Quelques constats émergent : les carnets de laboratoire papier sont peu signés (58% des répondants ne le font pas) et encore moins contre-signés (7,5% le font). La contre-signature a surtout lieu pour les expériences des doctorants et des stagiaires et a lieu 2 ou 3 fois par an. Cette pratique est en contradiction avec les recommandations du Réseau C.U.R.I.E. Concernant l’horodatage propre aux ELN, 63% pensent que c’est aux auteurs de l’expérience eux-mêmes d’assurer cet horodatage. Pour la moitié des répondants, une expérience doit être horodatée uniquement lorsqu’elle est terminée, que le résultat soit positif ou négatif.
La Science ouverte dans la revue Culture & Recherche. La revue Culture & Recherche, qui porte sur la recherche au ministère de la Culture, met à l’honneur la science ouverte dans son numéro 144 (printemps-été 2023). La problématique de « Faire science par, avec et pour la société » est abordée sous trois angles différents : un environnement multidisciplinaire, fédéré et ouvert, un bien commun : stocker pour capitaliser, de nouveaux modes de transmission et de diffusion. Les articles abordent notamment l’édition scientifique ouverte, la fouille de texte, l’ouverture des données à la Bibliothèque nationale de France et plus généralement dans le domaine de la culture avec de nombreux retours d’expérience. Le numéro complet est à découvrir ici.
Accords Couperin et APC. Le consortium Couperin, qui négocie au niveau national avec la plupart des éditeurs scientifiques, publie les résultats d’une enquête menée en octobre 2022 sur les clauses science ouverte des accords Couperin et sur les politiques des établissements sur les APC. Sur les 330 adhérents au consortium, 60 établissements ont répondu. La moitié des répondants sont dotés d’une politique concernant les APC. Ces politiques visent à accompagner les chercheurs dans le processus de publication, à recommander la publication en open access, à maîtriser les coûts des APC. Quelques établissements expriment un positionnement défavorable au paiement d’APC. 82% des répondants n’ont pas créé ou n’envisagent pas de créer un fonds institutionnel pour le paiement des APC. Les ⅔ sont favorables aux accords transformants signés dans le cadre du consortium sous réserve qu’ils n’augmentent pas les coûts. Les résultats complets sont accessibles ici.
Le modèle Diamant outre-Rhin. Une équipe de l’université de Bielfeld publie une étude sur le modèle d’accès ouvert diamant en Allemagne. Vingt éditeurs sont interrogés sur le modèle économique de leur revue (la monétisation de certaines tâches, le degré de division du travail, la taille des équipes). Les auteurs proposent une typologie des revues permettant de souligner les fragilités financières et managériales de certaines revues, la discontinuité de certaines publications et le dynamisme potentiel de ce modèle.
Guides et ressources
netCDF, format de fichier interopérable pour la science ouverte. Le nouveau parcours pédagogique de DoRANum est dédié à ce type de format de fichier. netCDF permet la gestion de données scientifiques stockées sous la forme de tableaux et il est largement utilisé en océanographie et en météorologie pour stocker des variables, telles que la température, la pression, la vitesse du vent et la hauteur des vagues. Vous pouvez trouver plus d’informations sur le format netCDF sur la page Datacc : Les formats standards en physique.
Toutes les données peuvent–elles être partagées ? Quelles sont les exceptions et les restrictions à la diffusion des données ? Une courte vidéo de moins de 3 minutes sur le canal Callisto explique quels types de données ne peuvent pas être partagées et diffusées car protégées par un droit spécifique.
Ressources du Printemps de la donnée. L’événement s’est terminé le 20 juin et les vidéos des deux interventions de la journée d’ouverture sont déjà disponibles sur la chaîne Canal-U Printemps de la donnée : Sémiologie graphique et visualisation des données : la façon de représenter les données peut grandement faciliter notre compréhension par Eric Mauvière; La disponibilité juridique des données de la recherche : pistes et schémas d’analyse par Agnès Robin.
Un nouvel outil pour les revues en libre accès. Afin de promouvoir la transparence, l’accessibilité et l’inclusivité dans l’édition scientifique, l’Open Access Scholarly Publishing Association (OASPA) et le Directory of Open Access Journals (DOAJ) lancent Open Access Journals Toolkit. L’outil fournit des indications aux revues en libre accès, nouvelles ou établies, afin qu’elles puissent s’orienter dans le paysage de l’édition scientifique, qui évolue rapidement. Quelques fonctionnalités de l’outil : un site web convivial et accessible, avec une navigation et une fonctionnalité de recherche faciles, conforme aux lignes directrices du W3C en matière d’accessibilité au web ; une collection de ressources sélectionnées ; disponible en plusieurs langues, la version française sera lancée prochainement. Plus de détails sont à découvrir ici.
RESeau INTégrité Scientifique : un nouveau manuel. L’association RESeau INTégrité Scientifique (RESINT) publie un nouveau manuel de procédures. Ce manuel aborde en détail l’instruction des manquements à l’intégrité scientifique, les droits des protagonistes ainsi que la procédure de médiation.
La fouille de texte à l’honneur. Deux webinaires sur le sujet ont été diffusés ce mois-ci et sont disponibles en replay. Le GTSO Données de Couperin a organisé «Text and data mining : explorons les cités enfouies !». Les trois intervenants ont rappelé le contexte juridique en pleine évolution et présenté deux projets de recherche fondés sur la fouille de texte. Le support consacré aux éléments juridiques est accessible sur Zenodo. L’Inist a proposé une «Découverte du TDM». Les présentations détaillent les objectifs et méthodes et donnent de nombreux exemples.
Rétractation : symptôme d’une science malade de ses classements ? Ivan Oransky cofondateur de Retraction Watch est intervenu dans le cadre d’une série de conférences (Reproducibility Rounds) organisés par la Stanford School of medecine pour favoriser les pratiques de reproductibilité et de rigueur scientifique dans le cadre du programme SPORR (Stanford Program on Research Rigor & Reproducibility). Il présente le système d’incitation reposant sur les classements internationaux et les modalités d’évaluation des chercheurs et leur impact sur les pratiques scientifiques (self citation, citation stacking, fraude, recours à des paper mills…) et l’édition scientifique (éditeurs prédateurs, inflation des special issues), à partir d’exemples internationaux et de pratiques régulièrement pointées par Retraction Watch
Quelles métadonnées et curation pour les logiciels de recherche ? Ce webinaire organisé par le consortium FAIR-IMPACT (dont les principales actions ont été présentées lors des journées EOS-France) a permis de proposer les recommandations élaborées dans le cadre du groupe FAIR-IMPACT « Standard metadata for research software ». Plusieurs initiatives, projets ou vocabulaires ont également été évoqués : les piliers EOSC SIRIS (Scholarly infrastructures for research software), codemeta, ou encore recommandations de Software Heritage sur l’archivage.
Commentaires