Bulletin de veille – Avril 2024
L’actualité dans vos domaines
Données en synthèse organique : comment combler les lacunes ? D’après les auteurs de cet article publié dans Nature Chemistry, les informations accompagnant les publications en chimie de synthèse ne permettent pas de les évaluer précisément. En cause notamment : les manques de standardisation de la description des dispositifs expérimentaux (experimental set-up) et de transparence quant aux limites de la méthodologie employée. Les auteurs identifient 5 stratégies pour combler ces lacunes (notamment, une gestion de l’information orientée vers la reproductibilité, intégrant pleinement les résultats négatifs) et 8 principes pour améliorer la gestion des données associées aux publications scientifiques.
Science des matériaux : des outils sémantiques pour des données plus FAIR. Dans le contexte de l’initiative fédérale américaine « Materials genome » (MGI) pour la mise en place d’une infrastructure fédérée de données, cet article présente l’expérience de General Electric en matière de FAIRisation des données. Il décrit les principes directeurs de leur entrepôt de données : un système de stockage fédéré, une couche sémantique (graphe de connaissance reposant sur des métadonnées descriptives riches) et un ensemble de services permettant l’accès et l’exploration des données. Deux exemples sont présentés : l’évaluation des techniques d’impression 3D et le développement de revêtements via l’intelligence artificielle.
Un top 20 des technologies reposant sur l’IA en chimie. Sur la base d’une analyse bibliométrique, ce preprint propose un classement des applications de l’intelligence artificielle en chimie, reposant sur le nombre de publications associées et l’impact potentiel de la technologie étudiée. Des jumeaux numériques, à la réalité augmentée, en passant par les plateformes automatisées ou la blockchain, cette typologie identifie des technologies variées susceptibles de présenter des applications dans de nombreux domaines (chimie de synthèse, science des matériaux, chimie pharmaceutique, toxicologie). La place centrale des données dans le développement de ces technologies est soulignée.
Développement des ontologies en chimie : quels enjeux, quelle philosophie ? Cet article, publié dans le JACS, replace le développement des ontologies en chimie dans le contexte de l’avènement de la chimie computationnelle et des principes de classification (des éléments, par exemple), fondamentaux en chimie. A partir de nombreux exemples issus de différents sous domaines de la chimie, de l’histoire des nomenclatures et des formats (IUPAC, SMILES), ou de la comparaison d’ontologies (ChEBI, ChemOnt), les auteurs défendent une approche pluraliste : la multiplication des ontologies loin d’être un problème serait une nécessité, objective et épistémologique.
PaCh : un format pour l’encodage des structures chimiques. Revenant sur les limitations des formats existants (SMILES, MDL MOL/RXN, CML), cet article présente un format réalisant un compromis entre taille des fichiers, rapidité de traitement et capacité de représentation de structures et propriétés complexes. Il décrit les modalités d’encodage des molécules et des réactions, propose un benchmark comparant les performances des différents formats d’encodage en termes de temps de traitement. Il souligne les limites de ce format pour la description d’interactions complexes et la représentation de structures en 3D.
“La science est belle quand elle est ouverte et accessible à tous et toutes” (Julien Peloton). Le portrait de Julien Peloton, ingénieur au Laboratoire de physique des deux infinis de l’Université de Paris-Saclay, commence avec cette phrase. Supporteur de la science ouverte, son travail principal est d’aider les équipes de recherche par le biais de solutions techniques adaptées à l’analyse de grands jeux de données. Il est à l’initiative du logiciel FINK, lauréat du prix science ouverte du logiciel libre 2023 dans la catégorie « Coup de cœur » du jury par le MESR. Le chercheur explique que l’ouverture des codes est absolument nécessaire mais pas n’importe comment. Ouvrir ne consiste pas seulement à rendre le code source accessible à tous et toutes : il doit aussi être facile à interpréter et à utiliser.
Science ouverte
Où diffuser les données de recherche ? Le Collège des Données de la recherche (Comité pour la science ouverte) propose une note méthodologique pour aider les communautés scientifiques à choisir l’entrepôt thématique le plus adapté pour le partage des données. Cette note est accompagnée d’une première liste de 49 entrepôts thématiques concernant différentes disciplines des STM et SHS. Cette liste est évolutive et a vocation à être progressivement complétée
Plans de gestion de données : les nouveautés de la plateforme DMP Opidor. DMP OPIDoR, outil d’accompagnement à la planification de la gestion des données de recherche mis en place par l’Inist-CNRS, propose plusieurs nouveautés :
- Une nouvelle version : mise en ligne le 9 avril, elle propose notamment une ergonomie améliorée (concernant les fonctionnalités d’import des données financeurs, le choix et l’affichage des recommandations, la gestion des produits de recherche), une aide à la description des jeux de données et des produits de recherche, un encouragement à l’utilisation d’identifiants pérennes (Orcid, ROR)
- Un nouveau modèle pour les entités de recherche, adapté aux besoins des laboratoires, des plateformes techniques, infrastructures ou unités de recherche
- Un nouveau parcours de création de plan qui permet de guider la sélection d’un modèle de PGD selon les besoins.
Soutenir la reproductibilité : quel rôle pour les institutions et organismes de recherche ? Ce rapport, publié par Knowlege Exchange (associant notamment le CNRS, le DFG, le JISC), s’appuie sur une enquête, des entretiens et des focus groups. Il souligne l’importance de l’implication des parties prenantes (agences de financement, éditeurs…) dans la mise en place de structures d’incitation et de services de soutien favorisant la reproductibilité. Il propose un ensemble d’outils, de recommandations mais également des études de cas et une grille d’évaluation à destination des institutions.
Déclaration de Barcelone sur l’information de recherche ouverte. Plus de 30 organismes de recherche internationaux (parmi lesquels l’ANR et plusieurs universités françaises) ont adopté le 16 avril la Déclaration de Barcelone sur l’information de recherche ouverte. Celle-ci met en oeuvre quatre engagements : ouverture par défaut pour les informations de recherche utilisées et produites, métadonnées ouvertes, soutien aux infrastructures d’informations ouvertes; appel à la création d’une Coalition pour l’Information de recherche ouverte (Coalition for Open Research Information).
Lancement du site de l’Open Science Monitoring Initiative. Le ministère français de l’Enseignement supérieur et de la Recherche, l’Université de Lorraine et Inria viennent de lancer le site officiel de l’Open Science Monitoring Initiative, dont la vocation est d’encourager l’adoption des principes de suivi de la science ouverte et de promouvoir leur mise en œuvre pratique.
Global Research Initiative on Open Science. Le comité pour la science ouverte fait une proposition visant à évaluer, promouvoir et mettre en œuvre de manière systématique les pratiques de la science ouverte. Publié à l’occasion de la réunion ministérielle de l’OCDE (23-24 avril 2024),le Global Research Initiative on Open Science (GRIOS) fait suite au communiqué du G7 (mai 2023) qui encourage les recherches sur la science ouverte. Parmi les actions proposées : des synthèses approfondies des recherches existantes sur la science ouverte, des recommandations de politique de science ouverte s’appuyant sur des résultats scientifiques, la création d’un programme scientifique, la mise en place d’un réseau mondial d’organisations et de chercheurs. Un accent sera mis sur les expériences des pays du Sud et des jeunes universitaires. La proposition est à lire ici.
Publication scientifique
Accord Couperin/Elsevier. Cet accord, conclu pour la période 2024-2027, couvre la lecture et la publication en accès ouvert. Il concerne les revues de la Complete Freedom Collection, Bibliothèque médicale française et Cell Press sur option. Pour en savoir plus : actualité du consortium Couperin, communiqué Couperin, ABES, MESRI. Au sujet de l’accord: commentaires de l’Université de Lorraine et du RNBM.
Open Peer review, open identity, open reports : quels impacts sur la qualité de l’évaluation ? Ce billet de blog reprend les résultats d’un article publié dans la revue Research Evaluation. Il souligne la faible proportion de revues (entre 1 et 5%) ayant choisi ce modèle éditorial et, de facto, le manque d’études disponibles pour en évaluer l’impact. La publicité des rapports semble moins problématique que celle de l’identité des reviewers, cette dernière pouvant générer des craintes de représailles. Les auteurs ont esquissé un programme de recherche pour mieux comprendre comment les différents modèles d’open peer review peuvent affecter le contenu et la qualité du processus d’évaluation.
Quels sont les déterminants des stratégies de publication des chercheurs ? Cet article présente les résultats d’une enquête (Zurich Survey of Academics) menée en Suisse, Autriche et Allemagne, en 2020, auprès de plus 10 000 chercheurs issus de plus de 250 établissements. Il montre que les chercheurs mobilisent des stratégies de publication combinant motivation intrinsèque (satisfaction personnelle) et extrinsèque (obtenir un financement, par exemple). La réputation de la revue, le fait de publier en open access et l’accès à un lectorat international dans leur domaine de recherche constituent des critères d’importance dans la sélection d’une revue.
Qu’est-ce qui influence l’impact d’une publication scientifique ? Une équipe de chercheurs italiens a mené une étude pour analyser quels facteurs non scientifiques influencent l’impact des publications. Parmi ceux-ci, il y a le type d’accès (libre accès ou accès non ouvert) à la publication par un lecteur potentiel et la communication dans les médias sociaux. Cliquez ici pour accéder à l’étude complète.
La fondation Bill et Melinda Gates lance une nouvelle politique d’open access. A partir de 2025, la fondation exigera que tous les chercheurs ayant disposé de son soutien publient leurs manuscrits sous forme de preprints et cessera le financement de frais de publications en open access. Cette initiative suscite de nombreux débats concernant le libre accès à la recherche, le rôle des éditeurs mais aussi la qualité des productions scientifiques. Sur ce dernier point, la fondation s’est d’ailleurs associée avec l’éditeur F1000 pour lancer Verixiv, une plateforme de preprints validés. La nouvelle a suscité de nombreuses réactions dans le monde de la publication scientifique de la part des éditeurs et des agences de financement, comme le rapporte cet article de Nature. La Coalition S, réunissant plusieurs agences de financement européennes, a bien accueilli la nouvelle politique de la fondation mais se positionne pour le moment plutôt en soutien des modèles commerciaux sans frais de publication.
Guides et ressources
2 nouvelles ressources :
- Comment trouver des data papers : cette nouvelle ressource de DoraNum, dans la rubrique “Data papers et data journals” aide notamment à trouver des listes de data journals
- Les software papers : cette nouvelle ressource de DoraNum se focalise sur ces articles décrivant des logiciels et indique les principaux software journals et des plateformes / revues qui publient des software papers.
Commentaires