Bulletin de veille – Mai 2023
- L’actualité dans vos domaines
- Institutions
- Science ouverte
- Édition scientifique
- Intégrité scientifique
- Études et enquêtes
- Guides et ressources
L’actualité dans vos domaines
Applications du metaverse : quelles opportunités pour la recherche scientifique ? Les possibilités d’interactions synchrones immersives offertes par le metaverse peuvent ouvrir des perspectives d’utilisation dans de nombreux domaines. En sciences expérimentales, pourrait-il par exemple remplacer le cahier de laboratoire papier ou électronique ? Il permettrait de proposer des dispositifs de réplication de conditions expérimentales enrichies, intégrer les flux de données issus des instruments de mesure, faciliter la reproductibilité voire permettre aux collaborateurs ou aux reviewers d’être « présents » pour suivre l’expérience ? Mais les défis sont nombreux comme le souligne cet article publié dans Nature Human Behavior.
À quand la révolution de l’IA en chimie ? L’IA générative requiert des volumes importants de données qui font défaut dans de nombreux domaines de la chimie. Quelques exceptions toutefois : l’outil de prédiction de structure protéiniques AlphaFold, par exemple, qui s’appuie sur une banque de données créée en 1971 et contient plus de 200’000 structures. Cet éditorial de la revue Nature propose trois pistes pour mettre à la disposition de l’IA des volumes massifs de données de qualité, dont l’ouverture des données, sur le modèle de l’Open Reaction Database. Toutefois, sans l’ouverture des données associées aux résultats négatifs – telles les réactions qui ne produisent pas les substances souhaitées – l’IA ne pourra atteindre son plein potentiel.
Les résultats négatifs et l’IA. En synthèse organique, des travaux récents publiés dans The Journal of Organic Chemistry montrent l’intérêt de l’apprentissage automatique pour l’optimisation des réactions. Cette performance repose sur la qualité des jeux de données employés. Les bases de données utilisant les données issues de la littérature ou commercialisées par des éditeurs (comme Reaxys, par exemple), sont soumises à un biais de sélection : seuls les résultats positifs ou donnant lieu à des rendements élevés sont retenus et non les résultats négatifs ou les réactions générant des rendements faibles. Outre la généralisation des cahiers de laboratoire électroniques, qui permettrait de mieux documenter les données – il ne suffit pas de les publier ! -, cet article, publié dans Organic letters, identifie des scénarios et suggère des standards pour documenter les données de façon plus complète et cohérente, quelle que soit la nature (positive ou négative) des résultats.
L’IA dans le domaine de l’énergie. Depuis quelques années, l’intelligence artificielle a conduit à des progrès notables, mesurés notamment dans le domaine de l’énergie. Un rapport très complet, issu d’une série d’ateliers (en 2022) du ministère américain de l’énergie (DOE) sur l’intelligence artificielle (IA) au service de la science, de l’énergie et de la sécurité détaille l’importance de l’exploitation de l’IA pour faire progresser la science et en mesure également les risques (erreurs commises par l’IA, recommandations biaisées …). Le rapport conclut sur les évolutions nécessaires concernant les ressources informatiques, les données,et l’instrumentation afin de relever les défis et d’atteindre les objectifs fixés par le DOE.
Les données synthétiques meilleures que les données réelles ? Cet article liste plusieurs travaux de recherche, issus de disciplines différentes, menés à partir de données générées par des machines. Celles-ci peuvent améliorer la protection de la vie privée à condition que les chercheurs parviennent à trouver le bon équilibre entre exactitude et falsification. Elles pourraient aussi accroître les performances de l’intelligence artificielle et étendre ses utilisations tout en démocratisant la recherche sur le sujet.
Institutions
Règlement sur les données de la Commission Européenne : quel impact pour la recherche scientifique ? Un article paru dans Nature recueille plusieurs témoignages de chercheurs européens au sujet du Règlement sur les données en préparation. Ils expriment leurs inquiétudes quant à un texte destiné à faciliter le partage des données entre entreprises privées, risquant de laisser les organismes de recherche sur le bord de la route. Les conditions d’accès aux données détenues par des entreprises privées seraient limitées pour la recherche publique, qui serait amenée à acquérir ces données au prix fort. L’un des risques n’est-il pas de conduire à un déplacement progressif de la recherche sur IA du public vers le privé (brain drain) comme souligné dans ce preprint ?
Pour un accès ouvert immédiat. Le Conseil de l’Union européenne a adopté le 23 mai « des conclusions sur une publication universitaire de qualité, transparente, ouverte, fiable et équitable ». Dans ce texte, il prône un libre accès immédiat et sans restriction aux publications de recherche faisant appel à des fonds publics. Il encourage également les États membres à soutenir le programme pilote Open Research Europe, l’utilisation de logiciels libres et de standards ouverts, à reconnaître la valeur des activités de peer review et à les valoriser dans le cadre de l’évaluation des chercheurs. Un billet de blog commente ces conclusions.
Science ouverte
Prise de position du G7 pour la science ouverte. A Sendai, les ministres de la science et de la technologie du G7 ont indiqué dans une déclaration soutenir le développement de la science ouverte par la diffusion selon les principes FAIR des résultats de la recherche financée par des fonds publics, y compris les données de recherche. Le G7 se déclare également favorable à un accès ouvert et public immédiat aux publications savantes et aux données scientifiques financées sur des fonds publics. Il soutient le groupe de travail science ouverte constitué en son sein qui a émis des recommandations (notamment sur l’interopérabilité et l’évaluation).
Plusieurs anniversaires ! Ce mois-ci, plusieurs institutions et initiatives qui ont marqué le mouvement de la science ouverte et son développement fêtent leur anniversaire.
- A l’occasion de ses 10 ans, Zenodo rappelle les différentes étapes de son développement (ajout de doi, etc.) et rend hommage à tous les acteurs (le CERN, OpenAire, etc) ayant permis la construction de cet entrepôt. Actuellement, Zenodo compte plus de 300.000 utilisateurs issus de plus de 7500 organisations et de 153 pays. A venir : le passage de Zenodo sur Invenio.
- DOAJ, le répertoire des revues en open access, fête ses 20 ans. C’est l’occasion là encore de publier une timeline. Plusieurs événements autour de 3 thématiques (Open’, ‘Global’, and ‘Trusted’) célébreront cet anniversaire.
- Autre anniversaire : les dix ans de la déclaration de San Francisco sur l’évaluation de la recherche (DORA). Dans un article “From declaration to global initiative: a decade of DORA”, les promoteurs en profitent pour rappeler à la fois les avancées et le plan d’action de Dora, notamment sur la sensibilisation des acteurs, sur le développement de mesures concrètes et sur le financement de la réforme de l’évaluation.
Certifier Hal comme entrepôt de confiance. Le CCSD, qui gère HAL ainsi que les épi revues et sciencesconf, se lance dans une démarche de certification de HAL par CoreTrustSeal via le respect des principes FAIR (les productions déposées dans HAL doivent être faciles à trouver, accessibles dans la durée et réutilisables). L’objectif qui s’inscrit dans le projet Haliance, est de donner confiance aux déposants en leur garantissant une “gestion et une protection optimales de leurs données et fichiers”. La certification par CoreTrustSeal s’appuie sur 16 critères. Elle commence par une auto-évaluation qui est satisfaisante. Pour poursuivre la démarche, le CCSD utilisera l’outil Crusoe. Il indique avoir recruté un datasteward pour ce faire.
Édition scientifique
La vidéo des journées d’étude « Publier autrement : l’épopée d’Episciences et des overlay journals » est en ligne. Ces journées proposaient de faire le point sur l’état de l’art de l’édition scientifique publique en accès ouvert, la plateforme d’édition Episciences et les perspectives du modèle des overlay journals (journaux électroniques qui ne produisent pas leur propre contenu mais sélectionnent des textes déjà librement disponibles en ligne).
Négociations JISC / Springer Nature : un accord trouvé. Après une année de négociation, le JISC et Springer sont parvenus à un accord de type Publish&Read. D’une durée de trois ans, il prévoit la publication en accès ouvert dans toutes les revues hybrides de Springer et Palgrave. La publication en accès ouvert dans les revues du groupe Nature est soumise à un plafond. L’accord prévoit également une option « fully open access » avec possibilité pour les institutions de prépayer ou de payer a posteriori des APC (avec réductions et APC plafonnés).
Le centenaire de Measurement Science and Technology . IOP fête cette année le 100e anniversaire du plus ancien titre de revue sur l’instrumentation et les mesures, et qui est par ailleurs le 1er titre édité par la société savante. A cette occasion, une collection d’articles reviennent sur certains des thèmes de recherche abordés dans le premier volume et examinent les dernières avancées dans le domaine de la métrologie (par exemple, la détection des ultrasons par fibres optiques, du positionnement par satellites et des mesures de masse par balances électrostatiques).
Intégrité scientifique
Développer un outil capable de détecter et de signaler automatiquement les citations superflues dans les articles. C’est l’objectif d’un bioinformaticien à la Fondation de recherche médicale de l’Oklahoma, comme l’indique cet article de la revue Nature. Selon une étude publiée dans Research Policy, les chercheurs qui sont contraints par les éditeurs d’ajouter des citations superflues dans leurs manuscrits ont plus de chances de réussir à publier des articles que ceux qui résistent. Une solution à ce problème consisterait à exclure les autocitations des revues pour calculer le facteur d’impact, parfois utilisé pour évaluer les scientifiques et leurs travaux.
Une fraude scientifique banalisée ? Un preprint publié sur MedRxiv par une équipe de l’Université de Madgeburg et de l’Institut Max Planck, qui suscite de nombreux commentaires sur PubPeer, propose une méthodologie et des indicateurs permettant d’identifier les articles frauduleux ou ayant recours au plagiat, dans le domaine biomédical. Il révèle une croissance alarmante du recours aux usines à articles (paper mills), dont le chiffre d’affaires s’élèverait à plus de 3-4 Mds de dollars, selon une estimation des auteurs. Des échanges mails entre les équipes d’une “usine” et un scientifique (Rendez-vous with a paper mill – A true story) sont également publiés en annexe. Un article paru dans Science revient sur ces résultats, sur les critères utilisés pour identifier les publications douteuses et sur les outils et méthodes de détection dont ceux développés par les éditeurs de STM, tel Integrity Hub.
Études et enquêtes
Les évolutions de la voie verte. Partant du constat que, 20 ans après la déclaration de Budapest qui mettait en place la voie verte (auto-archivage), seule une partie des chercheurs dépose ses publications dans des archives ouvertes, les auteurs de l’article “The Transformation of the Green Road to Open Access” ont analysé les données de HAL (pour les 10 universités les plus importantes) afin de mesurer l’implication des personnels non chercheurs : les dépôts via les bibliothèques, l’import de notices bibliographiques, la migration depuis d’autres plateformes, etc. représentent au moins 48% des dépôts en 2020, ce qui est considérable. Cela montre une évolution de la pratique d’auto-archivage et de la communication scientifique directe vers la gestion de l’information de recherche, avec comme défi, la qualité des métadonnées.
Une étude sur les Forges de l’ESR. Le rapport Forges de l’ESR – Définition, usages, limitations rencontrées et analyse des besoins, issu des travaux du Comité Science Ouverte, permet un premier état des lieux des forges logicielles, comme Gitlab, utilisées dans la recherche : quels sont les usages ? Les freins ? Quels besoins peuvent être identifiés ? Quels sont les points de vigilance ? 39 forges (dont 37 sont des instances de GitLab) ont ainsi été identifiées. L’usage de forges commerciales comme GitHub est particulièrement répandu dans les projets impliquant beaucoup d’interactions. Le rapport complet est accessible sur HAL.
Partager ou non ses données : une pratique soumise à un biais social ? Une étude menée par une équipe de sociologues danois examine l’impact de stéréotypes de genre, de nationalité, voire de stéréotypes liés à l’institution d’appartenance sur le fait de répondre positivement à une demande de transmission de données. Cette enquête publiée dans Scientific Data a été menée auprès d’auteurs publiant dans PNAS et Nature Portforlio et déclarant leurs données comme “ disponibles sur demande ”. Mais dans les faits sont-ils disposés à transmettre leurs données, à toute personne en faisant la demande ?
Financement direct du modèle diamant : quelle faisabilité ? Faisant suite aux recommandations de l’OA Diamond Journal study, des chercheurs de l’Institut Interdisciplinaire de l’Innovation et de l’EHESS étudient dans ce preprint publié sur BioRxiv la structure des dépenses et les besoins financiers des revues diamant, leur capacité à utiliser les fonds alloués, ainsi que leur capacité à répondre aux exigences des agences de financement (RFO, Research Funding Organizations). L’enquête menée auprès de 260 revues diamant, révèle de nouveaux défis administratifs, financiers et éthiques auxquels le modèle diamant pourrait être confronté. Faut-il craindre des revues prédatrices diamant ?
Enquête sur l’évaluation de la recherche. GraspOS (Next Generation Research Assessment to Promote Open Science) est un nouveau projet financé par EOSC qui a démarré le 1er janvier 2023. Le projet vise à promouvoir l’évaluation responsable de la recherche en mettant en place un système de récompense et de reconnaissance basé sur une nouvelle génération de mesures et d’indicateurs (qualitatifs ou quantitatifs). Dans ce contexte-là, une enquête a été lancée avec l’objectif d’obtenir une vision d’ensemble de l’état des pratiques d’évaluation de la recherche dans les organismes de recherche et de financement, ainsi que dans d’autres organismes impliqués dans l’évaluation de la recherche. Le questionnaire est structuré sur la base des engagements et des principes fondamentaux de CoARA.
L’open access gold met en cause la diversité de la production scientifique. Si le nombre d’articles en open access s’est considérablement accru, ceux-ci sont souvent mis en accès ouvert selon le principe de la voie dorée, modèle de financement dit « auteur-payeur ». L’article est accessible gratuitement pour le lecteur mais sa parution est payée par l’auteur ou son institution. D’après cet article de la revue Insights, ce modèle nuit à la bibliodiversité car il induit des inégalités d’accès à la production scientifique. Afin de maintenir des accès équitables à la connaissance, les auteurs proposent de développer la voie verte via le dépôt institutionnel et l’édition en bibliothèque.
Guides et ressources
Conférence de Science Europe sur la science ouverte. Les actes de la conférence qui s’est déroulée en octobre 2022 à Bruxelles ont été publiés. Ils présentent une synthèse des débats, abordant les questions d’équité, de relation entre science ouverte et société, d’accès ouvert aux processus de recherche et aux méthodes, mais aussi la réforme de l’évaluation de la recherche. Il se réfère également au Plan stratégique pluriannuel de Science Europe 2021-2026.
L’enregistrement du webinaire sur OpenAIRE Explore est disponible. Il fait le point sur les dernières améliorations du portail : présentation des résultats et des métadonnées, recherche des facteurs d’impact et des taux de citations. Voici le lien.
Le passeport pour la science ouverte fait des émules. Le consortium néerlandais des bibliothèques universitaires, la Bibliothèque nationale des Pays-Bas, les universités des Pays-Bas, le centre national néerlandais d’expertise et de dépôt des données de recherche et le Conseil néerlandais de la recherche viennent de publier un guide pratique sur la science ouverte. Inspiré du Passeport pour la Science ouverte français, il est adapté au contexte néerlandais.
Le dépôt des données en tutoriels. Dans le cadre de l’écosystème Recherche Data Gouv, le service de formation DoRANum et l’équipe du Centre de ressources entrepôt-catalogue ont réalisé 12 tutoriels interactifs afin d’accompagner pas à pas, et à leur rythme, les déposants lors du dépôt de données dans l’entrepôt Recherche Data Gouv.
Commentaires