Bulletin de veille – Avril 2021
L’actualité dans vos domaines
Wiley crée une collection en ligne sur l’open data en chimie. Une collection de 5 articles à propos de l’ouverture des données en chimie a été publiée en ce début de mois sur Chemistry Europe. L’un des articles aborde notamment le défi que représente l’ouverture des données en catalyse en introduisant le consortium allemand NFDI4Cat. Ce dernier propose de réfléchir à des ontologies et vocabulaire contrôlés de métadonnées pour l’échange d’information, de développer des entrepôts de données pour la catalyse et de porter une attention particulière à la bonne intégration des communautés concernées.
Le JACS s’interroge sur sa politique en matière de données. “Beaucoup d’articles de recherche s’appuient sur des jeux de données volumineux qui ne sont pas faciles à inclure dans un article traditionnel. Nous voulons donc savoir ce que la communauté en pense : qu’attendez-vous de la politique des données du JACS ?” C’est en ces termes que la question a été lancée sur twitter par la prestigieuse revue d’ACS, suscitant une série de propositions de la part de chercheurs en chimie qui tendraient à systématiser le dépôt de données parallèlement aux articles, dans des formats appropriés (FID pour la RMN, CSV pour l’IR etc.)
Faciliter la découverte des données disponibles en science des matériaux. C’est l’objectif que s’est fixé un groupe de travail emmené par des chercheurs américains. Dans un article publié en avril dans Data Science journal, les auteurs reviennent sur leur projet visant à agréger les données disponibles en ligne en sciences des matériaux. Deux instances de test ont été lancées, accessibles ici et là.
Comment choisir l’algorithme de machine learning adapté à vos besoins en tant que chimiste ? Un article publié dans l’édition d’avril de C&EN mentionne le développement d’outils permettant de comparer et tester l’efficacité des algorithmes dans leur prédiction des propriétés chimiques. Il est toutefois mentionné que des biais humains demeurent même avec l’utilisation de ces outils, en choisissant un modèle avec beaucoup de citations plutôt que celui renvoyé par exemple. Ce deuxième article présente l’expérience de trois modèles différents tentant de prédire des réactions chimiques basées sur la méthode de la DFT (Density Functional Theory).
Faciliter le partage de données en chimie grâce à Twitter. Trois chercheurs japonais ont relié des logiciels de chimie à des bots Twitter via l’API mise à disposition par l’entreprise. L’objectif est de partager les résultats de recherche en temps réel en utilisant des applications interactives et communautaires. Le compte @retrosynthchan permet ainsi de partager des rétrosynthèses via l’outil AiZynthFinder en indiquant une chaîne SMILES. Les résultats de l’analyse sont ensuite tweetés par le robot.
La chimie dans tous ses états. Un ouvrage réalisé avec l’appui de CNRS éditions et publié le 22 avril propose un parcours très documenté sur l’histoire et les applications de cette discipline. Intitulé « Étonnante chimie : 80 chercheuses et chercheurs racontent l’inattendu”, le récit décliné en 6 grands chapitres revient sur l’image véhiculée par la discipline au fil du temps, son usage moderne dans la protection de l’environnement, ou encore son implication dans le domaine de la santé. Des développements iconoclastes illustrent le rôle de la chimie dans la vie de figures connues, comme Angela Merkel ou encore Primo Levi.
Un logiciel de gestion de données multisites au CERN. La gestion de la production et de l’accès des données issues de l’expérience CMS du Grand collisionneur de hadrons (LHC) est réalisée via l’outil Dynamo. Il a pour objectif de limiter au maximum les interactions humaines avec le système d’information et d’optimiser l’usage du stockage sur les différents supports et les différents sites du CERN. Dans le cadre de Dynamo, la propriété et l’accès aux données ne sont plus gérés par les “data managers” des groupes de recherche mais en fonction de deux nouvelles catégories : ceux qui produisent les données puis ceux qui les analysent.
Lancement du plus grand réseau européen d’astronomie. Les réseaux OPTICON et RadioNet fusionnent pour former le plus grand réseau collaboratif d’astronomie au sol en Europe : l’ORP. Le but affiché : “harmoniser les méthodes et outils d’observation des instruments d’astronomie optique et de radioastronomie au sol, et favoriser l’accès des chercheurs et chercheuses à un éventail élargi d’installations”.
Lumière sur une physicienne “bio-inspirée”. Le journal Le Monde dresse le portrait de la physicienne Julie Grollier (UMR CNRS/Thalès). Spécialiste de l’intelligence artificielle, elle travaille à créer de nouveaux composants qui seraient capables d’apprendre et de transmettre l’information de la même manière que notre cerveau.
Données de santé
La science ouverte dans le domaine des neurosciences : risques et opportunités. Un article publié dans Neuroimage, revient l’ouverture des données de patients atteints de pathologies mentales, en lien avec les questionnements éthiques qu’il soulève. “Le potentiel d’exploitation des données en neuroimagerie est énorme”, estiment les auteurs, tout en soulignant le caractère sensible de ces dernières, même lorsqu’elles sont anonymisées. Le fait de faire référence à des “communautés marginalisées dans le jeu de données” est notamment questionné.
Vers un partage accru des données de santé ? C’est l’objectif affiché par un groupe de travail du Comité de la science ouverte, emmené par des chercheurs du CHU de Rennes. Le but est “d’élaborer des modèles de plans de partage des données (data sharing plans), qui permettront d’établir et de généraliser des protocoles d’échange de données entre équipes de recherche”.
Ouverture des données : état des lieux et mises en garde. Faisant suite à latable ronde organisée en novembre 2020 par Springer, les témoignages et déclarations des chercheurs ont été compilées pour donner lieu à la publication d’un “livre blanc” sur l’ouverture des données. Le document replace cet enjeu dans le contexte actuel, notant que la pandémie du Covid-19 aura accéléré la mise en place de données dites “FAIR”, accessibles et réutilisables, dans le domaine de la santé. Mais l’ouverture à grande échelle des données ne s’improvise pas : “Si les données sont partagées, elles doivent aussi être vérifiées”. Or, cette tâche supplémentaire serait de nature à décourager les chercheurs chargés d’évaluer les articles. Par ailleurs, l’ouverture des données de santé comporte des enjeux éthiques lourds. On voit ainsi apparaître des initiatives telles que PicnicHealth, où les patients sont incités à partager leurs données de santé en échange d’une rémunération.
Edition scientifique
Vers un nouveau modèle d’ouverture des publications scientifiques ? On connaissait jusqu’ici le modèle ‘gold’ de l’auteur-payeur, le modèle ‘green’ qui favorise les archives institutionnelles ou encore le modèle ‘diamant’ qui favorise les financements institutionnels ou le mécénat. Dans un article publié mi-avril, le Monde revient sur un modèle encore très émergent mais qui semble percer en mathématiques, discipline connue pour son hostilité au modèle de l’auteur-payeur. Son principe : assurer qu’un nombre minimum de bibliothèques restent abonnées à la revue pour que les articles soient rendus accessibles à tous. Dans le cas contraire, l’ensemble des contenus restent payants.
Google, nouvelle vigie de la science ouverte ? Les chercheurs qui disposent d’un profil sur Google Scholar sont scrutés de près : l’indicateur d’ouverture de leurs articles issus de travaux financés par l’ANR ou toute autre agence dotée d’une politique de science ouverte figure désormais sur leur page. Annoncée fin mars, cette nouvelle fonction a reçu un accueil mitigé de la part des chercheurs, certains déplorant les erreurs dans le recensement des articles en accès ouvert. Retrouvez ici l’interview de l’un des co-fondateurs de Google Scholar.
Un “deal” aux répercussions multiples. Une étude s’est intéressée au “German DEAL” (un accord passé en 2020 avec les différentes institutions de recherche d’Allemagne et les éditeurs Springer Nature et Wiley pour faciliter la publication en open access). En se basant sur un jeu de données composé de publications en chimie, l’étude montre que ce type d’accord peut rebattre les cartes. Des effets collatéraux pourraient survenir, avec une concentration accrue des publications chez Springer et Wiley (de 2 à 4%), au détriment des autres revues.
Vers une sous-traitance du peer-reviewing ? Selon un décompte publié dans Science, une quinzaine de revues scientifiques délèguent l’évaluation des articles auprès d’initiatives comme Peer Community in. C’est le cas des revues BMJ Open Science et Royal Society Open Science.
Des chercheurs français se penchent sur le cas des revues prédatrices. Les chercheurs issus du domaine biomédical ne seraient pas assez sensibilisés à l’explosion des revues prédatrices et à l’attitude à adopter vis-à-vis de leurs pratiques, estiment les auteurs de deux articles consacrés à cet enjeu, dont Hervé Maisonneuve, à l’initiative du blog désormais très reconnu Rédaction Médicale. Dans ce premier article, les auteurs dressent un état des lieux du phénomène, incorporant même des extraits de mails de démarchage des éditeurs prédateurs. Dans ce deuxième article, ils replacent l’enjeu dans le contexte actuel du Covid, qui a eu tendance à accroître le nombre de revues prédatrices. Ils font des propositions pour éradiquer le phénomène, suggérant notamment de sanctionner les chercheurs publiant dans ces revues et d’occulter les dites publications du champ de leur évaluation.
Que se passe-t-il lorsqu’une revue franchit le pas de l’Open Access ? Une étude portée par des chercheurs en Allemagne a tenté de répondre à cette question en s’intéressant à des revues qui ont adopté ce modèle au fil des ans. Après ce changement, le volume d’articles publiés dans ces revues connaîtrait une augmentation comprise entre 14% et 22%, pendant que leur facteur d’impact progresserait de près de 19%, quatre ans après ce changement.
Evénements
Pour ne rien manquer des événements en lien avec les données de recherche ou la science ouverte, n’hésitez pas à consulter notre rubrique dédiée ! Parmi les dates à noter, nous signalons notamment :
Webinaire de l’ANR sur l’ouverture des publications scientifiques. Les 5 et 6 mai, l’ANR reviendra sur sa politique de science ouverte au regard des nouvelles exigences définies dans le cadre du plan S. Il est notamment question de supprimer les embargos pour tout article publié dans le cadre d’un projet qu’elle finance.
Journée sur la reproductibilité. La Société Informatique de France (SIF) organise une journée de présentations et d’échanges sur la reproductibilité de la recherche le 10 mai 2021 en visio-conférence. Inscription gratuite mais obligatoire.
Recherche reproductible : retour sur le séminaire organisé par l’Université Grenoble Alpes. Les 6 et 9 avril, un séminaire en ligne a réuni plusieurs acteurs de la recherche sur les enjeux de reproductibilité. Les supports de certains intervenants sont disponibles, à l’instar de celui d’Arnaud Legrand sur la crise de la reproductibilité et la science ouverte ou encore celui de Nicolas Carpi sur le cahier de laboratoire électronique elabFTW qu’il a développé.
Report du congrès de la SCF. En raison du contexte sanitaire, la Société chimique de France a annoncé le report de cette manifestation prévue à Nantes à 2023.
Commentaires