Bulletin de veille – Mai 2022
- L’actualité dans vos domaines
- Cahiers de laboratoire électroniques
- Modèle diamant
- Etudes et enquêtes
- Sciences et société
L’actualité dans vos domaines
Un nouvel entrepôt de données en spectrométrie pour la chimie environnementale. Baptisé MACE pour “Mass Spectra for Chemical Ecology”, cet entrepôt fait l’objet d’un article paru mi-mai, afin d’encourager la publication accès ouvert de spectres (GC/MS) qui ne sont pas présents dans les bases commerciales NIST et Wiley. Chaque fichier, déposé au format texte, décrit le spectre en une dizaine de métadonnées (nom de la substance, nombre de pics, indice de rétention, masse moléculaire etc.) La qualité du fichier est vérifiée au moment du dépôt, lequel reçoit un DOI. Le succès de MACE dépend intrinsèquement des contributions des chercheurs et de leur volonté d’enrichir son contenu, préviennent les auteurs issus de l’université technique de Brunswick.
Open data en physique : plongée dans les spécificités de chacune des communautés. Un article publié dans la revue Computing and Software for Big Science revient sur l’enjeu de l’open data en physique, à travers l’action du consortium allemand PUNCH4NFDI, qui rassemble la physique des particules, des astroparticules, des hadrons et la physique nucléaire. Un atelier organisé fin 2021 a été l’occasion de cerner les pratiques des différentes communautés. Les méthodes de publication des données peuvent fortement varier : de quelques téraoctets avec un accès surveillé pour les données d’astroparticules à plusieurs pétaoctets pour les données du CERN. Le traitement réservé aux données varie également : en physique des hautes énergies, celles-ci sont en général confrontées à des prédictions théoriques avant d’être publiées, tandis que les données brutes sont diffusées en astronomie.
ACS ouvre de plus en plus sa base de données de substances. Disponible depuis 2009, cette base de données en accès ouvert et librement réutilisable comprend désormais 500 000 substances, contre seulement 8000 à l’origine. Cette proportion reste néanmoins faible au regard des 250 millions de substances recensées dans la base de données payante Scifinder-n. Un article publié mi-mai dans le Journal of Chemical Information and Modeling revient sur les évolutions apportées à cette base en accès ouvert : ajout des propriétés basiques des molécules, introduction d’identifiants lisibles par la machine (inchi, smiles), intégration avec une API etc.
ACS étend l’intégration de ChemRxiv avec de nouvelles revues portées par des sociétés savantes. Les auteurs déposant leurs préprints dans ChemRxiv pouvaient d’ores et déjà soumettre en un clic leurs manuscrits dans une revue d’ACS, de RSC et de la société allemande de chimie. Cette facilité s’étend désormais aux sociétés chinoise et japonaise de chimie.
Les chercheurs des Universités britanniques publient désormais en accès ouvert dans les revues d’ACS. A l’issue d’un accord annoncé le 29 avril, l’ensemble des Universités britanniques bénéficieront d’une publication en open access dans les revues du leader mondial de l’édition scientifique en chimie. Le dispositif, valable jusqu’en 2024, s’ajoute aux nombreux autres accords de ce type signés entre ACS et 400 autres organismes de recherche.
Des avancées scientifiques qui n’en sont pas… C’est le risque encouru lorsque les résultats d’études cliniques présentés dans la littérature ont une crédibilité statistique tout juste acceptable pour être publiées. C’est le constat tiré par des chercheurs en biostatistiques de l’Université du Texas, qui livrent leurs conclusions dans un article publié le 5 mai, après s’être penchés sur 35 études très citées relevant du domaine biomédical. Lorsque la valeur p est très proche du seuil maximum acceptable (soit 0,05), le résultat est en fait négatif dans trois quarts des cas, bien que présenté initialement comme positif par les auteurs.
Les données de recherche, un objet nébuleux pour les chercheurs en mathématiques. Une enquête menée par le réseau national des bibliothèques de mathématiques confirme l’ambiguïté de l’enjeu des données de recherche, qui ne sont pas identifiées clairement par la communauté. 60% des chercheurs sondés en topologie algébrique et géométrique estiment par exemple ne pas produire de données. L’immense majorité des logiciels utilisés par les mathématiciens sont en revanche des outils open source. Les plans de gestion de données restent également une terre inconnue pour 80% des chercheurs sondés, tout comme les entrepôts de données, qu’ils ne connaissent pas dans près de 70% des cas.
Produire des données dites “FAIR” dans le domaine du génie biologique : un cas d’école. Un article publié fin avril dans la revue Engineering in Life Sciences revient sur une expérience menée dans le cadre d’un projet allemand sur les interactions cellulaires. Les équipes ont été confrontées à un paradoxe : le manque de standardisation des données en sciences du vivant d’une part, malgré l’existence de nombreux entrepôts de données spécialisés et l’absence d’entrepôts adaptés en ingénierie d’autre part, malgré l’existence de standards de description précis dans ce domaine. En guise de solution, les chercheurs ont opté pour le dépôt de leurs données dans l’entrepôt institutionnel de l’Université de Stuttgart.
Vers une évolution de la représentation périodique des éléments ? Un article publié le 11 mai dans The Conversation revient sur l’initiative de la société européenne de chimie visant à faire évoluer le tableau périodique des éléments en fonction de l’abondance de chaque élément et de sa nocivité potentielle. Selon les nouveaux critères, le carbone ne serait plus représenté en vert mais au moyen de trois couleurs (vert, rouge et gris).
Cahiers de laboratoire électroniques
Les bibliothèques, chevilles ouvrières du déploiement de cahiers de laboratoire électroniques ? Une étude de cas relative à l’Université de médecine de l’Indiana illustre le renouvellement du rôle des BU, qui sont amenées à porter des projets innovants au profit des laboratoires. Lancée en 2018, l’expérimentation s’est tout d’abord concentrée sur 15 chercheurs volontaires pour tester la solution LabArchive. A ce jour, le nombre d’utilisateurs a été porté à 829. Un essor facilité par 3 bibliothécaires qui assurent des formations à l’outil chaque mois et répondent aux demandes individuelles.
Utiliser l’API du cahier de laboratoire électronique eLabFTW : un cas d’usage. A l’occasion d’un séminaire co-organisé le 5 mai par le Gricad, les fonctionnalités propres à l’API d’elabFTW ont été présentées. Un cas d’usage a notamment été présenté, visant à transférer directement un script d’une soixantaine de lignes issu d’un éditeur de code afin de le verser sous forme d’expérience dans elabFTW, grâce à l’API.
Cahiers de laboratoire électroniques : que choisir ? Comment les utiliser ? C’est le but de la discussion proposée par l’Université de Glasgow le 16 juin dans le cadre d’un webinaire consacré aux cahiers de labo électroniques. Pour plus de détails, consultez le programme et le formulaire d’inscription.
Interfacer un cahier de labo électronique open source avec une liseuse via une appli Android : l’expérience menée par l’Inrae. Dans le sillage du rapport publié en début d’année sur les cahiers de laboratoire électroniques, un groupe de travail emmené par l’Inrae a souhaité optimiser l’utilisation d’elab sur liseuse. Le but est double : lire le contenu d’elabFTW depuis l’application et pouvoir ajouter dans elabFTW des notes prises depuis la liseuse. Les enjeux, les difficultés et les pistes de développement sont décrits dans cette synthèse publiée fin mai.
Modèle diamant
Revues en accès ouvert sans frais de publication : l’exemple du Beilstein Journal of Organic Chemistry. Très peu de revues relevant du modèle diamant existent en chimie. A l’occasion de deux conférences ayant lieu en juin et juillet à Gottingen et Namur, l’éditeur de cette revue propose d’échanger sur le modèle éditorial proposé.
Réinventer la science ouverte en la démarchandisant ? L’exemple en géosciences. Un article publié le 23 mai dans le quotidien La Croix revient sur l’expérience menée par des chercheurs en géosciences ayant décidé de créer leur propre revue, Seismica, dont la parution est prévue début juin, afin de s’affranchir du modèle lucratif de l’accès ouvert fondé sur le principe de l’auteur-payeur. L’un des porteurs du projet, affilié à l’Institut interdisciplinaire d’intelligence artificielle (3IA Côte d’Azur), estime qu’un « un journal scientifique en ligne coûte en réalité moins de 1 000 € par an, en frais d’hébergement et de support technique.» Le projet a suscité l’intérêt de l’université canadienne McGill, qui apporte son soutien financier.
Etudes et enquêtes
Inflation éditoriale et explosion des coûts : la faute au modèle de l’auteur-payeur ? C’est ce que suggère une étude publiée le 27 mai dans la revue Scientometrics, qui se penche sur la situation observée dans 6 pays (dont la France), représentant plus de la moitié des publications scientifiques indexées dans Web of Science. Malgré une politique officielle visant à valoriser le dépôt en archive ouverte, la France connaît elle aussi une envolée des coûts générés par les frais de publication appliqués par les éditeurs (voir graphique ci-dessous). La France semble en revanche parvenir à contenir plus que les autres pays les dépenses dans les revues dites hybrides, pour lesquelles l’argent public est mobilisé deux fois (paiement de l’abonnement et paiement pour la “libération” de l’article). Les frais de publication dans ce type de revues sont par ailleurs généralement plus élevés (+1000 $) par rapport aux revues qui sont nativement en accès ouvert. La politique des frais de publication, commercialement avantageuse pour les éditeurs, “tend par ailleurs à encourager de plus gros volumes de publications”, indiquent les auteurs. Avec une estimation globale de 2 milliards de dollars par an de dépenses publiques mondiales dues aux frais de publication (un budget comparable à celui de l’ERC), il serait temps de discuter du business model de l’accès ouvert, suggèrent les auteurs.
Pour beaucoup de chercheurs, la gestion et la publication de données réutilisables reste une terra incognita. Les fruits de l’enquête menée par l’UGA l’an dernier et publiés ce mois-ci mettent en lumière la réalité actuelle au regard de la gestion des données de recherche. Les Plans de Gestion de Données restent assez méconnus (53% des répondants en ont déjà entendu parler mais seulement 15% de ces derniers savent précisément ce que cela recouvre). Les volumes de données en jeu influent sur les pratiques : la physique des particules, l’astrophysique, les géosciences, l’environnement et l’écologie apparaissent comme des disciplines mieux structurées que d’autres sur la gestion des données. 80% des répondants indiquent avoir rencontré des difficultés dans la réutilisation des données (problèmes d’accès, manque de description des données etc.) Enfin, l’action de diffuser ses données comme un produit de recherche à part entière n’est pas encore bien intégré dans le processus de recherche : 54% des répondants déclarent ne pas pratiquer l’ouverture des données.
Les jeunes chercheurs plus opposés aux frais de publication que les autres ? C’est ce qui ressort d’une étude publiée le 10 mai dans Learned Publishing, auprès de 3 422 chercheurs ayant répondu à un questionnaire. Si la majorité des chercheurs, toutes tranches d’âge confondues, désapprouve l’idée de payer pour publier, les jeunes chercheurs (26-35 ans) perçoivent encore plus ce système comme une menace pour la science.
Profil scientifique de la France : les mathématiques caracolent, la chimie en retrait à cause de la Chine. La publication, en mai 2022, de l’état de l’enseignement supérieur et de la recherche en France, donne à voir les tendances à l’œuvre en matière de priorité scientifique. Si les mathématiques sont prédominantes, la part de la discipline dans les publications françaises étant “70 % plus élevée que dans l’ensemble des publications mondiales”, l’indice de spécialisation en sciences de l’ingénieur, chimie, biologie appliquée “est en retrait de 10 à 30 % par rapport à la moyenne mondiale”. Un positionnement qui s’explique en partie par la part croissante des publications en sciences de l’ingénieur et chimie venues de Chine, qui fait mécaniquement refluer la part française. Le nombre de publications ne préjuge pas de l’impact de ces dernières. C’est le cas en sciences de l’ingénieur où la France obtient de bons scores en matière de citations.
Enquête auprès des chercheurs sur l’impact du plan européen sur l’accès ouvert (Plan S). Un questionnaire très court, doté d’une dizaine de questions, est ouvert aux chercheurs afin de mesurer l’impact du Plan S, porté par les agences de financement de la recherche à l’échelle internationale, dont l’ANR.
Sciences et société
Vers un service obligatoire de vulgarisation scientifique pour les chercheurs ? C’est ce que propose une chercheuse en chimie espagnole, dans une interview publiée dans le quotidien El Pais le 16 mai. “Au sein de la communauté scientifique, pratiquer la vulgarisation était presque un tort. C’est en train de changer, mais il y a toujours du chemin à faire. Moi je ferais comme pour le service militaire, les scientifiques devraient accomplir une contribution annuelle de vulgarisation, qui serait nécessaire pour leur promotion. C’est une idée très révolutionnaire mais les politiques ne prendront pas au sérieux la science tant que la demande n’émane pas d’en bas.”
Les étudiants de l’ENS réclament une science capable de répondre aux défis du siècle. “Si le système scientifique excelle à produire des connaissances ciblées, ces dernières sont fragmentaires et souvent déconnectées des besoins de la société.” Dans une tribune publiée le 11 mai, des étudiants de l’ENS appellent à la mise en place d’une recherche dite “impliquée”, dépassant le traditionnel clivage entre recherche fondamentale et recherche appliquée. “Que restera-t-il du vivant à étudier si nous n’avons rien fait pour l’empêcher de s’effondrer ?” questionnent les auteurs, à l’origine d’un collectif baptisé Effisciences, créé dans le but de rapprocher sciences et société.
Commentaires