Bulletin de veille – Octobre 2021
- L’actualité dans vos domaines
- Open source
- Etudes sur les données
- Edition scientifique
- Institutions
- Personnalités
L’actualité dans vos domaines
Nouvelles exigences éditoriales d’ACS sur les données. Annoncée le 30 septembre, la politique d’ACS en matière de communication des données “représente une étape cruciale visant à assurer que les résultats rapportés dans nos revues sont vérifiables, reproductibles et facilement accessibles pour les chercheurs”, indique l’éditeur dans un communiqué. Quatre niveaux d’exigences sont prévus, selon le degré de contrainte appliqué par les équipes éditoriales. Toutes les revues appliquent désormais le niveau 1, qui encourage le partage des données et la communication d’une déclaration de disponibilité de ces dernières. Le niveau 4 correspond à l’échelon le plus strict : il impose non seulement la diffusion des données mais également leur peer-reviewing.
Conférence d’ACS sur la science ouverte. Une série de débats en ligne ont eu lieu à l’initiative de l’éditeur. Pour Sylvestre Bonnet, chercheur en chimie bioinorganique à l’Université de Leyde aux Pays-Bas, le partage des responsabilités est différent selon s’il s’agit de l’ouverture des publications ou des données. La réalisation du premier objectif dépend des financeurs de la recherche, quand le second relève davantage des éditeurs, dans un devoir de fiabilité des résultats avancés. Ben Mudrak, responsable de ChemrXiv a de son côté signalé que la soumission de pré-prints relatifs au Covid subissait un contrôle plus strict afin d’éviter des dépôts intempestifs d’articles dont le lien avec la pandémie était opportuniste ou artificiel.
Les données en chimie : un trésor caché ? C’est le sens de cet article d’opinion signé par deux chercheurs en chimie porteurs du consortium allemand NFDI4chem, soutenu par le gouvernement fédéral pour améliorer la gestion des données Outre-Rhin. Imaginant le cas d’un thésard ne parvenant pas à retrouver des données utiles à sa recherche produites il y a 15 ans, les auteurs évoquent les limites du recours au cahier de labo papier ainsi que l’intérêt d’exposer les métadonnées de l’expérience dans des entrepôts en ligne.
Nouvel entrepôt en spectrométrie de masse disponible sur Datacc. Le GNPS (Global Natural Product Social Molecular Networking) porté par l’Université de San Diego en Californie regroupe des spectres principalement à destination des chercheurs en chimie des produits naturels. L’accès aux données est libre et le dépôt accessible après la création d’un compte sur la plateforme avec possibilité de restreindre l’accès à ses données. Une multitude d’outils en ligne d’analyse de spectres sont également mis à disposition.
Le coût associé à la publication de données volumineuses. Rarement publiées faute d’espace de stockage suffisant, l’entrepôt de données Figshare offre désormais la possibilité de déposer de 250 Go à plusieurs téraoctets de données, après s’être acquitté des frais de traitement des données. La somme de ces data processing charges s’élève à 745$ pour 250 Go de données et 2500$ pour un To de données. Voir la fiche descriptive proposée par Datacc sur Figshare.
Standardiser les données enzymatiques issues de la catalyse avec EnzymeML. Le standard de métadonnées EnzymeML a été développé dans le but de représenter toutes les informations relatives aux données enzymatiques : leur description, les conditions de la réaction et les résultats obtenus. Construit à partir du Systems Biology Markup Language (SBML) lui-même écrit en XML, EnzymeML respecte également les recommandations STRENDA (Standards for Reporting Enzymology Data). La plateforme BioCatHub utilise déjà le standard EnzymeML, et son implémentation dans l’ELN Chemotion est sur la feuille de route de l’outil.
Informatiser la recherche de molécules présentes à l’état naturel. L’utilisation de plateformes de partage et d’analyse de spectres de masse commence à émerger en recherche de produits naturels selon cet article publié dans Natural Product Report. Ainsi, 96.2% des 79 répondants d’une enquête diffusée sur les réseaux sociaux utilisent déjà des données publiques dans leurs recherches. Le partage accru via des entrepôts spécialisés en spectrométrie de masse tels que GNPS, MassIVE, ou MassBank permettrait par la suite de constituer une source intéressante de données pour des analyses et du data mining. A noter : l’entrepôt MassBank est décrit sur le site du consortium allemand NFDI4Chem spécialisé dans la gestion et l’ouverture des données en chimie.
Pourquoi et comment partager ses données en biologie. Publié dans Synthetic Biology, cet article revient sur la nécessité du partage des données en biologie en expliquant que la démarche n’est non pas administrative, mais qu’elle vise plutôt à améliorer l’impact et la réutilisation des publications des chercheurs en démontrant que les expériences ont été correctement réalisées. Annotations de séquences ADN, données intermédiaires, scripts utilisés lors des analyses, résultats de tests, sont des exemples de données qui peuvent s’avérer utiles pour bien comprendre un article en biologie. Dans le même registre, un rapport publié mi-octobre sur l’entrepôt EMBL-EBI indique que près de 70% des chercheurs subiraient un “impact majeur ou sévère” s’ils étaient privés de l’utilisation de cette plateforme. 58% affirment par ailleurs qu’ils n’auraient pas pu produire le dernier jeu de données qu’ils ont utilisé grâce à l’entrepôt et qu’ils n’auraient pas pu le trouver ailleurs.
Du nouveau chez SciFinder-n. La base de données commercialisée par CAS (ACS) évolue : de nouveaux spectres ont été ajoutés et les identifiants Inchi et Inchikeys sont désormais mentionnés dans les fiches d’identité des substances. Pour plus de détails, consultez ce communiqué.
Open source
Mise à jour du cahier de laboratoire électronique open source eLabFTW. De nouvelles fonctionnalités sont disponibles grâce à la version 4.1 disponible sur l’instance Lyon 1 de l’outil. Il est désormais possible à l’administrateur d’obliger l’utilisation d’un modèle pour pouvoir créer des expériences. Cela peut notamment permettre d’améliorer l’organisation de votre cahier électronique. La recherche par métadonnées de l’expérience a également été développée pour pouvoir filtrer plus finement sur des critères que vous aurez vous-même définis.
Le rapport à l’open source d’Aristote à nos jours. Dans un article érudit et documenté, Bastian Wolff (Université de Cologne) et Daniel Schlagwein (Université de Sydney) mettent en perspective les enjeux de science ouverte en proposant une analyse historique depuis les racines aristotéliciennes de la science jusqu’aux pratiques contemporaines. L’article met particulièrement l’accent sur la dimension informatique du mouvement à travers les logiciels libres.
Etudes sur les données
Ouverture des données : avancées et perspectives futures. Interrogée dans le BBF dans le cadre de la traduction en français de son ouvrage sur les données de recherche, Christine Borgman revient sur les aspects qui mériteraient d’être mieux valorisés dans une démarche de partage des données. Les plans de gestion de données sont encore trop perçus comme un “outil bureaucratique” sans réelle finalité. La sensibilisation et l’accompagnement à la gestion des données devraient donc se faire dès le master puis en doctorat, par des professionnels de l’information issus du domaine de recherche dans lequel ils seront amenés à former ou sensibiliser les chercheurs. Les données non concluantes sont également mentionnées comme une étape importante dans l’avancée de la science et devraient être reconnues à leur juste valeur.
Plan de gestion de données : vers une approche plus disciplinaire ? C’est la feuille de route adoptée par un groupe de travail du réseau international RDA (research data alliance) qui propose une enquête d’une vingtaine de questions à destination des chercheurs en vue de mieux cerner leurs besoins et la réalité de leurs pratiques. Les résultats seront connus début 2022.
Vers des plans de gestion de données automatisés ? C’est le but des initiatives relatives au “machine actionable DMP” développées à l’échelle internationale. Le but affiché est de faire gagner du temps aux chercheurs tout en améliorant la description des contenus fournis dans le document. L’utilisation de standards devrait également permettre l’export au format JSON des informations renseignées dans le plan de gestion de données. l’Inist a ainsi lancé une version bêta de ces PGD exploitables informatiquement. L’organisation Research Data Alliance a également publié une présentation qui en résume les enjeux.
Connaître un peu mieux les entrepôts de données. A partir des plateformes recensées dans re3data.org, la chercheuse Ceilyn Boyd de l’Université Simmons à Boston apporte un éclairage sur le paysage actuel des entrepôts de données. Sur les 2646 plateformes disponibles, plus des trois quarts seraient spécialisés dans une discipline. Parmi les disciplines représentées, les sciences de la vie sont en tête. Plus d’un entrepôt sur 2 n’offre pas d’API.
Partage de données : les chercheurs en sont-ils satisfaits ? Une enquête lancée de mai à juin 2020 par PLOS, a interrogé des chercheurs d’Europe et d’Amérique du Nord pour évaluer les tâches associées au partage de données. Plus de la moitié des 617 répondants étaient issus de la biologie, des sciences de la vie, de la médecine et des sciences de la santé. 52% des sondés ont déjà été amenés à réutiliser des jeux de données produits par d’autres chercheurs, mais le score de satisfaction moyen pour l’accès aux données était relativement faible. Par ailleurs, le partage des données via les “informations supplémentaires” des articles reste la voie la plus courante de diffusion.
Parution d’un ouvrage abordant la gestion des données de recherche en sciences marines. L’ouvrage Ocean Science Data vient de paraître chez Elsevier. Le troisième chapitre se concentre en particulier sur l’ouverture des données en sciences de la mer à l’échelle internationale.
L’impact environnemental des données. Une étude de Digital Economy Compass Statistics 2019 projette que le volume annuel de données numériques en 2025 à l’échelle mondiale sera de 175 zettaoctets (soit 175 trilliards d’octets). La production toujours croissante de données a un impact environnemental conséquent, dont la production de CO2 (175 zettabytes stockés pendant 1 an = environ 109 tonnes eq CO2), ou l’exploitation des métaux pour les capacités de stockage (aluminium : +5%, cuivre : +3% ; métaux rares et spécifiques : +6 à 12%). Voici le lien vers l’atelier proposé par RDA France sur ce sujet.
Edition scientifique
Une nouvelle base de données sur les revues prédatrices. Baptisée Lacuna, elle indexe plus de 900 000 articles issus de 10 éditeurs (OMICS, Scientific research, Medcrave, Sciencepg, Academic journal, MDPI, Austin, Frontiers, Hindawi et Serials), pointent ses fondateurs dans un article publié dans Nature. Le travail de repérage a permis d’identifier certaines pratiques : l’éditeur OMICS, déjà condamné en 2018, s’efforce par exemple d’éclipser son nom au profit d’autres “marques”, comme Hilaris. Certaines revues prédatrices reprennent à leur compte des articles publiés ailleurs, en modifiant les noms des chercheurs et en plagiant le contenu. L’une des solutions, selon les auteurs, consisterait à généraliser l’open peer review. “Falsifier le peer review à grande échelle est très difficile”, estiment-ils. L’abandon de critères d’évaluation fondés sur la quantité d’articles produits pour déterminer les recrutements et l’évaluation des chercheurs fait aussi partie de l’équation.
Retrait massif d’articles déposés dans ResearchGate. Les éditeurs scientifiques ACS et Elsevier ont demandé le retrait de près de 200.000 articles déposés sur ResearchGate pour violation des droits à la propriété intellectuelle. Un grand nombre d’auteurs défendent cependant leur position en indiquant que leurs articles n’étaient plus sous embargo ou bien qu’ils avaient fait l’objet d’un rachat de droits et étaient désormais en open access, ou encore que la loi de leur pays leur permettait de partager librement leur article.
Enquête sur les désabonnements IEEE et Springer à l’Université de Lorraine. 70% des chercheurs interrogés indiquent que ces désabonnements n’ont eu aucun impact sur leur travail quotidien, ou qu’ils ont seulement suscité une légère perte de temps. 73% des répondants indiquent soutenir la démarche de l’Université en termes de science ouverte, sachant que 10% des chercheurs de l’Université de Lorraine ont participé à l’enquête, soit une proportion considérable. Tous les résultats de l’enquête sont disponibles dans cet article.
Accord national avec Elsevier : import des textes intégraux dans HAL. Depuis octobre, les articles des chercheurs affiliés à des laboratoires français ayant publié chez Elsevier est importée automatiquement dans HAL, selon un accord passé avec Couperin. Cela concerne dans un premier temps un lot de 3400 articles publiés entre janvier et octobre 2019, car l’accord introduit un délai de 24 mois. Les chercheurs peuvent aussi faire valoir le droit d’auto-archiver leurs articles 6 mois après leur parution (délai applicable pour les sciences dures). Plus de détails dans ce communiqué du CCSD.
Bibliométrie et science ouverte. La revue Arabesques propose un dossier spécial centré sur l’enjeu de la bibliométrie à l’heure de la science ouverte. On peut notamment y lire l’expérience menée au SCD de l’Université de Rennes 1, où une approche pragmatique de la bibliométrie prévaut. D’une part, la volonté de développer des bilans bibliométriques alternatifs à partir des données ouvertes de HAL (outil VizuHAL). D’autre part, la production de rapports bibliométriques fondés sur des indicateurs plus traditionnels (h-index, facteur d’impact) lorsque des demandes émergent en ce sens. L’ensemble du dossier est à lire sur la plateforme Prairial.
L’open access, un levier de croissance pour les éditeurs ? C’est le sens des éléments d’analyse fournis par le rapport de l’organisation STM publié en octobre. A l’heure actuelle, seuls 30% des articles scientifiques ont été publiés en accès ouvert via le versement de frais de publication (APC). Néanmoins, les revenus dégagés pourraient croître de 12,5% entre 2019 et 2022.
IOP Publishing lance trois nouvelles revues en open access. Celles-ci viennent enrichir la collection de revues sur les sciences de l’environnement : Environmental Research series): Environmental Research: Health (ERH), Environmental Research: Climate (ERCL) et Environmental Research: Ecology (ERE) . Pour les deux premiers titres, il est déjà possible de soumettre des articles.
IOP rend ses résumés d’articles librement accessibles. Annoncée le 21 octobre, cette démarche, qui vise à développer le machine learning applicable à certaines métadonnées importantes comme le résumé, est susceptible de faciliter à terme la constitution de revues de littérature plus complètes.
Institutions
Prix science ouverte du logiciel de recherche : les candidatures sont ouvertes. Les prétendants peuvent déposer leur candidature jusqu’au 6 décembre à partir de ce formulaire. “Le prix comporte plusieurs catégories qui distinguent les projets selon leurs dimensions scientifique et technique, leur capacité à former et animer leur communauté et la qualité de leur documentation.” Plus d’informations ici.
Futur entrepôt national de données. Conséquence du deuxième Plan National pour la Science Ouverte, la création de Recherche Data Gouv, plate-forme nationale fédérée des données de la recherche. RDA France a organisé un webinaire sur cette plate-forme avec une présentation d’Isabelle Blanc et Pierre-Yves Arnould. La plate-forme proposera, dès mars 2022, une offre de dépôt et de signalement des données de recherche ainsi qu’un accompagnement à la structuration, au partage et à l’ouverture des données aux équipes de recherche. Un appel à manifestation d’intérêt pour la mise en place d’ « Ateliers de la donnée » a été lancé.
Un portail unique pour les appels à projets. C’est le but du site appelsprojetsrecherche.fr qui regroupe les appels à projet scientifiques de plusieurs organismes (ADEME, ANR, l’Inserm, Anses et INCa).
La recherche française rétrogradée ? C’est la tendance qui se dégagerait du rapport provisoire de l’OST selon des conclusions obtenues par Le Monde. La France “se retrouve désormais à la limite d’être exclue du top 10 par le Canada, l’Espagne et l’Australie”, peut-on lire. Outre les problèmes de financement affectant les ressources humaines, d’autres facteurs sont mis en avant : le déficit d’investissement en instruments et appareils scientifiques (les exemples des cryo-microscopes et des sondes atomiques tomographiques sont cités) ou encore l’excès de bureaucratie.
Personnalités
Nobel de chimie 2021 : des catalyseurs de la chimie récompensés. Le prix Nobel de chimie 2021 a été attribué à l’Allemand Benjamin List et au Britannique David MacMillan pour avoir développé un nouvel outil de construction des molécules, « l’organocatalyse asymétrique ». C’est une nouvelle méthode qui utilise de petites molécules organiques comme catalyseurs au lieu d’enzymes ou de métaux. Cette innovation dans la construction moléculaire a conduit à des catalyseurs moins chers et plus respectueux de l’environnement.
Nobel de physique 2021 : la compréhension des systèmes complexes récompensée. Le prix Nobel de physique 2021 est attribué à trois scientifiques : deux experts de la modélisation physique du changement climatique, l’Américano-Japonais Syukuro Manabe et l’Allemand Klaus Hasselmann, ainsi qu’à l’Italien Giorgio Parisi, théoricien des systèmes physiques complexes.
Commentaires