Bulletin de veille – Mai 2021

Accueil Actualités Bulletin de veille – Mai 2021

L’actualité dans vos domaines
Edition scientifique
Intelligence artificielle
Institutions
Enquêtes

L’actualité dans vos domaines

Utilisation de cahiers de laboratoire électroniques pour le criblage de molécules et la recherche médicamenteuse. Le National Center for Advancing Translational Sciences (NCATS) a mis au point une plateforme nommée AICP permettant de concevoir, synthétiser et cribler des molécules de manière automatique. Cette plateforme utilise notamment les données réactionnelles issues des différents cahiers de laboratoire électroniques du NCATS, en rencontrant toutefois quelques difficultés : absence de description standardisée des processus d’expérimentation, une ambiguïté dans l’utilisation des termes reactant et reagent, la capture non systématique du succès ou de l’échec d’une réaction, etc. L’utilisation d’un cahier électronique est tout de même plébiscitée pour la synthèse de molécules à partir du moment où il dispose d’une API, d’un système de calcul et de visualisation automatique et d’une fonctionnalité permettant de comparer une molécule avec un ensemble.

Une base de données en friction. Sur le site de Springer Nature, un chercheur en physique de l’Université de Californie Merced, en collaboration avec le Jet Propulsion Lab, revient sur la création d’une base de données mise à disposition dans l’entrepôt Dryad et recueillant des données à partir d’un ensemble complet de tests tribologiques pour caractériser des DFL (dry film lubricants), qui avaient fait l’objet d’un article en début d’année. Ces lubrifiants sont largement utilisés pour les composants mobiles spatiaux qui doivent fonctionner dans des conditions extrêmes dans l’espace. Une partie des tests a contribué aux décisions de conception pour le système de mise en cache des échantillons sur le rover Mars Perseverance. Les chercheurs ont ainsi souhaité mettre à disposition le fruit de ces expériences coûteuses, exigeantes en main-d’œuvre et précieuses pour les applications spatiales.

Recherche en physique des particules : des données exposées au piratage. Des chercheurs en sécurité informatique ont révélé les failles de sécurité informatique pesant sur les projets menés au sein du laboratoire américain Fermilab, spécialisé en physique des particules. Ils ont notamment eu accès à des fichiers confidentiels relevant du projet Nova, qui vise à déterminer le rôle des neutrinos dans l’évolution du cosmos. Ils ont également pu récupérer des mots de passe d’utilisateurs. L’opération a été relatée dans Artstechnica ainsi que sur le blog des chercheurs.

Chimie et science ouverte : une relation équivoque. Dans un article publié dans la revue Insights, Mario Pagliaro, chercheur en chimie à l’Université de Palerme, revient sur la trajectoire ambiguë des publications ouvertes dans son domaine. Au milieu des années 2000, plus de 50 revues de chimie étaient disponibles en open access, plaçant la discipline parmi les acteurs pionniers de l’ouverture. 10 ans plus tard, seuls 20% des articles en chimie sont disponibles en open access, un des taux les plus faibles. Le résultat d’une très forte concentration du marché éditorial entre les mains de quelques éditeurs comme ACS et RSC, où le taux de citation entre 2015 et 2017 des articles issus de revues sur abonnement excède celui des revues en open access.

ACS lance une plateforme de cours en ligne payante. Plus d’une centaine de cours et ressources sont proposés sur la plateforme ACS Institute, qui portent aussi bien sur la discipline que sur les compétences pouvant s’avérer nécessaires dans la carrière d’un scientifique (droit des brevets, techniques de communication scientifique etc). Voir le communiqué d’ACS.

RSC lance trois nouvelles revues en open access. Il s’agit de Digital Discovery, Sensors and Diagnostics et Environmental Science: Advances.Lire le communiqué.

Des métadonnées lisibles par la machine pour la diffusion d’articles scientifiques. L’outil LOPDF, décrit dans un article de PeerJ computer science, a pour objectif d’uniformiser les métadonnées relatives aux publications scientifiques et de les rendre accessibles informatiquement afin de permettre aux chercheurs de retrouver facilement des documents en lien avec leur thématique. La structure des métadonnées de l’outil a été réalisée en s’appuyant sur des métadonnées existantes issues de l’analyse de plusieurs éditeurs tels que Elsevier, IEEE ou Springer. Un jeu de données en format RDF peut être exporté depuis l’outil pour des analyses plus poussées.

Visbrowser : rechercher facilement des outils de Data Visualisation. Une quarantaine d’outils de visualisation sont recensés sur la plateforme : logiciels de bureau, applications web, bibliothèques JavaScript ou Python. Un système de filtre avancé permet de trouver un outil adapté à vos besoins.

Edition scientifique

Résultats négatifs : la face cachée de la recherche. Le Bulletin des Bibliothèques de France s’est intéressé à la question des résultats négatifs dans les publications scientifiques. L’article publié fin mai revient ainsi sur les notions “d’effet tiroir” et de biais de publication qui peuvent conduire à certaines distorsions. Il explore également plus en détail le rôle de médiateur que peuvent avoir les bibliothécaires en sensibilisant les communautés de recherche à l’enjeu de diffusion des résultats non-concluants et signale un projet de plateforme, Gaffex, visant à combler le déficit de canaux de diffusion de ce type d’expériences. En écho à cet article, vous pouvez aussi consulter notre ressource récemment mise à jour et participer à notre enquête ouverte depuis le 26 avril.

Plongée au cœur du phénomène des revues prédatrices. Les étudiants du Master en information et médiation scientifique et technique de Lyon 1 ont réalisé une vidéo très pédagogique d’une quinzaine de minutes, faisant notamment intervenir Hervé Maisonneuve, médecin de formation et sentinelle de l’intégrité scientifique. Sur son blog, celui-ci relaie par ailleurs une thèse de l’Université d’Ottawa, récemment publiée sur ce sujet.

Les “paper mills” : acheter des articles scientifiques préconstruits. De 1600$ à 15000$ : c’est l’intervalle de prix estimé par la revue Science en 2013 concernant l’achat d’un article scientifique ou de la paternité d’un article auprès de paper mills. Cet article de Nature revient sur les méthodes frauduleuses et toujours incertaines employées par ces organisations pour booster les carrières de certains scientifiques. La pratique s’avère notamment répandue en Chine où l’expression “publish or perish” s’applique le mieux, avec une étude de 2013 indiquant un chiffre d’affaires estimé à 4,46 millions de dollars en 2011. Un deuxième article fait le point sur l’utilisation de l’outil SCIgen pour générer des articles scientifiques.

Accords transformants et science ouverte. Ils représentent une tendance lourde de l’édition scientifique, avec 90 accords signés en 2020 (principalement avec les pays d’Europe du Nord), contre seulement 3 cinq ans plus tôt. En chimie et physique, pas moins de 40 accords ont été scellés avec RSC, ACS et IOP, selon une étude menée sous l’égide du CoSO et qui vient d’être rendue publique. S’ils visent à étendre la publication en accès ouvert, ces accords entraînent en contrepartie de sommes importantes versées aux éditeurs, en lieu et place du modèle de l’abonnement. Les négociations aboutissent à des modèles très complexes (coût fixe, nombre d’articles limité / coût fixe, nombre d’articles illimités, coût variable / nombre d’articles variables) et pas toujours transparents.

Comment réinventer la publication scientifique ? C’est le sujet sur lequel s’est penché cet article du site The Conversation en se fondant notamment sur les expériences menées au sein de la communauté des mathématiciens, qui cherchent à s’affranchir des revues commerciales. Parmi les différentes initiatives mises en avant, les épijournaux (tel que Episciences), où la soumission et la publication des articles passent par le biais des archives ouvertes. Les différents articles scientifiques restent ainsi entièrement libres d’accès pour les différentes communautés et permettent d’éviter aux chercheurs la dépense liée aux frais de publication.

La visibilité des chercheurs : une arme à double tranchant. Dans un article de pré-print intitulé “Open Science as an Engine of Anxiety”, Martin Reinhart, chercheur à l’Université de Humboldt à Berlin s’intéresse ainsi aux conséquences de la visibilité accrue des chercheurs par le truchement du numérique. Si les différentes plateformes virtuelles peuvent être de véritables tremplins médiatiques pour certains chercheurs, on constate un phénomène de “starification”, qui s’est révélé avec acuité pendant la pandémie liée au Covid-19. Les chercheurs très sollicités sur des sujets demandant une grande expertise ont pu se retrouver sur le devant de la scène. Cette notoriété accrue pourrait avoir des conséquences néfastes, tant la pression sur les acteurs de la recherche est grande.

La science ouverte appliquée au Covid-19 ne profite pas à tous les pays. Le mouvement récent d’ouverture des données de la recherche relative au Covid-19 ne fait pas l’unanimité. Les pays aux ressources limitées contribuent aujourd’hui activement à l’analyse et au séquençage des génomes du virus, notamment via l’entrepôt de données GISAID. Cependant seulement 0,3% des vaccins leur ont été envoyés selon un article de Nature. Une ouverture massive des données considérée comme déloyale pour ces pays.

Le débat des “real-world data”. 400%. C’est l’augmentation estimée des publications déposées sous forme de preprints en lien avec le Covid-19 et basées sur des “real world data” selon la Royal Society Of Medicine. Ces données produites en dehors du contexte de la recherche scientifique mais qui ne sont pas sans intérêt dans le cadre d’études permettent une accumulation plus rapide des connaissances sur un sujet donné. Mais cette augmentation drastique des publications mises en ligne sans peer-review s’est aussi accompagnée d’une augmentation d’études plus “douteuses”, occasionnant ainsi un nombre important de rétractation des publications sur ce sujet.

Impact de la mise à disposition des données sur le processus de publication. Les chercheurs sont partagés entre deux feux : d’une part, l’obligation croissante de produire des “déclarations de mise à disposition des données” qui peuvent être chronophages, d’autre part, l’incitation à produire le plus vite possible pour disséminer les avancées scientifiques. Une étude publiée dans Learned Publishing s’est penchée sur cet enjeu, au regard des politiques affichées par 3 revues d’IOP, dont Journal of Physics: Complexity. Le temps de traitement de ces nouvelles opérations est susceptible de renchérir les coûts de production des articles, peut-on lire.

Comment citer des données de recherche dans un article ? Springer publie un court billet afin de rationaliser et d’améliorer la citation des données publiées en ligne et sur lesquelles les auteurs s’appuient dans le cadre de leurs publications. 5 métadonnées sont requises : l’auteur, le titre du jeu de données, le nom de l’entrepôt, le DOI et la date de publication. L’éditeur recommande d’éviter “d’inventer” ou “d’estimer” ces informations si elles ne sont pas clairement fournies, au risque de fournir une citation erronée.

Intelligence artificielle

Prédire le potentiel d’impact d’un article. Un algorithme de machine learning développé par deux chercheurs du MIT et décrit dans Nature biotechnology met en évidence les articles à fort potentiel d’impact. Les données initiales fournies proviennent de publications de 42 journaux en biotechnologie de 1980 à 2019. Les chercheurs à l’origine de l’algorithme ont utilisé l’outil pour recueillir 50 articles de 2018 avec un fort potentiel d’impact sur le milieu scientifique dans les années à venir.

Intelligence artificielle : nouveau cadre européen, initiatives françaises et applications en chimie. Un règlement proposé en avril 2021 par la Commission européenne vise à harmoniser la législation relative à l’IA, avec une volonté d’assurer que les systèmes utilisés soient dignes de confiance et qu’ils respectent bien les lois édictées. Ce règlement intervient dans un contexte de forte hausse du nombre de publications en IA depuis ces dix dernières années, multiplié par 2.5 entre 2010 et 2019 pour la production mondiale, comme en témoigne le récent rapport sur l’ESR publié par le Mesri. Le nombre de brevets en IA déposés à l’Office européen des brevets à été multiplié par 4 sur cette même période. En France, le site data.gouv vient de mettre en ligne une page dédiée au recensement de jeux de données se prêtant bien à l’apprentissage du machine learning. Enfin, deux articles portant sur le machine learning appliqué à la chimie ont récemment été publiés, l’un sur l’espace chimique des liquides ioniques et l’autre sur l’énantiosélectivité des organocatalyseurs.

Institutions

Initiative européenne pour contrer les pratiques des éditeurs privés. L’association des Universités européennes et Science Europe (dont l’ANR fait partie), co-signent un communiqué déplorant les pratiques “opaques” de certains éditeurs commerciaux, qui font obstacle au dépôt d’articles (version revue par les pairs avec licence CCBY) dans les archives ouvertes. “Nous enjoignons les éditeurs de revoir leur position”, affirme le document.

La cOAlition S dit non aux revues hybrides. La cOAlition S se positionne clairement en défaveur des revues hybrides. Que ce soit par leur modèle économique fondé à la fois sur les frais de publication en plus des frais d’abonnement (qui peuvent être jusqu’à près de 40% plus cher qu’une revue full OA), la qualité de service qui peut sembler douteuse lors de la mise en ligne des articles compte tenu du prix payé ou encore le taux d’ouverture des revues hybrides qui n’atteint pas du tout les taux espérés (92 revues hybrides sur plus de 4000 de Elsevier et Wiley en 20 ans) les revues hybrides sont considérés comme un véritable frein à l’ouverture des données de la recherche pour la cOAlition. A l’avenir, les agences de financement de la recherche membres du Plan S cesseront toute forme d’appui financier à ce type de revues.

Futur entrepôt national de données : les orientations prises. La future “plateforme nationale fédérée des données de recherche” a été présentée le 11 mai par Isabelle Blanc, administratrice en charge des données au sein du Mesri. Annoncée pour mars 2022 et hébergée sur les serveurs du CEA, elle permettra aux chercheurs de déposer leurs données de recherche, avec modération des dépôts. Afin d’éviter la fragmentation des instances disponibles, la plateforme moissonnera également les données présentes ailleurs. L’accompagnement des chercheurs sera renforcé avec la mise en place des “ateliers de la donnée”. Les deux premiers volets (entrepôt et moissonnage) sont financés par le fonds national pour la science ouverte. Le volet lié à l’accompagnement des chercheurs reposera sur des appels à projet trois fois par an, à raison de 3 millions d’euros.

Près de 3 publications sur 5 issues des chercheurs de Lyon 1 sont en accès ouvert. Pour la première fois, l’Université Claude Bernard Lyon 1 a mesuré, via le concours de la BU Sciences, la part de ses publications en open access, laquelle atteint 59% en 2019, soit 3 points au-dessus de la moyenne nationale. Cette proportion peut varier grandement d’une discipline à l’autre : la chimie apparaît comme la deuxième discipline la plus ‘fermée’, avec 40.6% d’ouverture au niveau de l’établissement, contre 54.8% au niveau national. En physique, la part d’ouverture concerne au contraire près de 80% des publications.

CNRS et science ouverte. Pour la première fois, le CNRS publie les chiffres d’ouverture de ses publications scientifiques. Près de 67% des publications datées de 2019 sont en accès ouvert, soit plus de 10 points au-dessus de la moyenne nationale établie à 56%. La proportion est néanmoins en-deçà de l’objectif de 100% d’ouverture visé par l’institution. Le recours à l’archive HAL fait partie des leviers envisagés pour atteindre cet objectif. Depuis 2020, le CNRS exige une publication des articles en texte intégral dans l’archive institutionnelle pour la constitution du compte rendu annuel d’activité des chercheurs.

Open data : une opportunité pour les chercheurs ? Une circulaire publiée le 27 avril, relative à la “Politique publique de la donnée des algorithmes et des codes sources” prévoit une communication accélérée des codes sources et algorithmes utilisés par les services publics et pouvant avoir un intérêt pour les chercheurs qui en font la demande.

Software Heritage : 10 milliards de codes sources archivés, quelle garantie de pérennité dans le temps ? L’archive en ligne Software Heritage, qui pèse presque un demi pétaoctet maintenant continue d’accueillir depuis 6 ans de grandes quantités de codes sources. Durant la dernière journée Société Informatique de France, son fondateur Roberto di Cosmo (une interview récente publiée dans le BBF est disponible ici) précisait les mesures mises en place pour minimiser le risque de pertes : la création d’une fondation à but non lucratif pour le projet, l’infrastructure de Software Heritage en accès complètement libre, des sources de financement multiples provenant d’organisations publiques et d’industriels, et enfin la construction d’un réseau international de miroirs permettant la sauvegarde de l’archive sur plusieurs sites.

La France dans le programme H2020. Le dernier bilan concernant le programme de financement européen H2020 montre que la France est un des pays qui bénéficie le plus du programme. Derrière ses voisins allemands et britanniques, elle affiche un taux de succès de 16,5%. On constate également que les 2 premiers acteurs européens qui bénéficient des financements du projet sont français : le CNRS et le CEA occupent en effet les 2 premières places de ce classement. Cependant ces résultats sont à relativiser en raison d’un faible taux de dépôt de projets français (seulement 8,7%) ainsi qu’une baisse de projets retenus ayant une participation française (passant de 27,7% pendant la période 2007-2013 à 22,8% aujourd’hui).

Trouver son entrepôt de données. Le service de documentation de l’Université de Bordeaux propose un nouvel outil afin de guider les chercheurs dans leur choix d’entrepôts de données via 4 questions (coût/gratuité, accès restreint, modération des dépôts etc). L’outil se limite pour le moment à 8 plateformes généralistes, dont Zenodo et Figshare.

Enquêtes

Lever le voile des résultats dits “négatifs”. L’enquête conduite par l’équipe-projet de Datacc se poursuit jusqu’au 21 juin. Une version en anglais est désormais disponible. Rappelons que cette enquête, qui s’adresse en priorité aux chercheurs en chimie, physique, sciences de l’ingénieur et de l’environnement, a pour but d’améliorer la connaissance des pratiques des chercheurs en vue de la mise en place d’une plateforme de diffusion de ce type de résultats.

Mieux cerner les pratiques pour mieux accompagner les chercheurs. C’est le but affiché par l’enquête menée dans le cadre du groupe de travail « Réussir l’appropriation de la science ouverte » du CoSO. Ouvert à toute personne de l’ESR, le questionnaire sera clôturé le 15 juin.

Enquête de Springer et Figshare sur l’ouverture des données de recherche. Comme chaque année, cette enquête donnera lieu à la publication d’un état des lieux en la matière, avec une analyse des spécificités par discipline. Date butoir de participation : 30 juillet.

Enquête sur l’impact du Plan S. Les chercheurs sont invités à participer à cette enquête très courte lancée par les principaux financeurs de la recherche en Europe. Date butoir de participation : 23 juin.

ACS cahiers de laboratoire électroniques données négatives intelligence artificielle Plan S revues prédatrices

Commentaires

Laisser un commentaire Annuler la réponse

Vous devez être connecté pour publier un commentaire.