Actualités - Actu en bref

Bulletin de veille – Janvier 2024

Ce premier bulletin de l’année 2024 tient compte d’une partie des résultats de l’enquête menée fin 2023 : il est plus court et plus concis. D’autres évolutions sont à venir.

L’actualité dans vos domaines

Mise à jour de la stratégie européenne en physique des particules. Votée par l’Assemblée générale du Consortium Européen pour la Physique des Astroparticules (APPEC), elle marque l’émergence de nouveaux objectifs et montre un besoin croissant de coordination, notamment pour le traitement des données. A lire ici.

nmrshiftdb2 : 20 ans déjà ! Lancée en octobre 2003 et développée par l’Institut Max Planck Ecologie Chimique de Jena, la base de données ouverte et open source est l’un des projets les plus anciens en matière d’open data en chimie. FAIR bien avant que les principes ne soient posés, nmrshiftdb2 permet d’effectuer des recherches de spectres, de structures et sous structure, de conditions de mesures et d’autres métadonnées. Cet article évalue les apports du projet en termes de qualité des données, de satisfaction des usagers, d’usage.

La science ouverte, une pratique essentielle… pour l’IA. En chimie de synthèse et en informatique moléculaire, les pratiques de science ouverte deviennent la clé de l’application de l’IA selon une équipe de chercheurs allemands. Dans un preprint, ils listent des bases de données, entrepôts et outils ouverts disponibles et présentent les usages possibles d’une combinaison de jeux de données d’entraînement et d’apprentissage automatique pour la découverte de principes actifs en chimie pharmaceutique.

La reproductibilité à l’épreuve : un exemple en science des matériaux. Si la science ouverte est de plus en plus présente dans les pratiques des chercheurs en chimie, qu’en est-il de la reproductibilité ? A partir d’un exemple issu de la chimie computationnelle appliquée aux matériaux, une équipe canadienne tente de reproduire le contenu d’un article. Code et documentation incomplets, versions de logiciels incompatibles ou complexité des dépendances constituent autant de freins. Les auteurs proposent quelques pistes et bonnes pratiques dans cet article.

Les brevets source de données. L’extraction d’informations sur des composés médicamenteux à partir de la fouille de brevets n’est pas nouvelle. SureChEMBL contient plus de 14 millions de composés extraits de plus de 24 millions de brevets. Cet article publié dans Journal of Medicinal Chemistry présente un outil d’extraction et d’analyse des composés médicamenteux PatentNetML, qui doit permettre de produire des données enrichies (intégrant les propriétés de toxicité, par exemple).

Intelligence artificielle

ChatGPT entre dans la boîte à outils des chimistes. Des outils destinés à assister les chimistes dans leurs tâches courantes en chimie de synthèse existent déjà (tel Chemcrow). Dans cet article, des chercheurs britanniques proposent un outil optimisant l’utilisation de ChatGPT. Ils élaborent un modèle permettant de prédire des propriétés moléculaires et d’identifier des patterns dans de grands jeux de données. Deux chercheurs suisses reviennent également dans un preprint  sur leur expérience de l’utilisation de ChatGPT pour l’extraction de propriétés moléculaires. Ils relèvent les difficultés rencontrées pour parser les noms des molécules du fait de l’absence d’utilisation de formats normalisés tels SMILES et INCHI.

Un agent autonome pour la recherche en chimie. Coscientist est un agent intelligent utilisant des techniques de Large Language Modelling pour concevoir, planifier et réaliser des expériences scientifiques complexes en s’appuyant sur des contenus ouverts (jeux de données, documentation, API, etc.). Cet article publié dans la revue Nature étudie la performance de Coscientist pour la réalisation de quelques tâches-clés. Une actualité présente une courte synthèse des utilisations faites de cet outil en chimie.

Google investit la science des matériaux.  En utilisant les données de Materials Project, plateforme hébergée par Lawrence Berkeley National Laboratory (LBNL), Google Deep Mind a généré près de 400 000 nouveaux composants qui viendront à leur tour enrichir la base de données. Plusieurs articles publiés dans Nature reviennent sur les projets de Google : le développement de Gnome et la mise en place d’un laboratoire autonome, entièrement robotisé, A-Lab qui devrait permettre d’accélérer les tests expérimentaux en synthèse inorganique.

Science ouverte

Les logiciels issus de la recherche publique française. Le ministère de l’Enseignement supérieur et de la Recherche présente l’état des lieux des logiciels issus de la recherche publique française. Voici quelques chiffres : un panel de 1331 logiciels répertoriés, 65 % des logiciels sont des applications autonomes, 48 % sont développés depuis 10 ans et plus et la communauté contributrice varie de 2 à 20 personnes pour 77% des logiciels.

La science ouverte dans le monde. L’UNESCO publie le document « Perspectives sur une science ouverte », qui explique les tendances concernant la science ouverte à travers le monde. A lire ici.

Introduire la gestion des données dès le Master. Très tôt, dans leurs projets, les étudiants en chimie sont appelés à collecter, analyser, interpréter et publier des données. Les auteurs, dans cet article, présentent trois axes permettant d’introduire ces notions : l’utilisation de lab notebooks (Jupyter par exemple), de vocabulaires contrôlés et de métadonnées, et le partage du code.

De nouveaux services dans HAL.

  • Le service “suggestions de dépôt” permet d’importer automatiquement dans HAL, à partir de son compte, les publications repérées comme étant en libre accès sur d’autres plateformes.
  • Un autre service permet de soumettre un pre-print déposé dans HAL à une évaluation de Peer Community In dès le formulaire de dépôt.

Publication scientifique

La réponse de 3 sociétés savantes de Physique au plan S. L’Institute of Physics Publishing (IOP)  l’American Institute of Physics Publishing  (AIP) et l’American Physical Society (APS) font une réponse commune au plan de la cOAlition S « Towards responsible publishing, a proposal from cOAlition S ». Si elles soutiennent un système d’édition plus ouvert, elles insistent sur la nécessité d’un peer-reviewing rigoureux, dans le contexte de la multiplication d’articles frauduleux et sur le rôle fondamental qu’elles jouent dans l’édition scientifique.

ChatGPT s’invite dans la liste des 10 chercheurs de l’année 2023 de Nature. Il co-écrit des articles scientifiques, des réponses à des appels à projets, des cours, déboguer du code mais il est aussi capable d’inventer des références, « des faits », et de favoriser le plagiat. En quoi ChatGPT a si profondément affecté le monde scientifique en 2023 ? Cet article de Nature revient sur les controverses autour de ChatGPT qui ont marquées l’année 2023.

3000 USD : le prix de la corruption. Cet article de la revue Science revient sur une nouvelle stratégie déployée par la très lucrative industrie des paper mills (usines à articles) : la corruption des éditeurs en chef de certaines revues. Les pratiques d’Olive Academic, Tamjeed, iTrilon ou Tanu.pro notamment sont illustrées d’exemples ou de témoignages de chercheurs, dont celui d’un chimiste français pris pour cible.

Guides et ressources

2 nouvelles ressources à votre disposition :

Commentaires

Laisser un commentaire