Supports généralistes
Sommaire
- Pour débuter
- DoraNum
- Cours de l’INIST et de l’INRAE
- Les ressources des ateliers de la donnée
- Des fiches synthétiques
- Les guides OpenAire
- Le guide de l’Atelier Données de la MITI
- Des libguides
- Bootcamp
- Structurer et ouvrir ses données en 10 points
- Un manuel sur l’ouverture des données
- Jeux
- Passeports pour les doctorants
- Catalogues de formation
- Pour se perfectionner
- Cours en ligne de l’Université d’Edimbourg
- Cours en ligne de Research Data Netherlands
- Cours en ligne de UK Data Service
- Ateliers des bibliothèques du MIT
- The Research Data Managament Notebook
- How to FAIR
- Mieux connaître les outils européens Eudat
- Des idées de Mooc
- Science Ouverte
De nombreux organismes ont développé des supports adaptés aux acteurs de la recherche qui débutent dans la gestion des données.
POUR DÉBUTER
DoraNum
Un projet mené par le réseau des Urfist et l’Inist-CNRS a abouti à la publication de la plateforme DoraNum (Données de la Recherche : Apprentissage NUMérique à la gestion et au partage).
Neuf thématiques sont mises en exergue de manière très complète : enjeux et bénéfices, aspects juridiques (éthiques, intégrité scientifique), plan de gestion de données, métadonnées, identifiants pérennes, dépôts et entrepôts, stockage et archivage, data papers et datajournals, accès et visualisation. Différents contenus permettent d’aborder chacune d’entre elle de manière à la fois simple, rapide et très complète. Pour chaque thématique, vous trouverez une fiche synthétique (dont certaines ont été traduites en anglais), une vidéo (“la minute”), des fiches (“les essentiels”, sous forme de texte ou de vidéo) et un quizz d’auto-évaluation. D’autres ressources permettent d’approfondir (par exemple, sur la description des données). Un parcours interactif sur la gestion des données a également été conçu. La plateforme DoraNum s’enrichit très régulièrement de nouveaux contenus (par exemple, sur les software papers) : il est possible de s’abonner pour recevoir une notification à chaque parution de nouveau contenu.
Cours de l’INIST et de l’INRAE
Dans ”Une introduction à la gestion et au partage des données de la recherche”, conçu en 2014, l’Inist (CNRS) vous permet de découvrir de manière très synthétique les notions de base liées à la gestion des données (enjeux, décrire, publier les données) et les bonnes pratiques (cycle de vie, plan de gestion des données). Des quizz et des exercices sont également mis à disposition. L’Inist propose également de manière très régulière des webinaires autour de la science ouverte (par exemple, sur DMPOpidor, le cycle de vie des données, etc.).
Sur OSCAR (Ouvrir la Science, Connaissances à AcquériR), les 3 premiers modules de la formation à la Science ouverte d’INRAE, sont désormais accessibles en libre accès sur la plateforme Callisto
Les ressources des ateliers de la donnée
En France, chacun des ateliers de la donnée propose des formations et des ressources. Il est possible d’accéder aux services proposés ici. Une bibliothèque Zotero compile toutes les fiches pratiques réalisées par les ateliers de la donnée.
Des fiches synthétiques
Les bibliothèques de l’Université de Cambridge proposent des guides très synthétiques sous forme de questions/réponses autour de la création, l’organisation, le partage des données et les cahiers de laboratoire électroniques.
Il en est de même pour l’Université de Delft qui met à disposition différentes synthèses et une FAQ.
L’Université de Princeton rassemble de nombreux conseils et ressources dans sa rubrique Research Lifecycle Guide.
La plateforme DataOne, (Data Observation Network for Earth), consacrée aux sciences de l’environnement, met à disposition un Data Management Skillbuilding Hub. proposant de nombreux conseils tout au long du cycle de vie de la donnée.
Les guides d’OpenAire
OpenAire (1) propose à destination des chercheurs de nombreux guides à l’adresse des chercheurs : exigences des financeurs, gestion des données, aspects juridiques.
Le guide de l’Atelier Données de la MITI
Proposé par le groupe de travail inter-réseaux «Atelier Données» de la MITI, cet guide s’adresse à toute personne désireuse de se former à la gestion des données de la recherche, et son objectif est d’aider le lecteur à analyser son besoin et trouver des solutions parmi l’éventail des communications et bonnes pratiques présentées.
Des libguides
L’Université d’Oxford a publié des libguides (2).
Plusieurs libguides conçus par l’Université Vrije d’Amsterdam abordent le cycle de vie de la recherche, depuis l’établissement du projet jusqu’au stockage des données en passant par la collecte et l’analyse.
Bootcamp
L’Université de Bristol vous propose un tutoriel sous forme de quizz. Vous pouvez ainsi tenter de répondre à des questions telles que :
Quelle est la durée de vie d’un disque dur ? Le plan de gestion des données doit-il être établi avant la production de données ? Quel est le taux de citation des publications qui sont accompagnées de jeux de données ?
Structurer et ouvrir ses données en 10 points
Sur LibraryCarpentry (3), l’Université d’Utrecht diffuse un support concernant la mise en application des principes FAIR.
Un manuel sur l’ouverture des données
Le manuel en ligne Open Data Handbook, crée par l’OpenKnowledge Fondation comprend un guide des données ouvertes avec des études de cas et de nombreuses ressources.
Jeux
Un jeu de table a été conçu par l’INIST et DoraNum sur le gestion des données : GopenDoRe, jeu de cartes découpé en 4 parties (Gestion, Analyse, Diffusion, Archivage).
What’s in a Name? Can you find the right data files in time? Ce jeu très court proposé par l’Université de Pennsylvanie permet d’appréhender les enjeux liés au nommage des fichiers. D’autres séquences de jeux sur d’autres thèmes sont à venir.
Passeports pour les doctorants
Le Comité Science Ouverte a conçu plusieurs Passeports pour la science ouverte, à destination des doctorants. Outre le Passeport pour la science ouverte original (dont il existe une version en anglais Passport for Open Science – A Practical Guide for PhD Students., régulièrement mis à jour, sont proposés : des guides spécifiques pour les données de la recherche, les codes et logiciels, et un guide Entrez dans le débat. Dans une série « Passeport : initiation à la science ouverte » cinq capsules vidéo sont diffusées sur la chaine CanalU, illustrées par des témoignages de jeunes chercheurs : qu’est-ce que c’est la science ouverte ?, des ressources ouvertes à découvrir, la gestion des données et le cycle de vie des données, la thèse en accès ouvert, la diffusion des travaux scientifiques en accès ouvert.
Catalogues de formation
Le réseau des URFIST propose tout au long de l’année un catalogue de formation, en distantiel ou en présentiel, dont les thématiques couvrent l’ensemble du cycle de la recherche.
Le LabEx DRIIHM (Dispositif de Recherche Interdisciplinaire sur les Interactions Hommes-Milieux) recense et décrit finement (thématique, niveau, durée, etc.) dans son Outil de Recherche de Ressources en Science Ouverte (ORRSO), 300 ressources de formation sur la science ouverte, (données, publications, aspect juridiques, etc.)
POUR SE PERFECTIONNER
Plusieurs ressources permettent d’acquérir des connaissances complètes sur la gestion des données.
Cours en ligne de l’Université d’Edimbourg
Mantra Research Data Management (MANTRA est un cours en ligne créé par l’Université d’Edimbourgh). Il s’adresse à différents publics : doctorants, chercheurs, professionnels de l’information scientifique et technique. Ce cours réputé et précurseur de nombreuses autres initiatives, propose des vidéos, des retours d’expérience, des exercices et des éléments de bonnes pratiques. Différents thèmes sont disponibles :
- Contexte
- Plan de Gestion des Données/ Data Management Plan
- Organiser ses données
- Préparer vos données pour l’archivage
- Assurer la sécurité des données de recherche
- Protéger les données sensibles
- Partage et accès FAIR
- Tutoriels et manuels
Issue du dispositif Mantra, une ressource disponible sur Zenodo fournit une vue d’ensemble de l’enjeu de Research Data Management en quatre courts modules (4) : introduction, trouver des données, travailler avec les données de la recherche, planification de la gestion des données. Deux spécialistes et formateurs sur la gestion des données, Sarah Jones et Steve Diggs, ont également mis à disposition leurs supports de formation produits pour la summer school (5) “CODATA RDA Research Data Science Summer School Teaching Materials” : RDM (Research Data Management), DMP (DataManagementPlan), Fair Data, How fair are your data, etc.
Cours en ligne de Research Data Netherlands
Essentials 4 Data Support, produit par le Research Data Netherlands propose des cours très intéressants et très complets :
Cours en ligne de UK Data Service
Le service britannique des données propose un programme généraliste d’éducation à la gestion des données : » Learning Hub – Research Data management » (6). Le service a publié une seconde édition de l’ouvrage Managing and Sharing Research Data: a guide to good practice, dont le contenu en html est accessible ici ; en suivant le cycle de vie des données de la recherche, il comprend par chapitre des vidéos, des études de cas, des check-lists, des outils, des templates, des exercices et ressources web.
Ateliers des bibliothèques du MIT
Les bibliothèques du MIT ont mis en place un service support avec des ateliers thématiques dont les supports sont accessibles. Parmi ceux ci, Quick & dirty data management: the 5 things you should absolutely be doing with your data now, une méthode d’organisation de vos fichiers et des conseils pour mieux gérer les versions de vos jeux de données.
The Research Data Managament Notebook
Cette collection d’exercices déclinée en chapitre suit le cycle de vie des données de la recherche et aborde par exemple le stockage et la sauvegarde des données, leur organisation et leur nommage, leur description, la conversion des fichiers pour l’archivage, etc. Briney, K. (2023). The Research Data Management Workbook. Caltech Library. https://doi.org/10.7907/z6czh-7zx60
How to FAIR ?
How to FAIR ? est un site de ressources sur la gestion des données selon les principes FAIR, publié par les universités danoises avec le soutien de la Research Data Alliance. Présentant de nombreux témoignages de chercheurs, il comprend différentes rubriques comme le format des fichiers, les métadonnées, les licences, les identifiants, etc. De nombreux exemples concrets permettent d’appréhender la gestion des données. Tout le contenu du site (textes, transcription des entretiens, images) sont accessibles sur Zenodo et réutilisables
Mieux connaître les outils européens Eudat
Le programme EUDAT Training est un service de formation et d’éducation destiné aux communautés et aux chercheurs et propose de nombreux webinaires sur des thématiques comme les DMP, les métadonnées, etc. Il souligne le rôle d’Eudat, soutien aux infrastructures de recherche et les services qu’ils proposent (comme B2Share, B2Find, B2Access,B2Safe). Dans la rubrique “Event et media”, vous trouverez également 6 webinaires et une galerie vidéos sur des retours d’expérience. Plusieurs études de cas (liés à des projets de recherche) sont également décrits.
Des idées de Mooc
Recherche reproductible : principes méthodologiques pour une science transparente. C’est le thème retenu par trois chercheurs (Arnaud Legrand, Christophe Pouzat et Konrad Hinsen) pour la mise en place d’un Mooc lancé en mars 2020. Les outils Markdown, Jupyter, Rstudio ou Org-mode sont notamment abordés. Une deuxième partie est également disponible pour approfondir cette thématique sous l’angle des outils et des pratiques : Reproducible Research II: Practices and tools for managing computations and data. Sur la thématique de la reproductibilité de la recherche, il est également possible de consulter « Cahuzac, E. (2023, décembre 4). Reproductibilité des données de recherche : définitions, enjeux, risques, bénéfices, recommandations. Les données, le nerf de la reproductibilité de la recherche, En ligne (France). Zenodo. https://doi.org/10.5281/zenodo.10256820«
Research Data Management and Sharing est un MOOC conçu par l’Université de Caroline du Nord à Chapel Hill et l’Université d’Édimbourg. Il est disponible sur la plateforme Coursera.
Plus généralement, Sorbonne Université propose un Mooc Science Ouverte qu’il est possible de suivre toute l’année.
Science Ouverte
Pour aller plus loin, le portail FOSTER est une plateforme d’apprentissage en ligne qui rassemble de multiples ressources européennes de formation destinées aussi bien à ceux qui veulent découvrir les notions de science ouverte que ceux qui cherchent à acquérir des compétences.
- OpenAIRE (Open Access Infrastructure for Research in Europe) a pour objectif de soutenir la science ouverte en Europe en proposant une plateforme d’accès aux publications et aux données de la recherche.
- Un libguide est un outil d’édition de contenu permettant la création de guides thématiques, outil très utilisé dans les bibliothèques.
- LibraryCarpentry, communauté de formateurs issus des bibliothèques et des centres de données qui met à disposition des supports pédagogiques qui peuvent être utilisés pour faire de l’auto-apprentissage ou animer une formation.
- EDINA and Data Library. (2017, November). Research Data Management overview (Version 1.2). Zenodo. http://doi.org/10.5281/zenodo.1062722.
- Sarah Jones, & Steve Diggs. (2018, October). Research Data Management sessions. Zenodo. http://doi.org/10.5281/zenodo.1451961.
- Louise Corti, Veerle Van den Eynden, Libby Bishop, Matthew Woollard, Managing and Sharing Research Data, A Guide to Good Practice, 2014, Second Edition, Sage Publications.