Trouver des données

Des entrepôts de données dans vos disciplines

Pour identifier des entrepôts spécialisés, plusieurs options sont envisageables.

  • Nous avons pré-sélectionné une liste d’entrepôts disciplinaires en physique et en chimie qui présentent la particularité de permettre la recherche comme le dépôt de données.
  • Il existe également un nombre non-négligeable d’entrepôts ne permettant que la consultation de données, si vous n’êtes pas affiliés à l’institution ou au projet. Utilisez le tableau ci-dessous pour les explorer.

Si vous voulez élargir votre recherche, le répertoire Re3data.org (Registry of Research Data Repositories), crée en 2012 et financé par la German Research Foundation DFG référence, en avril 2020, 2487 entrepôts, tous domaines confondus. Parmi eux, 237 sont classés parmi les entrepôts de chimie et 325 en physique.
Si ces chiffres peuvent paraître colossaux, dans la réalité, le choix à disposition n’est pas toujours aussi large qu’il n’y paraît… Certains entrepôts occupent des secteurs de niche (cas d’un entrepôt spécialisé dans les données de conservation du poisson-zèbre sous forme de sperme congelé, pourtant rangé dans les entrepôts de chimie), d’autres nécessitent une affiliation institutionnelle pour pouvoir consulter les données (cas de l’entrepôt de l’Imperial College de Londres).

L’outil Re3Data permet de chercher des entrepôts par mot-clé, par sujet, par pays etc. Pour chaque plateforme, des icônes dressent une sorte de carte d’identité de l’entrepôt.

L’icône bleue vous signale que l’entrepôt fournit des identifiants pérennes (DOI), l’icône rouge indique que l’entrepôt répond à des critères qualité (certification).

D’autres répertoires internationaux existent, tels que Repository Finder, OpenDoar (filtre datasets) et Fairsharing.org.

4TU.ResearchData

Institution porteuse : 4TU.Federation, Université Technique de Delft (TU Delft), Université technique d'Eindhoven (TUE), Université de Twente, Université de Wageningen (WUR)
Base de données internationales pour la science, l'ingénierie et la conception. Propose plus de 10 000 jeux de données.

ADS (Astrophysics Data System)

Institution porteuse : Observatoire Astrophysique Smithsonien (SAO)
ADS propose 3 bases de données contenant plus de 13 millions de publications dans les domaines de l'astronomie, l'astrophysique et la physique.

Aviso+

Institution porteuse : Centre National d'Etudes Spatiales (CNES)
Aviso+ distribue des données altimétriques océaniques recueillies par satellites. Propose différents produits comme les hauteurs de mer ou les données vent/vagues, différents indicateurs, et autres...

Bass2000

Institution porteuse : Observatoire de Paris
Base de données d'observation du Soleil par des instruments au sol.

BindingDB

Institution porteuse : Université de Californie à San Diego

Cambridge Structural Database (CSD)

Institution porteuse : Cambridge Crystallographic Data Centre (CCDC)
Accès à plus d'un million de structures cristallines organiques et organométalliques à petites molécules. Données au format CIF.

Catalysis-Hub

Institution porteuse : Center for Interface Science and Catalysis, SLAC National Accelerator Laboratory, Stanford University
Une plateforme Web pour partager des données et des logiciels pour la recherche en catalyse computationnelle.

Centre de Données astronomiques de Strasbourg (CDS)

Institution porteuse : Institut National des Sciences de l'Univers (INSU, CNRS), Université de Strasbourg, Observatoire Astronomique de Strasbourg (ObAS).
CSD héberge la base de données SIMBAD, le catalogue VizieR et le logiciel Aladin.

Centre de Données de la Physique des Plasmas (CDPP)

Institution porteuse : Centre National d'Etudes Spatiales, Université Toulouse III - Paul Sabatier, Observatoire de Paris, CNRS
CDPP distribue des données de physique des plasmas. Les données proviennent de différentes missions spatiales telles que Arcad-3, Cassini, Cluster, Demeter, Double Star, etc...

CERN Open Data Portal

Institution porteuse : CERN (Suisse)
Point d'accès unique aux données produites par les recherches menées au CERN (programmes ALICE, ATLAS, etc.)

ChEMBL

Institution porteuse : EMBL - European Bioinformatics Institute
Base de données de molécules bioactives ayant des propriétés similaires à celles des médicaments.

Chemotion-repository

Institution porteuse : Institut de Technologie de Karlsruhe
Entrepôt adossé au cahier de laboratoire électronique Chemotion. Plus d'informations: https://www.datacc.org/warehouses/chemotion-repository/

ChemSpider

Institution porteuse : Royal Society of Chemistry
Base de données rencensant plus de 100 millions de structures chimiques. Possibilité de chercher par noms et structures chimiques.

CINECA (TurBase Knowledge Base)

Institution porteuse : EuHIT
CINECA est l’une des plus grandes bases de données au monde à la disposition de la communauté européenne des turbulences.

Dat@OSU

Institution porteuse : Université de Franche Comté
Créé en 2016, Dat@OSU est un catalogue de jeux de données en géosciences et domaines connexes, porté par l’Université de Bourgogne-Franche-Comté.

Data Terra

Institution porteuse : E-Infrastructure de recherche Data Terra
Ensemble des données et produits spécialisés dans l’observation du système Terre

DataONE

Institution porteuse : Collaboration entre plusieurs partenaires, financée par la Fondation Nationale étatsunienne pour la Science (NSF)
Accès à plus de 800 000 jeux de données. L'entrepôt dispose de nombreuses fonctionnalités de recherche.

Digital Rocks Portal

Institution porteuse : Center for Petroleum and Geosystems Engineering (CPGE) - Université du Texas à Austin
Donne accès à diverses données et images liées à microstructures poreuses ou à des mesures provenant d'expériences réalisées sur des microstructures.

DRYAD

Institution porteuse : Bibliothèque Digitale de Californie
Dryad propose l'accès à plus de 30 000 jeux de données en rapport avec les sciences du vivant. Les données sont modérées et sous licence CC0.

Earthdata

Institution porteuse : NASA
Un accès complet et ouvert à la collection de données sur les sciences de la Terre de la NASA

ECCAD

Institution porteuse : Aeris
Données atmosphériques disponibles au format NetCDF CF.

EDI Data Portal (Environmental Data Initiative Repository)

Institution porteuse : Environmental Data Initiative (Université du Wisconsin à Madison, Université du Nouveau Mexique)
Entrepôt de données proposant l'accès à près de 10 000 jeux de données écosystémiques modérées par l'équipe Environmental Data Initiative.

EELS Data Base

Institution porteuse : Université de Nantes, Institut des Matériaux Jean Rouxel
Données de spectroscopie de perte d'énergie des électrons. La base de données contient près de 300 spectres couvrant 43 éléments du tableau périodique

Electronic Archiving SYstem (EASY)

Institution porteuse : CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities), DANS (Data Archiving and Networked Services), KNAW (Royal Netherlands Academy of Arts and Sciences), NWO (Netherlands Organisation for Scientific Research)
EASY est un entrepôt multidisciplinaire proposant près de 160 000 jeux de données, dont plus de 28 000 dans les sciences interdisciplinaires, 29 000 dans les sciences de la vie, la santé et la médecine, et 600 dans les sciences et technologies.

European Data Portal

Institution porteuse : Bureau des Publications de l'Union Européenne (Publications Office of the European Union)
Accès à près de 1 200 000 jeux de données dans 81 catalogues nationaux. Les données proviennent de toutes les disciplines, et sont organisées par catégories, dont 'Energie', 'Environnement', 'Santé', 'Science et Technologie' et 'Transports' entre autres.

European Union Observatory for Nanomaterials (EUON)

Institution porteuse : Agence européenne des produits chimiques (ECHA)
EUON fournit des données sur les nanomatériaux disponibles sur les marchés européens. La recherche s'effectue par nanomatériau. La base de données contient 333 entrées/substances.

Figshare

Institution porteuse : Digital Science (groupe éditorial Holtzbrinck)
Figshare est un entrepôt multidisciplinaire proposant plus de 1 500 000 jeux de données.

GEISA

Institution porteuse : Ecole Polytechnique
Geisa propose des données spectroscopiques pour faciliter les calculs de transferts radiatifs atmosphériques.

Harvard Dataverse

Institution porteuse : Université de Harvard, IQSS (Institute for Quantitative Social Science)
Accès à plus de 100 000 jeux de données.

HEPData

Institution porteuse : CERN et IPPP
Cette base de données de physique des hautes énergies a été créée pour la dissémination de données expérimentales de physique des particules.

HITRAN (HIgh resolution TRANsmission molecular absorption database)

Institution porteuse : Harvard-Smithsonian Center for Astrophysics
Base de données de spectroscopie moléculaire. Il est utilisée pour prédire et simuler la transmission et l'émission de lumière dans les atmosphères.

IMEx Consortium

Institution porteuse : EMBL-EBI (Institut européen de bioinformatique, fait partie du laboratoire européen de biologie moléculaire EMBL)
Données d’interactions moléculaires, mises à disposition dans des standards conformes aux normes (PSI-MI XML2.5 ou MITAB).

InfoTerre

Institution porteuse : BRGM - Service Géoligique National
Données du BRGM : cartes géologiques, dossiers de la Banque de données du Sous-Sol et logs géologiques, cartes des risques naturels et industriels.

ioChem-BD

Institution porteuse : Centre de calcul de Barcelone
Données de chimie computationnelle au format CML. Possibilité de rechercher données par texte, élément du tableau périodique ou structure moléculaire.

Johns Hopkins Turbulence Databases

Institution porteuse : Université John Hopkins
Base de données sur les turbulences de plusieurs téraoctets. Il est possible de l'interroger via un navigateur web ou des webservices (C, matlab, python). Un onglet présente les publications liées.

Mass Bank

Institution porteuse : Mass Bank consortium
Données de spectrométrie de masse. Recherche possible par formule chimique, InChIKey, pics etc.

Materials Cloud Archive

Institution porteuse : National Centre of Competence in Research MARVEL, École polytechnique fédérale de Lausanne, Swiss National Supercomputing Centre
Données de science des matériaux computationnelle. Près de 20 000 000 structures cristallines, dont près de 8 000 000 associées à des calculs DFT SCF.

Materials Data Facility (MDF)

Institution porteuse : Université de Chicago
Donne accès à plus de 500 jeux de données en science des matériaux. Soutenu par le National Institute of Standards and Technology (NIST).

Materials Platform for Data Science (MPDS)

Institution porteuse : Université de Genève ; Scientific Consulting Company "Structure-Properties" (Lviv, Ukraine)
Base de données comprenant 2 millions d'entrées dans 3 thématiques : propriété physique, structures cristallographiques, diagrammes de phase.
A noter : accès gratuit à la recherche mais plusieurs produits sont payants.

MatrixDB

Institution porteuse : Université Lyon 1
Donne accès à des données expérimentales d'interaction de protéines de matrices extracellulaires, de protéoglycanes et de polysaccharides.

Mendeley Data

Institution porteuse : Elsevier
Accès à 27 millions de jeux de données multidisciplinaires, liés à des publications ou provenant d'autres entrepôts de données.

Nanomaterial Registry (NanoHub)

Institution porteuse : Purdue University
Données de recherche en nanotechnologies, ainsi qu'un grand nombre de ressources pédagogiques, présentations, cours, animations, podcast, etc.

National Centers for Environmental Information (NCEI)

Institution porteuse : Agence américaine d'observation océanique et atmosphérique NOAA (National Oceanic and Atmospheric Administration)
Accès à une des plus larges archives de données relatives à la recherche océanique, atmosphérique et recherche en géophysique du monde.

Neutron Monitor Database (NMDB)

Institution porteuse : Institut de Physique Expérimentale et Appliquée, Université de Kiel
NMDB permet d'accéder aux mesures de Neutron Monitor effectuées par des stations du monde entier.

NIST MML Materials Data Repository

Institution porteuse : Institut National des Standards et de la Technologie (NIST) (Etats-Unis)
Cette base de données fait partie de l'Initiative Génome de Matériaux (Materials Genome Initiative MGI) visant à établir des protocoles et des mécanismes d'échange de données pour améliorer leur qualité et améliorer les modèles sur les matériaux.

NoMaD Repository (Novel Materials Discovery)

Institution porteuse : Institut Fritz-Haber de la Société Max-Planck, MPCDF (Max Planck Computing and Data Facility), Université Humboldt de Berlin
Données et codes de science des matériaux computationnelle, physique, et chimie quantique.

NP-MRD

Institution porteuse : National Institute of Health (NIH)
La NP-MRD est une base de données qui accepte les données NMR et les métadonnées associées provenant d'études de produits naturels.

Nuclear Data Service

Institution porteuse : International Atomic Energy Agency (IAEA)
Donne accès à de nombreuses bases de données (propriétés atomiques et nucléaires, codes, rapports). Plus de 11 millions de données atomiques, moléculaires et nucléaires sont mises à disposition.

Open Materials Database

Institution porteuse : Université de Linköping, département de physique théorique
Base de données regroupant des informations sur les propriétés des matériaux. Les données sont récupérables informatiquement via un protocole dédié.

Open Science Framework (OSF)

Institution porteuse : Centre pour la Science Ouverte (COS)
Entrepôt de données multidisciplinaire proposant près de 200 000 jeux de données. Plateforme de travail collaboratif et de partage de données, permet la visualisation des données et le lien avec d'autres plateformes de stockage.

OQMD (The Open Quantum Materials Database)

Institution porteuse : Université Northwestern
Base de données de propriétés thermodynamiques et structurelles calculées par DFT de plus de 800 000 matériaux.

PANGAEA

Institution porteuse : Institut Alfred Wegener, Centre de recherche pour les sciences environnementales marines de Brême (MARUM)
Donne accès à plus de 400 000 jeux de données des sciences environnementales : biologiques, terrestres, marines, atmosphériques,...

Portail des données marines

Institution porteuse : Ifremer (Institut Français de Recherche pour l'Exploitation de la mer)
Le portail donne accès à 46 bases de données liées aux sciences marines, depuis les activités humaines en mer et la biologie jusqu'à la géologie.

PubChem

Institution porteuse : National Institutes of Health (NIH)
PubChem est une base de données qui contient les structures chimiques et les propriétés physiques de petites et grandes molécules.

Recherche Data Gouv

Institution porteuse : Ministère de l'Enseignement Supérieur et de la Recherche, France
Plateforme nationale fédérée des données de la recherche. Elle met à disposition des jeux de données de recherche achevées.

Science Data Portal

Institution porteuse : Institut National étatsunien des Standards et de la Technologie (NIST)
Donne accès à des jeux de données issus de plusieurs bases en sciences des matériaux, chimie, données nucléaires.

Service International des Services Géomagnétiques (ISGI)

Institution porteuse : Université de Strasbourg
Entrepôt d'indices géomagnétiques.

SPECTR-W3

Institution porteuse : Russian Scientific Research Institute of Technical Physics
Base de données portant sur les propriétés spectroscopiques des atomes et des ions.

SpectraBase

Institution porteuse : Wiley
Base de données de spectres de masse, RMN, IR, Raman et UV-Visible. Recherche possible par nom, InChIKey, numéro CAS, ou en dessinant une structure chimique. Les données ne sont pas modérées.

Spectral Database for Organic Compounds (SDBS)

Institution porteuse : Institut japonais AIST
SDBS est une base de données de spectres de composés organiques.

SSHADE: Solid Spectroscopy Hosting Architecture of Databases and Expertise

Institution porteuse : Université Grenoble Alpes (UGA)
SSHADE est une infrastructure de données de spectroscopie solide, hébergeant différents types de données spectrales pour une large gamme de solides

SureChemBL

Institution porteuse : European Bioinformatics Institute
Permet de rechercher des entités chimiques parmi les publications de brevets. L'outil de recherche est conçu pour la chimie en incluant l'éditeur de molécules Marvin JS.

VAMDC Consortium

Institution porteuse : Consortium de Centres Virtuels de Données Atomiques et Moléculaires (Virtual Atomic and Molecular Data Centre Consortium)
Accès aux 38 bases de données du Consortium VAMDC. Données atomiques et moléculaires au format XSAMS.

WURM

Institution porteuse : ENS Lyon
Base de données de spectroscopie Raman pour les minéraux. Fournit des informations additionnelles sur les structures des cristaux, les spectres infrarouges et d'autres propriétés physiques des minéraux.

wwPDB

Institution porteuse : Worldwide Protein Data Bank Foundation
Base de données de structures 3D de protéines, acides nucléiques et assemblages complexes.

Zenodo

Institution porteuse : CERN
Accès à plus de 1 600 000 objets de recherche, dont près de 70 000 jeux de données, 40 000 logiciels de recherche, etc. Les données ne sont pas modérées.