Métadonnées et description des données
Métadonnées : le qui, quoi, quand, où, pourquoi, et comment de votre recherche
Cette ressource va vous permettre d’identifier la meilleure stratégie pour votre recherche, votre discipline et le besoin de vos données.
Les métadonnées sont de la documentation décrivant vos données. Bien décrire et documenter vos données permet aux utilisateurs (dont vous-même) de comprendre et suivre d'importants détails du travail de recherche. Produire des métadonnées permet aussi de faciliter les recherches et la récupération de ces données, une fois déposées dans un entrepôt adapté.
Les métadonnées peuvent inclure du contenu tel que des informations de contact, des emplacements géographiques, des détails sur les unités de mesure, des abréviations ou des codes utilisés dans le jeu de données, des informations sur les instruments utilisés et le protocole, des détails sur l'outil d'enquête, des informations sur la provenance et la version , et bien plus encore. Dans un environnement de laboratoire, une grande partie du contenu utilisé pour décrire les données est initialement collectée dans un bloc-notes. Dans la mesure du possible, structurez vos métadonnées à l'aide d'un standard de métadonnées approprié et approuvé par les pairs. (Voir ci-dessous pour des exemples.)
Quand aucun standard de métadonnées adapté n’existe pour vos travaux, vous pouvez considérer plusieurs choses :
- rédiger un schéma qui soit spécifiquement adapté à vos besoins, à condition de très bien le documenter, et de rendre cette documentation publique si les données sont partagées ;
- rédiger des métadonnées sous la forme d’un «readme» comme décrit dans ce guide.
Standards de métadonnées par discipline
Afin de trouver un standard de métadonnées qui soit adapté à vos besoins, pensez à utiliser le Disciplinary Metadata guide depuis le Digital Curation Center, ou le Metadata Standards Catalog.
En addition, vous pouvez aussi parcourir le projet communautaire opérant un catalogue de standards de métadonnées, via Research Data Alliance.
Formats et standards de métadonnées
Les métadonnées peuvent prendre différentes formes, du texte libre jusqu’au contenu standardisé, structuré, lisible par la machine et extensible. Certaines disciplines, entrepôts et data centers peuvent inciter ou imposer certains contenus et formats de métadonnées. Puisque la création de métadonnées standardisées peut être un processus difficile et long, un autre facteur à prendre en compte dans la sélection d’un standard peut être l’existence d’outils pouvant aider à générer ces métadonnées (par exemple, Morpho permet la création de EML, Nesstar pour DDI, etc.)
Quelques exemples spécifiques de standards de métadonnées, à la fois généraux et spécifiques à certains domaines sont :
- Dublin Core - standard de métadonnées de base, indépendant du domaine et largement utilisé
- DDI (Data Documentation Initiative) - norme commune pour les sciences sociales, comportementales et économiques, y compris les données d'enquête
- EML (Ecological Metadata Language) - spécifique aux disciplines écologiques
- ISO 19115 and FGDC-CSDGM (Federal Geographic Data Committee's Content Standard for Digital Geospatial Metadata) - pour décrire des données géospatiales
- MINSEQE (MINimal information about high throughput SEQeuencing Experiments) - standards pour la description des génomes
- FITS (Flexible Image Transport System) - Norme de fichier numérique d'astronomie qui comprend des métadonnées structurées et intégrées
- MIBBI - Informations minimales pour les investigations biologiques et biomédicales
Informations complémentaires
Bonnes pratiques pour la rédaction de métadonnées. ICPSR. http://www.icpsr.umich.edu/icpsrweb/content/deposit/guide/chapter3docs.html. Partie du guide ICPSR pour la préparation des données et l’archivage en sciences sociales.
Bonnes pratiques pour métadonnées. DataONE. http://www.dataone.org/best-practices/metadata
Metadata Services. Groupe de services de gestion des données de recherche de Cornell. http://data.research.cornell.edu/services#Metadata
Informations minimales pour les investigations biologiques et biomédicales. MIBBI Project. https://biosharing.org/standards/?selected_facets=isMIBBI:true&view=table. Lignes directrices sur les informations minimales de diverses communautés bioscientifiques.
Ce guide est une libre traduction et adaptation des guides de bonnes pratiques de l’Université de Cornell.