Format de fichiers
Les formats de fichiers « de travail », ceux utilisés dans le cadre de la collecte et du travail avec les données du projet, ne sont pas toujours idéaux pour la réutilisation ou la conservation à long terme. De plus, elles peuvent ne pas répondre aux exigences des archives, des référentiels de données ou satisfaire les attentes des financeurs.
Quand il n’y a pas de directive précise de la part des financeurs ou des entrepôts de données, un certain nombre de bonnes pratiques peuvent malgré tout être prises en compte.
Principes de sélection des formats de fichiers
Sélectionner des formats ouverts et non propriétaires
Les formats ouverts et non-propriétaires sont beaucoup plus susceptibles de rester utilisables même si le logiciel qui les a créés n'est plus disponible ou ne fonctionne plus. Les formats dont la documentation est complète et disponible gratuitement ont également une plus grande probabilité de conservation à long terme. Si le programme à l’origine des données est aussi le seul outil permettant de les lire, il s'agit probablement d'un format propriétaire et non ouvert. En règle générale, les formats de texte brut, tels que les fichiers délimités par des virgules ou des tabulations, sont des formats ouverts et sont généralement meilleurs pour la réutilisation et la conservation à long terme. Un indicateur fiable est de s’assurer qu’il existe au moins une, voire deux alternatives pour la lecture de vos données.
Exemple de format propriétaire : fichier Photoshop.psd
Exemple de format ouvert : fichier image .tiff
Sélectionner des formats de données sans pertes
Les formats qui compressent les informations dans un fichier prennent effectivement moins de place, mais cette compression va régulièrement faire perdre une partie des données depuis le fichier d'origine. On dit que ce sont des formats « avec pertes » là où des formats où la décompression n’est accompagnée d’aucune perte sont logiquement appelés « sans pertes »
Exemple de formats avec perte : fichier audio .mp3, fichier image .jpeg
Exemple de formats sans perte : fichier audio .wav, fichier image .tiff
Sélectionner des formats non cryptés et non compressés.
Si la clé de cryptage, la phrase secrète ou le mot de passe d'un fichier est perdu, il se peut qu'il soit impossible de récupérer les données du fichier ultérieurement, ce qui le rend inutilisable pour les autres. Le code source non compilé est plus facilement réutilisable par d'autres et a une bien plus grande probabilité de rester utilisable dans le temps puisque la recompilation est possible sur différentes architectures et plates-formes.