juillet 2021 – ElectroDétour

Pour les utilisateurs de gros volumes de données (les photographes frénétiques stockant des fichiers RAW par exemple), la limite de capacité de stockage de l’équipement informatique peut devenir un problème. Pour établir une référence de volume, un disque dur de 500 Go peut contenir, en plus du système et des applications, 13000 photos d’une résolution de 24 Mo au format RAW sur 14 bit(notez que le poids effectif de chaque fichier est alors de 30 Mo). Si ce disque supporte le post-traitement de ces fichiers RAW, il faut compter avec la génération de fichiers dans un des formats compatibles avec l’affichage sur écran ou l’impression. Il faut alors modérer l’ambition initiale d’environ un tiers (soit 10000 fichiers au format RAW et 10000 transformations au format JPG ou similaires) .

De plus, en cas de panne du disque dur les précieuses données sont perdues si aucune sauvegarde n’a été réalisée. Quelques études menées par des fournisseurs de service web (disques durs sur serveurs) montrent qu’après cinq années d’utilisation intensive, le risque de panne atteint 50% et augmente significativement avec le temps d’utilisation. Il faut toutefois noter que la première année d’utilisation, le risque de panne est d’environ 2%. J’ai moi-même eu à déplorer en 2009 la panne d’un disque sur un de mes micro-ordinateurs portables durant la deuxième année d’utilisation.

Les fabricants de Disques Durs donnent dans les fiches techniques de leurs produits le MTBF (durée moyenne d’utilisation avant défaillance) ou l’AFR (taux de défaillance annualisé) de leurs produits. Par exemple, la gamme WD Purple (dédié à la vidéo-surveillance) est donnée pour un MTBF de 1500000 heures (soit 171 ans sans panne avec un fonctionnement 24h/24, 7j/7). Ce chiffre théorique ne présume certainement pas des possibilités de défaillance de mode commun. En comparaison pour la gamme WB Blue (du même fabricant), le MTBF n’est pas documenté sur la fiche technique. Les cycles Load/unload (qui correspondent généralement à la mise en route et l’arrêt du système) sont donnés pour 600000 pour les deux gammes (soit 822 ans pour deux mises en route par jour) encore une fois ce chiffre ne présume pas des défaillances de mode commun (par exemple plantage de la tête de lecture sur variation de l’alimentation électrique ou choc mécanique excédant les limites spécifiées). Les produits de la gamme qui présente les spécifications de fiabilité les plus élevées sont vendus en général environ deux fois plus cher que les produits de base.

Après l’énoncé de ces faits on peut faire deux constats si on veut stocker des données qui ont de la valeur (quelle qu’elle soit, et bien sûr c’est une affaire d’appréciation personnelle):

On a intérêt à investir dans l’équipement le plus fiable dont la capacité permet de stocker le volume de données nécessaire (à apprécier en fonction de l’utilisation prévue).
Il faut prévoir un système de sauvegarde ou une redondance (sur un ou des supports séparés du stockage initial).

Pour ce qui est du choix de l’équipement complet le plus fiable (par exemple micro-ordinateur portable), c’est une question de balance entre prix et fiabilité. Les modèles les plus fiables ne sont pas forcément les plus chers. On a de toute façon intérêt à privilégier les équipements de grade professionnel, réputés plus fiables et plus faciles à maintenir.

Pour ce qui est du media de stockage (Disque Dur), la plupart des équipements récents intègrent un SSD (Solid State Drive ou disque statique) au lieu d’un disque dur. Ces derniers on une durée de vie limitée, liée essentiellement au nombre de cycles d’écriture (il est limité par la technologie employée). Le nombre de cycles écrits avant défaillance est plus élevé pour les produits de grade professionnel (plus chers que les SSD de base). Ce critère (TBW – « Tera Bytes Written » ou « Tera Octets Ecrits ») peut être vérifié dans les spécifications du fabricant et comparé à l’estimation du nombre de Mo ou Go écrits par jour pour l’utilisation prévue. La durée de fonctionnement sans défaillance du SSD peut donc être estimée.

Pour ce qui est de la sauvegarde ou de la redondance, plusieurs options sont envisageables:

disque dur amovible (qu’il faut connecter et déconnecter dans le cas d’un micro-ordinateur portable en mobilité).
abonnement (payant) à un service de stockage distant avec synchronisation (cloud)
Stockage réseau (NAS « Network Area Storage ») personnel (nécessite un équipement dédié)

Passons ces trois options en revue en commençant par la celle qui parait à priori la plus simple mais qui nécessite de l’organisation et qui entraine des contraintes et un risque de rupture de synchronisation. Le disque dur amovible doit en effet être connecté et ensuite les fichiers du stockage principal recopiés à intervalle régulier sans perte de cohérence (les mises à jour d’anciens fichiers doivent être reconnues et traitées en conséquence). Pour que la cohérence soit conservée sans avoir à réécrire tous les fichiers à chaque fois, il faut adopter une stratégie de copie incrémentale ou différentielle. Certains programmes de copie de fichier assurent ces opérations de synchronisation et sont paramétrables à partir d’une interface graphique simple. Ma préférence va à SyncBack version SE (licence non libre) pour MS Windows. Une autre solution plus complète et basée sur rSync (licence libre, pour Linux) est utilisable pour Windows et se nomme DeltaCopy. Cette dernière, gratuite, est basée sur un modèle client/serveur.

La deuxième option impose un abonnement à un service de stockage en ligne (de type cloud). L’abonnement est payant au-delà d’une limite de quelques Go (insuffisante pour une synchronisation sérieuse). Google drive, OneDrive, kDrive, pCloud sont parmi les services les plus connus. Le choix d’une formule d’abonnement sera fonction de la durée prévisible d’utilisation du service. Certains fournisseurs proposent des abonnement sur 99 ans payable en une fois (pCloud) d’autres proposent uniquement des abonnement mensuels ou annuels. Pour donner un point de référence: kDrive propose l’abonnement annuel pour 2 To à 60 €uros. Le principe du service c’est de synchroniser les données contenues sur le DD d’un équipement avec un espace de stockage distant. La synchronisation se réalise automatiquement à partir de l’instant ou l’équipement est connecté à internet. Si pendant une longue durée des fichiers sont écrits sur l’équipement sans que ce dernier soit connecté au réseau, aucune synchronisation de ces fichiers n’est opérée et une perte de données est possible.

La troisième option impose d’installer un équipement dédié de type NAS ou similaire chez soi. Un NAS neuf (Synology, Qnap, WD sont des fabricants reconnus) ou un vieil équipement de type PC recyclé peut faire l’affaire. Pour recycler un vieux PC en NAS, choisissez de préférence un PC 64 bits avec 4 Go de mémoire vive au minimum. Un système dédié à la fonction NAS devra alors être installé sur l’équipement. Ma préférence va à OpenMediVault, un système libre. Une fois le système installé et le(s) disque(s) dur(s) monté(s), si nécessaire gérés en miroir avec LVM (« Logic Volume Management ») ou tout gestionnaire capable de supporté RAID1 (technique de l’enregistrement miroir), la gestion du système se fait à distance au travers d’une interface graphique. Il est alors possible de profiter des mêmes fonctions de synchronisation à distance que celles proposées par les services de stockage par abonnement payant. L’avantage étant que vous êtes propriétaire de l’infrastructure et que vous restez maitre de vos données, le tout pour un coût maitrisé. L’inconvénient c’est que vous devez maintenir le système pour qu’il reste à jour et en bon état. C’est cette dernière solution que j’ai mise en œuvre sur un disque unique donc, sans RAID1 mais avec une synchronisation périodique sur d’autres machines qui servent de sauvegarde en des lieux différents (oui, j’utilise de multiples équipements dans les différents endroits qui me servent de résidence, pour des tests et pour le fun).

Et maintenant, une dernière pensée sur l’évolution technologique. La durée de vie probable d’un disque dur peut dépasser l’apparition de l’obsolescence d’une technologie. Un exemple: certains des disques durs de mes équipements les plus anciens ne peuvent plus être connectés sur quoi que ce soit de récent, les contrôleurs et leur connectique n’étant plus utilisés par les équipements modernes. La cassure technologique n’a pris qu’une dizaine d’années. Pesez donc ce que cela représente en terme d’investissement pour la conservation de vos précieuses données.

Voilà.

Mois : juillet 2021

Sureté et capacité de stockage des données