{"id":750,"date":"2021-07-08T21:57:06","date_gmt":"2021-07-08T19:57:06","guid":{"rendered":"https:\/\/edt.blogdns.net\/wordpress\/?p=750"},"modified":"2022-09-30T19:27:08","modified_gmt":"2022-09-30T17:27:08","slug":"surete-et-capacite-de-stockage-des-donnees","status":"publish","type":"post","link":"https:\/\/edt.blogdns.net\/wordpress\/2021\/07\/08\/surete-et-capacite-de-stockage-des-donnees\/","title":{"rendered":"Suret\u00e9 et capacit\u00e9 de stockage des donn\u00e9es"},"content":{"rendered":"\n<p class=\"has-drop-cap\">Pour les utilisateurs de gros volumes de donn\u00e9es (les photographes fr\u00e9n\u00e9tiques stockant des fichiers RAW par exemple), la limite de capacit\u00e9 de stockage de l&rsquo;\u00e9quipement informatique peut devenir un probl\u00e8me. Pour \u00e9tablir une r\u00e9f\u00e9rence de volume, un disque dur de 500 Go peut contenir, en plus du syst\u00e8me et des applications, 13000 photos d&rsquo;une r\u00e9solution de 24 Mo au format RAW sur 14 bit(notez que le poids effectif de chaque fichier est alors de 30 Mo). Si ce disque supporte le post-traitement de ces fichiers RAW, il faut compter avec la g\u00e9n\u00e9ration de fichiers dans un des formats compatibles avec l&rsquo;affichage sur \u00e9cran ou l&rsquo;impression. Il faut alors mod\u00e9rer l&rsquo;ambition initiale d&rsquo;environ un tiers (soit 10000 fichiers au format RAW et 10000 transformations au format JPG ou similaires) . <\/p>\n\n\n\n<p>De plus, en cas de panne du disque dur les pr\u00e9cieuses donn\u00e9es sont perdues si aucune sauvegarde n&rsquo;a \u00e9t\u00e9 r\u00e9alis\u00e9e. Quelques \u00e9tudes men\u00e9es par des fournisseurs de service web (disques durs sur serveurs) montrent qu&rsquo;apr\u00e8s cinq ann\u00e9es d&rsquo;utilisation intensive, le risque de panne atteint 50% et augmente significativement avec le temps d&rsquo;utilisation. Il faut toutefois noter que la premi\u00e8re ann\u00e9e d&rsquo;utilisation, le risque de panne est d&rsquo;environ 2%. J&rsquo;ai moi-m\u00eame eu \u00e0 d\u00e9plorer en 2009 la panne d&rsquo;un disque sur un de mes micro-ordinateurs portables durant la deuxi\u00e8me ann\u00e9e d&rsquo;utilisation. <\/p>\n\n\n\n<p>Les fabricants de Disques Durs donnent dans les fiches techniques de leurs produits le MTBF (dur\u00e9e moyenne d&rsquo;utilisation avant d\u00e9faillance) ou l&rsquo;AFR  (taux de d\u00e9faillance annualis\u00e9) de leurs produits. Par exemple, la gamme WD Purple (d\u00e9di\u00e9 \u00e0 la vid\u00e9o-surveillance) est donn\u00e9e pour un MTBF de 1500000 heures (soit 171 ans sans panne avec un fonctionnement 24h\/24, 7j\/7). Ce chiffre th\u00e9orique ne pr\u00e9sume certainement pas des possibilit\u00e9s de d\u00e9faillance de mode commun.  En comparaison pour la gamme WB Blue (du m\u00eame fabricant), le MTBF n&rsquo;est pas document\u00e9 sur la fiche technique. Les cycles Load\/unload (qui correspondent g\u00e9n\u00e9ralement \u00e0 la mise en route et l&rsquo;arr\u00eat du syst\u00e8me) sont donn\u00e9s pour 600000 pour les deux gammes (soit 822 ans pour deux mises en route par jour) encore une fois ce chiffre ne pr\u00e9sume pas des d\u00e9faillances de mode commun (par exemple plantage de la t\u00eate de lecture sur variation de l&rsquo;alimentation \u00e9lectrique ou choc m\u00e9canique exc\u00e9dant les limites sp\u00e9cifi\u00e9es). Les produits de la gamme qui pr\u00e9sente les sp\u00e9cifications de fiabilit\u00e9 les plus \u00e9lev\u00e9es sont vendus en g\u00e9n\u00e9ral environ deux fois plus cher que les produits de base.  <\/p>\n\n\n\n<p class=\"has-drop-cap\">Apr\u00e8s l&rsquo;\u00e9nonc\u00e9 de ces faits on peut faire deux constats si on veut stocker des donn\u00e9es qui ont de la valeur (quelle qu&rsquo;elle soit, et bien s\u00fbr c&rsquo;est une affaire d&rsquo;appr\u00e9ciation personnelle):<\/p>\n\n\n\n<p><\/p>\n\n\n\n<ol class=\"wp-block-list\"><li>On a int\u00e9r\u00eat \u00e0 investir dans l&rsquo;\u00e9quipement le plus fiable dont la capacit\u00e9 permet de stocker le volume de donn\u00e9es n\u00e9cessaire (\u00e0 appr\u00e9cier en fonction de l&rsquo;utilisation pr\u00e9vue).  <\/li><li>Il faut pr\u00e9voir un syst\u00e8me de sauvegarde ou une redondance (sur un ou des supports s\u00e9par\u00e9s du stockage initial). <\/li><\/ol>\n\n\n\n<p>Pour ce qui est du choix de l&rsquo;\u00e9quipement complet le plus fiable (par exemple micro-ordinateur portable), c&rsquo;est une question de balance entre prix et fiabilit\u00e9. Les mod\u00e8les les plus fiables ne sont pas forc\u00e9ment les plus chers. On a de toute fa\u00e7on int\u00e9r\u00eat \u00e0 privil\u00e9gier les \u00e9quipements de grade professionnel, r\u00e9put\u00e9s plus fiables et plus faciles \u00e0 maintenir. <\/p>\n\n\n\n<p>Pour ce qui est du media de stockage (Disque Dur), la plupart des \u00e9quipements r\u00e9cents int\u00e8grent un SSD (Solid State Drive ou disque statique) au lieu d&rsquo;un disque dur. Ces derniers on une dur\u00e9e de vie limit\u00e9e, li\u00e9e essentiellement au nombre de cycles d&rsquo;\u00e9criture (il est limit\u00e9 par la technologie employ\u00e9e).  Le nombre de cycles \u00e9crits avant d\u00e9faillance est plus \u00e9lev\u00e9 pour les produits de grade professionnel (plus chers que les SSD de base). Ce crit\u00e8re (TBW &#8211; \u00ab\u00a0Tera Bytes Written\u00a0\u00bb ou \u00ab\u00a0Tera Octets Ecrits\u00a0\u00bb) peut \u00eatre v\u00e9rifi\u00e9 dans les sp\u00e9cifications du fabricant et compar\u00e9 \u00e0 l&rsquo;estimation du nombre de Mo ou Go \u00e9crits par jour pour l&rsquo;utilisation pr\u00e9vue.  La dur\u00e9e de fonctionnement sans d\u00e9faillance du SSD peut donc \u00eatre estim\u00e9e. <\/p>\n\n\n\n<p> Pour ce qui est de la sauvegarde ou de la redondance, plusieurs options sont envisageables:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>disque dur amovible (qu&rsquo;il faut connecter et d\u00e9connecter dans le cas d&rsquo;un micro-ordinateur portable en mobilit\u00e9).<\/li><li>abonnement (payant) \u00e0 un service de stockage distant avec synchronisation (cloud)<\/li><li>Stockage r\u00e9seau (<a href=\"https:\/\/fr.wikipedia.org\/wiki\/Serveur_de_stockage_en_r%C3%A9seau\" target=\"_blank\" rel=\"noreferrer noopener\">NAS<\/a> \u00ab\u00a0Network Area Storage\u00a0\u00bb) personnel (n\u00e9cessite un \u00e9quipement d\u00e9di\u00e9)<\/li><\/ul>\n\n\n\n<p>Passons ces trois options en revue en commen\u00e7ant par la celle qui parait \u00e0 priori la plus simple mais qui n\u00e9cessite de l&rsquo;organisation et qui entraine des contraintes et un risque de rupture de synchronisation. Le disque dur amovible doit en effet \u00eatre connect\u00e9 et ensuite les fichiers du stockage principal recopi\u00e9s \u00e0 intervalle r\u00e9gulier sans perte de coh\u00e9rence (les mises \u00e0 jour d&rsquo;anciens fichiers doivent \u00eatre reconnues et trait\u00e9es en cons\u00e9quence). Pour que la coh\u00e9rence soit conserv\u00e9e sans avoir \u00e0 r\u00e9\u00e9crire tous les fichiers \u00e0 chaque fois, il faut adopter une strat\u00e9gie de copie incr\u00e9mentale ou diff\u00e9rentielle. Certains programmes de copie de fichier assurent ces op\u00e9rations de synchronisation et sont param\u00e9trables \u00e0 partir d&rsquo;une interface graphique simple. Ma pr\u00e9f\u00e9rence va \u00e0 <a rel=\"noreferrer noopener\" href=\"https:\/\/www.2brightsparks.com\/syncback\/compare-simple.html\" target=\"_blank\">SyncBack<\/a> version SE (licence non libre) pour MS Windows. Une autre solution plus compl\u00e8te et bas\u00e9e sur rSync (licence libre, pour Linux) est utilisable pour Windows et se nomme DeltaCopy. Cette derni\u00e8re, gratuite, est bas\u00e9e sur un mod\u00e8le client\/serveur.<\/p>\n\n\n\n<p>La deuxi\u00e8me option impose un abonnement \u00e0 un service de stockage en ligne (de type cloud). L&rsquo;abonnement est payant au-del\u00e0 d&rsquo;une limite de quelques Go (insuffisante pour une synchronisation s\u00e9rieuse). Google drive, OneDrive, kDrive, pCloud sont parmi les services les plus connus. Le choix d&rsquo;une formule d&rsquo;abonnement sera fonction de la dur\u00e9e pr\u00e9visible d&rsquo;utilisation du service. Certains fournisseurs proposent des abonnement sur 99 ans payable en une fois (pCloud) d&rsquo;autres proposent uniquement des abonnement mensuels ou annuels. Pour donner un point de r\u00e9f\u00e9rence:  kDrive propose l&rsquo;abonnement annuel pour 2 To \u00e0 60 \u20acuros. Le principe du service c&rsquo;est de synchroniser les donn\u00e9es contenues sur le DD d&rsquo;un \u00e9quipement avec un espace de stockage distant. La synchronisation se r\u00e9alise automatiquement \u00e0 partir de l&rsquo;instant ou l&rsquo;\u00e9quipement est connect\u00e9 \u00e0 internet. Si pendant une longue dur\u00e9e des fichiers sont \u00e9crits sur l&rsquo;\u00e9quipement sans que ce dernier soit connect\u00e9 au r\u00e9seau, aucune synchronisation de ces fichiers n&rsquo;est op\u00e9r\u00e9e et une perte de donn\u00e9es est possible.<\/p>\n\n\n\n<p>La troisi\u00e8me option impose d&rsquo;installer un \u00e9quipement d\u00e9di\u00e9 de type <a rel=\"noreferrer noopener\" href=\"https:\/\/fr.wikipedia.org\/wiki\/Serveur_de_stockage_en_r%C3%A9seau\" target=\"_blank\">NAS<\/a> ou similaire chez soi. Un NAS neuf (Synology, Qnap, WD sont des fabricants reconnus) ou un vieil \u00e9quipement de type PC recycl\u00e9 peut faire l&rsquo;affaire. Pour recycler un vieux PC en NAS, choisissez de pr\u00e9f\u00e9rence un PC 64 bits  avec 4 Go de m\u00e9moire vive au minimum. Un syst\u00e8me d\u00e9di\u00e9 \u00e0 la fonction NAS devra alors \u00eatre install\u00e9 sur l&rsquo;\u00e9quipement. Ma pr\u00e9f\u00e9rence va \u00e0 <a rel=\"noreferrer noopener\" href=\"https:\/\/www.openmediavault.org\/\" target=\"_blank\">OpenMediVault<\/a>, un syst\u00e8me libre. Une fois le syst\u00e8me install\u00e9 et le(s) disque(s) dur(s) mont\u00e9(s), si n\u00e9cessaire g\u00e9r\u00e9s en miroir avec LVM (\u00ab\u00a0Logic Volume Management\u00a0\u00bb) ou tout gestionnaire capable de support\u00e9 <a rel=\"noreferrer noopener\" href=\"https:\/\/fr.wikipedia.org\/wiki\/RAID_(informatique)\" target=\"_blank\">RAID1<\/a> (technique de l&rsquo;enregistrement miroir), la gestion du syst\u00e8me se fait \u00e0 distance au travers d&rsquo;une interface graphique. Il est alors possible de profiter des m\u00eames fonctions de synchronisation \u00e0 distance que celles propos\u00e9es par les services de stockage par abonnement payant. L&rsquo;avantage \u00e9tant que vous \u00eates propri\u00e9taire de l&rsquo;infrastructure et que vous restez maitre de vos donn\u00e9es, le tout pour un co\u00fbt maitris\u00e9. L&rsquo;inconv\u00e9nient c&rsquo;est que vous devez maintenir le syst\u00e8me pour qu&rsquo;il reste \u00e0 jour et en bon \u00e9tat.  C&rsquo;est cette derni\u00e8re solution que j&rsquo;ai mise en \u0153uvre sur un disque unique donc, sans RAID1 mais avec une synchronisation p\u00e9riodique sur d&rsquo;autres machines qui servent de sauvegarde en des lieux diff\u00e9rents (oui, j&rsquo;utilise de multiples \u00e9quipements dans les diff\u00e9rents endroits qui me servent de r\u00e9sidence, pour des tests et pour le fun). <\/p>\n\n\n\n<p>Et maintenant, une derni\u00e8re pens\u00e9e sur l&rsquo;\u00e9volution technologique. La dur\u00e9e de vie probable d&rsquo;un disque dur peut d\u00e9passer l&rsquo;apparition de l&rsquo;obsolescence d&rsquo;une technologie. Un exemple: certains des disques durs de mes \u00e9quipements les plus anciens ne peuvent plus \u00eatre connect\u00e9s sur quoi que ce soit de r\u00e9cent, les contr\u00f4leurs et leur connectique n&rsquo;\u00e9tant plus utilis\u00e9s par les \u00e9quipements modernes. La cassure technologique n&rsquo;a pris qu&rsquo;une dizaine d&rsquo;ann\u00e9es.  Pesez donc ce que cela repr\u00e9sente en terme d&rsquo;investissement pour la conservation de vos pr\u00e9cieuses donn\u00e9es. <\/p>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity is-style-wide\"\/>\n\n\n\n<p>Voil\u00e0.  <\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Pour les utilisateurs de gros volumes de donn\u00e9es (les photographes fr\u00e9n\u00e9tiques stockant des fichiers RAW par exemple), la limite de capacit\u00e9 de stockage de l&rsquo;\u00e9quipement informatique peut devenir un probl\u00e8me. Pour \u00e9tablir une r\u00e9f\u00e9rence de volume, un disque dur de 500 Go peut contenir, en plus du syst\u00e8me et des applications, 13000 photos d&rsquo;une r\u00e9solution &hellip; <a href=\"https:\/\/edt.blogdns.net\/wordpress\/2021\/07\/08\/surete-et-capacite-de-stockage-des-donnees\/\" class=\"more-link\">Continuer la lecture<span class=\"screen-reader-text\"> de &laquo;&nbsp;Suret\u00e9 et capacit\u00e9 de stockage des donn\u00e9es&nbsp;&raquo;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_uag_custom_page_level_css":"","footnotes":""},"categories":[16],"tags":[36,34,35,33],"class_list":["post-750","post","type-post","status-publish","format-standard","hentry","category-micro-ordinateur","tag-nas","tag-ordinateur","tag-sdd","tag-stockage"],"uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"post-thumbnail":false},"uagb_author_info":{"display_name":"marc","author_link":"https:\/\/edt.blogdns.net\/wordpress\/author\/marc_taviaux\/"},"uagb_comment_info":0,"uagb_excerpt":"Pour les utilisateurs de gros volumes de donn\u00e9es (les photographes fr\u00e9n\u00e9tiques stockant des fichiers RAW par exemple), la limite de capacit\u00e9 de stockage de l&rsquo;\u00e9quipement informatique peut devenir un probl\u00e8me. Pour \u00e9tablir une r\u00e9f\u00e9rence de volume, un disque dur de 500 Go peut contenir, en plus du syst\u00e8me et des applications, 13000 photos d&rsquo;une r\u00e9solution\u2026","_links":{"self":[{"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/posts\/750","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/comments?post=750"}],"version-history":[{"count":11,"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/posts\/750\/revisions"}],"predecessor-version":[{"id":882,"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/posts\/750\/revisions\/882"}],"wp:attachment":[{"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/media?parent=750"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/categories?post=750"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/edt.blogdns.net\/wordpress\/wp-json\/wp\/v2\/tags?post=750"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}