Go to Top

Les 6 choses à faire (ou à éviter) lorsque vous subissez une perte de données sur votre système RAID

Les 6 réflexes à avoir lorsque vous subissez une perte de données dans votre réseau de stockage RAID

Depuis l’introduction du concept RAID – Redundant Array of Independent Disks – celui-ci a redéfini la façon dont les systèmes de stockage gèrent et conservent les données. Le concept de base de cette technologie est en fait très simple : une matrice RAID est une configuration de nombreux disques durs physiques différents qui créent ensemble l’architecture RAID utilisée (RAID 0, 1, 5, etc.). Cette architecture RAID distribue alors les données sur tous les disques, parce que le RAID utilisé est considéré comme un seul disque par le système d’exploitation. Mais bien que les différents niveaux RAID soient dotés de certains mécanismes de protection contre la perte de données due à la défaillance physique d’un disque dur ou plus, la technologie n’est pas à toute épreuve. Par conséquent, il est sage de vous préparer contre une perte de données lorsque vous utilisez une matrice RAID et au moins d’envisager les conseils suivants :

  1. Une sauvegarde n’est pas juste souhaitable, elle est indispensable ! Que vous subissiez une perte de données à la suite d’une défaillance de système ou d’une mauvaise manipulation, ayez toujours une sauvegarde actuelle de vos données sous la main. De nombreux commerçants fournissent des systèmes de stockage basés sur le RAID, de classe élevée, moyenne ou basse, en les présentant comme des sortes de sauvegardes physiques. Ne vous y trompez pas ! Un RAID – indépendamment du niveau implémenté – n’est pas une sauvegarde. Si vous subissez une défaillance importante avec le RAID, les données peuvent être perdues. Une sauvegarde, si elle est stockée correctement et si elle est actuelle, est le meilleur outil pour récupérer vos données sur un système reconstruit après une défaillance.
  2. Choisissez la bonne configuration RAID ! Sachant que les différentes configurations RAID ont des redondances différentes pour empêcher la perte de données, une idée judicieuse est de créer un plan conceptuel de votre système de stockage (ou d’en acheter un) qui couvre réellement vos données et vos provisions de pertes de données. Les lecteurs uniques connaîtront une défaillance à un moment de leur vie. Lorsque cela se produit, si les lecteurs individuels ont une défaillance, alors en supposant qu’il s’agisse d’un RAID 1 ou supérieur, le lecteur défectueux peut être remplacé par un lecteur neuf et la cartographie du stockage des données reconstruite avec aucune perte de données. Si vous avez de nombreuses données volumineuses, utiliser un RAID0 n’a aucun sens, sachant qu’aucun lecteur ne peut être défectueux. Il y a de grandes chances qu’un plus grand nombre de lecteurs soient défectueux à un moment donné et votre système plantera. Si une défaillance de lecteur dépasse la capacité de redondance de la matrice RAID et que les disques durs sont défectueux, sollicitez l’aide d’un spécialiste pour reconstruire votre matrice RAID et récupérer vos données.
  3. N’essayez jamais de reconstruire un système lorsqu’un trop grand nombre de disques ont subi une défaillance et que votre niveau RAID ne prend pas ceci en charge ! Si vous avez une défaillance sur deux lecteurs d’un système basé sur un RAID5, remplacer un des lecteurs défectueux et lancer une reconstruction n’a aucun sens. Vous avez de grandes chances de provoquer une importante perte de données pour de bon. L’opération de reconstruction, comme le suggère le terme, permet de reconstruire la matrice RAID en cas de défaillance d’un lecteur. De nombreux lecteurs de disques sont dotés d’un « hot plug » qui permet d’enlever et de remplacer le disque dur sans avoir à arrêter le système et mettre ainsi fin au service. L’opération de reconstruction prend généralement beaucoup de temps mais pourrait résoudre le problème en reconstruisant le RAID après avoir remplacé le disque défectueux par un disque neuf. Cependant, si une opération échoue au cours de la procédure, l’opération de reconstruction entraînera des dommages supplémentaires. L’exécution d’une reconstruction n’est pas sans risques, et elle doit être effectuée uniquement si vous pouvez compter sur une sauvegarde à jour et permanente.
  4. Soyez toujours préparé pour une défaillance système ou matérielle ! Comme nous l’avons souligné précédemment, un disque dur ou plus ou le contrôleur RAID peuvent subir une défaillance quasiment à tout moment. Si vous avez acheté un système basé sur le RAID chez un fabricant, il est très probable que l’ensemble des disques durs à l’intérieur proviennent du même lot et que leur date de production soit la même. Par conséquent il n’est ni improbable ni surprenant qu’ils subissent une défaillance et atteignent leur fin de vie quasiment en même temps. Donc il est absolument nécessaire de vérifier et surveiller l’état des disques durs à intervalles de temps définis. Si un disque dur dans un RAID5 est défectueux, n’hésitez pas à le remplacer immédiatement. Attendre trop longtemps peut entraîner une importante perte de données, parce que les chances qu’un autre lecteur tombe en panne augmentent. Il est indispensable d’effectuer un suivi de l’usage des disques durs à l’intérieur du réseau de stockage RAID, et cette procédure doit être mise en œuvre dans le cadre d’un plan de continuité des activités et de récupération des données, lequel devrait être effectué dans chaque entreprise. Par ailleurs, ce plan doit également indiquer quoi faire lorsqu’une défaillance du réseau de stockage RAID et une perte de données se produisent. Dans les cas graves, les fonctions de récupération intégrées ne fonctionneront pas et peuvent même entraîner davantage de dommages, avec la destruction définitive de données. Dans ces cas, avoir à portée de main les informations de contact d’un fournisseur de services de récupération des données fiable et professionnel peut s’avérer utile.
  5. Si vous souhaitez effectuer vous-même la reconstruction d’un disque dur défaillant, créez une image du contenu des disques durs à l’intérieur de l’ensemble du réseau de stockage avant de commencer la reconstruction, et étiquetez-les. Avec une image de tous les lecteurs disponibles, vous augmentez les chances d’une récupération des données ultérieure, lorsque la reconstruction échoue. Imaginez par exemple un scénario où une reconstruction démarrée s’arrête à seulement 5 %, si une perte de données suivie d’un écrasement du contenu stocké à l’origine sur plusieurs disques se produit, les données sont définitivement détruites, sans aucune possibilité de pouvoir les récupérer. Avec les images, les experts professionnels en récupération des données peuvent au moins essayer de reconstruire les pièces multiples à partir des deux disques durs ainsi que les images pour reconstruire le système RAID et la structure des données d’origine. D’autre part les disques images doivent être étiquetés dans le bon ordre de leur état d’origine dans le réseau de stockage, ainsi l’ordre des bandes des données peut être reconstruit plus facilement.
  6. Si vous n’avez aucune idée des raisons pour lesquelles le réseau de stockage ou le matériel ont connu une défaillance et qu’une perte de données s’est produite, ne cherchez pas à effectuer une reconstruction ou une récupération des données par vous-même. Et surtout ne paniquez pas ! Le mieux est de faire appel à l’aide d’un professionnel. Si vous ne possédez pas suffisamment de connaissances sur la façon de faire fonctionner le système à nouveau, quelles procédures doivent être effectuées et comment accéder aux données perdues, il n’y a aucune honte à cela. Il vaut mieux que vous laissiez des professionnels vous assister. C’est certainement préférable à l’éventualité de détruire définitivement de précieuses données !

Conclusion :

Même si vous prenez en compte ces conseils que nous vous donnons, vous n’êtes pas à l’abri d’une perte de données. Plus les systèmes de stockage sont complexes – et pas uniquement par rapport aux stockages basés sur le RAID qui sont stockés, dupliqués ou répartis sur plusieurs disques durs physiques – plus il est compliqué de récupérer des données lorsqu’une perte de données se produit. Aujourd’hui il ne s’agit plus simplement des matrices RAID, mais d’une association de plusieurs technologies complexes qui sont incluses dans les systèmes. Donc c’est la virtualisation, associée aux niveaux RAID, à la déduplication, et à beaucoup d’autres. Ces différentes technologies dans leur association peuvent entraîner des défaillances, lesquelles ne peuvent être résolues par aucune fonction logicielle d’exploitation implémentée en soi, mais uniquement après une analyse approfondie par des experts en récupération des données, qui peuvent alors décider quel niveau de complexité doit être récupéré en premier, en deuxième, en troisième et ainsi de suite, jusqu’à ce que les données puissent être récupérées. Donc si vous n’êtes pas sûr de posséder les connaissances nécessaires pour récupérer les données perdues de votre RAID – ainsi que d’autres systèmes de stockage spécifique – le mieux est de contacter un spécialiste en récupération des données tel que Kroll Ontrack. Dans la plupart des cas, cela finit par s’avérer payant !

Picture copyright: Tim Reckmann/pixelio.de

Laisser un commentaire