Go to Top

Où sont les données ? 2e partie : Solutions de stockage définies par logiciel et hyper convergentes

Depuis plusieurs années, administrateurs et gestionnaires informatiques tentent de rationaliser les coûts et le matériel dans leurs centres de données. De plus en plus de serveurs dans les centres de données fonctionnent à présent en tant que serveurs virtuels, ce qui entraîne un besoin moins important en serveurs physiques ainsi qu’en énergie, et permet de réduire les coûts en matériel et en maintenance.

Afin de gérer ces quantités énormes de machines virtuelles et de serveurs virtuels, une solution de stockage définie par logiciel (SDS) utilise et établit une couche logicielle pour gérer et combiner tous les éléments nécessaires au centre de données tels que les calculs, le serveur, le stockage, le réseau et la sécurité. Des solutions comme celle-ci sont basées sur logiciel et peuvent fonctionner – en théorie – sur des types de matériel différents et variés. En réalité, il est judicieux d’utiliser une solution de stockage définie par logiciel sur du matériel déjà testé et approuvé par le vendeur du logiciel.

Les systèmes à infrastructure hyper convergente, d’un autre côté, font partie des développements les plus récents en vue de simplifier et rendre une société informatique plus efficace et moins coûteuse. Ce qui caractérise une telle solution est qu’elle utilise plusieurs technologies et que toutes ces technologies sont intégrées et gérées de façon ininterrompue par un seul système. Les systèmes hyper convergents rassemblent tous les concepts utilisés au préalable tels que la convergence, le stockage traditionnel et les solutions basées sur logiciel dans une solution « serveurisée ». Cette nouvelle solution est basée sur le serveur et est unifiée d’un point de vue technologique. De même qu’une solution SDS, une solution hyper convergente est également basée sur la virtualisation et la gestion à partir d’un logiciel, mais elle est couplée avec le matériel.

Pour faire simple, les systèmes hyper convergents sont des systèmes d’infrastructure avec une architecture centrée sur le logiciel qui intègre les calculs (CPU), le stockage, le réseau, les ressources de virtualisation, ainsi que d’autres technologies, dans un boîtier fourni par un vendeur.

D’un point de vue technique, les utilisateurs d’une solution hyper convergente trouvent non seulement des avantages non négligeables par une gestion complète de toutes les ressources d’infrastructure et des machines virtuelles à partir d’un point d’administration unique, mais d’autre part, toutes les ressources des centres de données sont placées à l’intérieur de la pile de ressources, par conséquent un bassin unique de ressources partagées est utilisé. En plaçant la virtualisation, le stockage, les calculs, le réseau, la gestion et la protection des données dans une application facile à gérer mais modulable, une entreprise peut gérer de façon ininterrompue une infrastructure complexe.

Pour une entreprise, utiliser une solution hyper convergente signifie que beaucoup moins de matériel coûteux est nécessaire, parce que ces systèmes reposent sur un matériel de base x86 courant et peu coûteux et – contrairement aux systèmes intégrés – ils peuvent être mis à niveau, ou, en cas de panne, changés par des unités beaucoup plus petites du matériel nécessaire. Pour résumer : les solutions hyper convergentes n’ont pas besoin d’autant de stockage et de bande passante que les solutions intégrées et permettent de réduire le coût en matériel et en énergie. Comme indiqué précédemment, les ressources peuvent être échelonnées beaucoup plus facilement.

Mais où les données sont-elles vraiment stockées dans un stockage défini par logiciel ou hyper convergent ?

La réponse à cette question n’est pas simple. Ceci dépend fortement du produit utilisé. Fondamentalement, les solutions SDS ou hyper convergentes sont composées de plusieurs couches de structure des données différentes. Pour essayer de faire simple, la structure peut être comparée à des poupées russes : les données de l’utilisateur se trouvent dans la couche la plus profonde, tandis que les autres technologies ajoutent leurs couches données par-dessus. Comme le montre l’illustration ci-dessus, pour ce qui est du stockage défini par logiciel, la couche données supérieure est celle créée par le contrôleur SDS, y compris les informations concernant les matrices de stockage virtuel. La couche suivante est la couche de virtualisation créée par l’hyperviseur en cours d’utilisation. Sous cette couche se trouvent les couches serveur, suivies des couches de chaque serveur, et enfin la couche du support physique. Au total, quatre couches qui se superposent jusqu’à la structure des données finale.

En contraste avec une solution SDS, la couche créée par l’hyperviseur dans une solution hyper convergente est la dernière couche de la structure des données, celle se trouvant à la surface. Sous cette couche, les informations sur le logiciel du contrôleur SDS ont été ajoutées. Par ailleurs, une couche a été créée à partir de l’un des nœuds reliés, et pour finir, les données brutes de l’utilisateur se trouvent à l’intérieur de ce « conteneur ». Si ce n’est pas assez compliqué, cela se corse ensuite :

Une autre caractéristique des solutions SDS ou hyper convergentes est que plusieurs d’entre elles utilisent des systèmes de fichiers propriétaires. Les solutions de stockage NetApp, par exemple, utilisent leur propre système WAFL – Write Anywhere File Layout – qui a été créé spécialement pour leur système d’exploitation Data Ontap et optimisé pour une utilisation en environnements réseau. Et ce n’est pas tout : NetApp propose deux autres systèmes d’exploitation, chacun avec ces propres avantages. VMware´s VSAN possède son propre système de fichiers appelé on-disk Filesystème (VSAN FS) depuis la Version 6 de sa solution SDS. Dell EMC propose VMware VSAN comme technologie de stockage hyper convergente pour ses produits PowerEdge Server. La solution de stockage pour larges données de Dell EMC – Isilon – possède un autre système de fichiers appelé Isilon OneFS (« 1 filesystème »). Dans ce système de fichiers, les métadonnées sont réparties de façon homogène partout dans les nombreux nœuds reliés au système.

Pour faire court et simple : presque toutes les solutions SDS ou hyper convergente utilisent leurs propres systèmes de fichiers et/ou systèmes d’exploitation, ce qui est la première chose à tirer au clair lorsque des données sont perdues et doivent être récupérées.

La récupération des données dans les solutions SDS ou hyper convergentes est-elle possible ?

Il existe de nombreux cas pour lesquels les spécialistes de Kroll Ontrack sont parvenus avec succès à une récupération des données d’un système de stockage haut de gamme possédant plusieurs couches données. L’un de ces cas concernait un système VMware vSAN quasiment neuf qui est complètement tombé en panne simplement à cause d’une mémoire SSD utilisée à l’intérieur en tant que mémoire cache du système. VMware propose l’option vSAN pour les serveurs vSphere EXSi pour organiser et gérer le stockage depuis mars 2014 seulement. Néanmoins, le système a subi une défaillance quelques mois plus tard. Ce système vSAN combine des applications ou des données enregistrées dans des machines virtuelles dans un magasin de données au stockage partagé, commun et groupé. Tous les ordinateurs hôtes connectés et leurs disques durs font partie de ce magasin de données commun. Cela signifie qu’en cas de défaillance matérielle ou de perte de données, les ingénieurs de sauvetage des données doivent traiter avec un niveau d’information supérieur. Ce système particulier était composé de 15 disques durs et 3 mémoires SSD, mais avec la panne de ce SSD, trois ordinateurs/nœuds hôtes ont subi une défaillance et une perte temporaire de quatre machines virtuelles importantes s’est produite.

Pour récupérer et sauvegarder toutes les données manquantes du système de stockage défectueux, les ingénieurs de Kroll Ontrack ont dû développer de nouveaux outils logiciels pour trouver les fichiers de description et les fichiers journaux pour l’identification et l’assemblage des données. Les magasins de données fonctionnaient comme des conteneurs, ainsi les spécialistes ont d’abord dû identifier les liens vers les machines virtuelles se trouvant à l’intérieur puis les reconstruire à l’étape suivante. Grâce aux nouveaux outils, ils ont été en mesure d’obtenir les informations sur la façon dont les machines virtuelles étaient enregistrées dans le magasin de données du vSAN et distribuées aux disques durs affectés. Ceci a permis aux experts en récupération des données de trouver les fichiers de description et les fichiers journaux beaucoup plus rapidement, facilitant ainsi grandement le processus de récupération. Avec ces outils à disposition, les spécialistes ont été en mesure de récupérer les machines virtuelles et toutes les données stockées sur le système vSAN.

Cet exemple montre que la récupération d’une solution SDS ou hyper convergente, qui inclut diverses technologies et couches données, est possible. Le nombre exact de couches devant être restaurées dépend du produit spécifique et des technologies utilisés. Par conséquent, tous les cas de perte de données et de récupération des données présentent leurs propres défis. À cause de ceci, il est essentiel pour une récupération des données réussie de faire le choix d’un spécialiste en récupération des données ayant déjà effectué avec succès une récupération des données à partir du produit spécifique, et qui possède les outils ainsi que les connaissances nécessaires pour faire face à un projet présentant une telle complexité.

Copyright de l’image: M.Großmann/pixelio.de

Laisser un commentaire