
Mise à part le Raid 6 et les Raid complexes, les niveaux du RAID traditionnel offrent une protection des données à travers une parité unique. NetApp utilise le Raid 4 traditionnel (à parité unique) dans leurs systèmes de stockage. La sortie du Raid DP (à double parité), leurs systèmes de stockage peuvent offrir un niveau de protection très élevé contre une légère perte de performance et de coût d'exploitation. Dans une page du site, nous avons introduit le Raid DP. Dans cet article on expliquera comment s'effectue la reconstruction des blocs de données manquants en raison d'une double pannes de disques durs.
Dans la suite des explications, on prendra en compte l'exemple de blocs de données simplifiés par des nombres décimaux, on va considérer que le calcul de la parité est une simple addition. En réalité, les blocs de données sont en binaires et la parité est obtenues par l'opération XOR.
On remarque de l'image ci-dessous du RAID-DP, que les bandes diagonales s'enroulent sur les bords de la parité de ligne. Il y a deux conditions importantes (pas très visibles sur l'image) pour que RAID-DP puisse récupérer les données en cas de double pannes de disques.
Il est important de noter que les mêmes conditions de parité diagonale RAID-DP dans cet exemple sont valables dans les systèmes de stockage réels impliquant des dizaines de disques dans un groupe RAID et des millions de lignes de données écrites horizontalement à travers le groupe RAID 4. Bien qu'il soit plus facile d'illustrer RAID-DP avec le plus petit exemple ci-dessus, la récupération de groupes RAID de plus grande taille fonctionne exactement de la même manière quel que soit le nombre de disques du groupe RAID.
Prouver que RAID-DP récupère vraiment toutes les données en cas de double panne de disque peut être fait en deux manières. L'un utilise des théorèmes et des preuves mathématiques, et l'autre consiste simplement à passer par un double panne de disque et processus de récupération ultérieur. On utilise cette dernière approche pour montrer le concept de protection à double parité RAID-DP.
Supposons que le RAID fonctionne normalement lorsqu'une double panne de disque se produise. Ceci est indiqué par toutes les ronds noirs dans les deux premiers colonnes, maintenant manquantes dans l'image suivante.
Après une double panne de disques, RAID-DP commence d'abord par rechercher une chaîne sur laquelle il peut démarrer la reconstruction. Dans ce cas, disons que la première bande de parité diagonale dans la chaîne trouvée est représentée par la bande diagonale bleue. N'oubliez pas lors de la reconstruction des données pour une panne de disque unique sous RAID 4 est possible si et seulement si un seul disque manque. Dans cet logique, suivez le bleu diagonal de l'image ci-dessous et remarquez qu'un seul des cinq blocs bleus est manquant. Avec quatre sur cinq éléments disponibles, RAID-DP dispose de toutes les informations nécessaires pour reconstituer les données dans le bloc bleu manquant.
Les données ont été recréées à partir du bloc diagonal bleu manquant en utilisant la même arithmétique décrite plus tôt (12 - 7 - 2 - 2 = 1). Maintenant que les informations manquantes de la diagonale bleue ont été recréées, le processus de récupération passe de l'utilisation de la parité diagonale à l'utilisation de la parité de ligne horizontale. Plus précisément, dans la rangée du haut après que la diagonale bleue a recréé le bloc diagonal manquant, il y a maintenant suffisamment d'informations disponible pour reconstruire le seul bloc horizontal manquant à partir de la parité des lignes (9 – 3 – 2 – 1 = 3). Cela se produit dans l'image suivante.
RAID-DP continue ensuite dans la même chaîne pour déterminer si d'autres bandes diagonales peuvent être recréées. Avec le bloc en haut à gauche ayant été recréé à partir de la parité des lignes, RAID-DP peut désormais recréer le bloc manquant dans la bande diagonale violette, comme le montre l'image suivante.
Une fois que le RAID-DP a récupéré un bloc diagonal manquant dans une bande diagonale, il y a assez d'informations pour recréer le seul bloc horizontal manquant dans la première colonne, comme illustré à limage suivante.
Comme nous l'avons noté précédemment, la bande diagonale blanche n'est pas stockée et aucun bloc diagonal supplémentaire ne peut être recréé sur la chaîne existante. RAID-DP va commencer à chercher une nouvelle chaîne pour commencer à recréer le blocs en diagonal et, pour les besoins de cet exemple, détermine qu'il peut recréer les données manquantes dans la bande diagonale orange, comme le montre l'image suivante.
Une fois que RAID-DP a recréé le bloc diagonal manquant, le processus passe à nouveau à la recréation d'un bloc horizontal manquant de la parité de ligne. Lorsque le bloc diagonal manquant a été recréé, suffisamment des informations sont disponibles pour recréer le bloc horizontal manquant à partir de la parité des lignes, comme le montre l'image suivante.
Une fois le bloc manquant dans la rangée horizontale recréé, la reconstruction revient à la parité diagonale pour recréer un bloc diagonal manquant. RAID-DP peut continuer dans la chaîne actuelle sur le rouge bande diagonale, comme le montre l'image suivante.
Enfin, après la récupération d'un bloc diagonal, le processus repasse à la parité de ligne, puisqu'il a suffisamment d'informations pour recréer des données pour le bloc horizontal. Le diagramme final dans le scénario de défaillance de double disque suit ensuite, dans l'image dessous, avec toutes les données ayant été recréées avec RAID-DP.
RAID-DP offre des améliorations spectaculaires dans la protection des données, qui répondent aux défis du RAID mis en œuvre provoquée par la croissance rapide de la taille des disques modernes. Contrairement à d'autres approches pour les doubles pannes de disques, les performances RAID-DP sont comparables à celles de RAID 4 et ne nécessitent pas des ressources de stockage supplémentaires que ces autres approches nécessitent.
Adresse : 18 rue Charcot, 75013 Paris, France