Le Raid 5 (ou Raid5) utilise 3 disques au moins. En principe, il n'y a pas de limite supérieure pour le nombre de disques, mais en pratique, il faut prendre en considération la capacité de gestion de disques par la carte Raid dans le cas de Raid matériel. La capacité utile de la grappe est (N-1) fois la capacité du plus petit disque membre du Raid 5. La capacité utilisée pour la parité est équivalente de celle d'un disque afin d'offrir une tolérance à la panne d'un seul disque.
Le Raid 5 utilise les techniques de distribution des blocs de données ainsi que la parité. Le flux de données est divisé par bloc dont la taille est le fameux paramètre "taille du bloc". Sur chaque ligne, il y a un seul bloc de parité. Ce bloc est calculé par la fonction "XOR" des données des deux autres blocs. En cas de panne d'un disque, les données manquantes peuvent être déduites par la fonction "XOR" à partir des blocs de données disponibles.
Il existe plusieurs variétés de Raid 5, en fonction de l'emplacement du bloc de la parité et l'ordre des blocs de données. Dans l'image ci-côté, deux types sont illustrés : Raid 5 gauche synchrone et asynchrone. Deux autre variétés peuvent être obtenues : Raid 5 droite synchrone et asynchrone également.
Dans un Raid 5 classique, le disque de remplacement à chaud est rangé à côté de la grappe en attendant la sortie d'un disque de la grappe, afin de reconstruire le Raid 5 immédiatement. Le Raid 5E est un Raid 5 amélioré (Enhanced), contient un espace équivalent à un disque de remplacement à chaud "Hot Spare" intégré à la grappe de la même manière que les blocs de données et de parités. Pour former un Raid 5E, 4 disques sont nécessaires au moins. La capacité du Raid 5E est exactement comme celle du Raid 5 avec un disque "Hot Spare", soit N-2.
Les avantages du Raid 5E sont les suivants :
L'espace disque "Hot Spare" est disponible et en bon état de fonctionnement.
La présence d'un disque supplémentaire dans la grappe permet une meilleure distribution de la charge Entrée/Sortie et une meilleure performance.
Néanmoins, le Raid 5E peut avoir les inconvénients suivants :
L'offre de contrôleur de Raid 5E est très limitée (serveur IBM seulement).
L'espace "Hot Spare" ne peut pas être partagé avec une autre grappe 5E. Alors que dans un Raid 5 classique, le disque "Hot Spare" peut l'être.
La reconstruction est plus lente en cas de défaillance d'un disque.
Raid 5EE
Le Raid 5EE est une version encore plus améliorée que le Raid 5E. L'espace vide "Hot Spare"
n'est pas situé à la fin de chaque disque, mais distribué par blocs au même titre que les blocs de données et de parité. Tout comme le Raid 5E, pour former le Raid 5EE, 4 disques sont nécessaires au moins. La capacité totale du Raid EE est de N-2 fois la capacité d'un seul disque.
Mise à part l'amélioration dans la vitesse de reconstruction, le Raid 5EE a les mêmes avantages et inconvénients que le Raid 5E.
Panne du Raid 5
La panne de Raid 5 peut être due à une de ces trois raisons :
Panne matérielle sur un des disques membres du Raid 5.
Pannes matérielles sur plusieurs disques membres du Raid 5.
Panne du contrôleur du Raid 5.
Le Raid 5 est redondant, et il peut être tolérant à la panne d'un disque membre actif du Raid. En cas de panne de plusieurs disques simultanément, la récupération de données sur un Raid 5 devient impossible. (Une récupération très partielle peut être discutable).
Très souvent, un NAS peut donner un signal lumineux d'alerte sur la panne d'un disque, alors qu'une carte contrôleur ou bien un pilote affichent un message d'alerte de panne de disque. Dans ce type de cas, il serait suffisant de remplacer le disque défectueux et de reconstruire le Raid.
Panne d'un seul disque du Raid 5
Très souvent, un NAS peut donner un signal lumineux d'alerte sur la panne d'un disque, alors qu'une carte contrôleur ou bien un pilote affichent un message d'alerte de panne de disque. Dans ce type de cas, il serait suffisant de remplacer le disque défectueux et de reconstruire le Raid.
Panne de plusieurs disques du Raid 5
Une panne multiples de plusieurs disques sur un Raid 5 peut être constatée selon l'un des signes suivants :
Pour un NAS, les Leds correspondantes deviennent rouges. Cela peut correspondre à une panne physique sur un disque du Raid.
Le Raid n'est pas accessible, mais le contrôleur semble fonctionner proprement. Alors, peut-être la panne est logicielle.
Récupérer les données de Raid 5 : possibilités et limites
Comme le Raid 5 est tolérant à la panne d'un seul disque, une panne de plusieurs disques rend la récupération de données sur le Raid 5 impossible. Cette règle est générale, stricte et concerne uniquement la possibilité de récupération de données intégralement. En réalité et en pratique, toutes les pannes de disques durs ne sont pas mortelles. Un disque dur peut être endommagé entièrement, partiellement ou très légèrement ou pas du tout, où seulement le SMART du disque peut atteindre des seuils inacceptables par le hôte.
Règles générales de la récupération de données du Raid 5
Pour récupérer les données d'un Raid 5, afin de favoriser la réussite de la récupération de données, un certain nombre de règles est absolument à respecter :
Clonage (ou création d'image) de tous les disques disponibles, membres actifs du Raid 5 : il faut exclure le disque "Hot Spare" s'il n'a pas été reconstruit, le disque système (s'il est séparé), et tout autre disque ne faisant pas partie du Raid 5.
Identifier le nombre de disques disponibles membres du Raid 5 par rapport au nombre total.
Récupération de données de Raid 5, étape par étape :
Les étapes principales dans la récupération de données d'un Raid 5, Raid 5E et Raid 5EE sont les suivantes :
Récolter le maximum d'information du client : conditions du dysfonctionnement, manipulation, type du Raid, volume utile de données, volume de données utiles, données demandées avec leurs chemins, interventions, etc.
Déterminer et sécuriser les disques de la grappe, étiqueter les disques par rapport à leurs emplacements d'origine. Obtenir les informations de la configuration de la carte contrôleur.
Tester et diagnostiquer les disques un par un afin d'identifier leur état physique. Les disques fragiles doivent être remplacer par des clones sur des disques identiques ou bien par des fichiers images. Les disques du Raid doivent être protégés en écriture si possible. Aucune modification du contenu ne doit être apportée.
Analyser les disques afin d'obtenir les métadonnées concernant la configuration du Raid : type du Raid, nombre de disques, taille du bloc, rotation, version du logiciel pour un Raid logiciel, etc.
Identifier les disques membres actifs du Raid étant nécessaire à la reconstruction du Raid.
Simulation du Raid 5 matériel (ou logiciel) et identification de la partition du Raid.
Création d'une image physique du Raid (secteur à secteur).
Analyse logique de l'image pour déterminer le nombre et le type des partitions, le système de fichiers.
Extraction de données et test de pertinence.
Si le système de fichiers est corrompu partiellement et entièrement, il serait nécessaire d'analyser la totalité de l'image du Raid afin de récupérer les données effacées, et hors arborescence.
Récupération de données de Raid 5 avec N-1 disques
C'est le cas idéal pour la récupération de données sur un Raid 5 avec un seul disque manquant, tout en supposant que les disques disponibles ont été clonés proprement. Puisque la tolérance à la panne d'un Raid 5 est d'un disque, la récupération de données dans ce cas ne présente aucune difficulté à la condition de bien déterminer les paramètres du raid.
Récupération de données de Raid 5 avec N-2 disques et un disque dégradé
La récupération de données d'un Raid 5, 5E ou 5EE avec deux disques manquants est en principe impossible. Mais la présence d'un disque dégradé donne un espoir de récupérer les données partiellement, et avec un peu de chance entièrement en supposant que la dégradation ne touche pas les données vitales. Après la détermination des paramètres du Raid 5, la grappe doit être construite dans les mêmes conditions qu'avec N-1 disques.
Récupération de données de Raid 5 avec N-2 disques
C'est le cas le plus complexe. Car à priori, les données ne peuvent pas être récupérées. Mais :
Un disque vierge peut remplacer manquant.
Le Raid 5 sera reconstruit avec ces disques.
Si la taille du bloc est assez importante, on peut espérer récupérer les données dont la taille est inférieure à la taille de N-2 blocs consécutifs. Cela peut être intéressant si les données recherchées sont de petites tailles généralement comme (bureautique).