Qu’est-ce que le RAID ? Dévoilement des avantages et des inconvénients de 15 configurations RAID !
|
|
Temps de lecture 15 min
|
|
Temps de lecture 15 min
L'espace de stockage est devenu essentiel face à l'augmentation exponentielle des données. Aujourd'hui, les jeux AAA peuvent nécessiter des centaines de gigaoctets d'espace, tandis qu'un film Blu-ray 4K HD peut atteindre 70 à 80 gigaoctets. Même les photos et vidéos HDR prises avec nos téléphones portables occupent une place considérable.
On achète généralement un disque dur lorsque notre espace de stockage est insuffisant. Cependant, la gestion des partitions peut poser problème lorsqu'on possède plusieurs disques durs. Pour les données importantes, il peut être nécessaire d'effectuer manuellement des sauvegardes sur un autre disque dur afin d'en renforcer la sécurité.
Alors, comment exploiter plusieurs disques durs ? Le RAID permet d’utiliser plusieurs disques durs pour augmenter la capacité de stockage et la sécurité des données.
Proposé par le professeur D.A. Patterson de Berkeley, en Californie, en 1988, le RAID (redundant array of costs disks) est connu sous le nom de redundant array of independent disks.
Le RAID est la combinaison de plusieurs disques indépendants en un groupe de disques de grande capacité, utilisant des disques individuels pour fournir des données générées par un effet additif afin d'améliorer les performances de l'ensemble du système de disques, et stockant des données redondantes pour augmenter sa tolérance aux pannes.
En résumé, il présente de nombreux avantages car il combine plusieurs disques durs indépendants en un groupe de disques durs de grande capacité afin d'augmenter considérablement les vitesses de lecture et d'écriture tout en offrant des fonctions de protection des données.
Le RAID comporte différents niveaux et variantes, notamment RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6, RAID F1, RAIDZ, JBOD, SHR, SHR2 et RAID hybride.

Image provenant de www.ufsexplorer.com
Le RAID peut être classé en deux catégories principales : le RAID matériel et le RAID logiciel.
Le RAID matériel se présente sous deux formes. Un boîtier RAID externe est particulièrement coûteux et généralement utilisé pour le stockage en entreprise. L'autre solution consiste à ajouter une carte contrôleur RAID à l'ordinateur.

Image tirée de Wikipédia
Les cartes contrôleur RAID offrent des vitesses plus rapides et une plus grande stabilité grâce à la mémoire cache intégrée, ce qui peut améliorer les vitesses de lecture et d'écriture. La stabilité est améliorée grâce à l'intégration de batteries dans les cartes contrôleurs de haute qualité. Ces batteries garantissent l'écriture des données sur le disque dur avant toute coupure de courant, assurant ainsi la sécurité des données. Les nouvelles cartes contrôleurs sont plus chères que les anciennes, mais conviennent aux utilisateurs disposant d'un budget limité.

Image tirée de Wikipédia
Malgré les nombreux avantages du RAID matériel, il convient d'éviter un écueil potentiel : la fonction RAID intégrée à la carte mère. En effet, en cas de problème avec la carte mère, comme un overclocking raté ou une batterie défectueuse, la grappe RAID risque d'être perdue. Le RAID intégré à la carte mère est loin d'égaler le RAID logiciel.
Le RAID logiciel utilise un logiciel pour simuler le RAID. Les premières versions de RAID étaient peu stables et moins rapides que le RAID matériel. Cependant, grâce à l'optimisation continue de la technologie, l'écart de performance entre le RAID logiciel et le RAID matériel s'est considérablement réduit. Le RAID logiciel est un choix courant pour de nombreux périphériques NAS destinés à un usage domestique. Cliquez pour en savoir plus : Qu'est-ce que le stockage NAS ??

Le niveau RAID commence à 0 et va jusqu'à 7. Commençons par le RAID 0. Imaginez les disques durs comme des seaux et les opérations de lecture/écriture comme le remplissage de ces seaux. Cette analogie facilite la compréhension du RAID.
Informations essentielles sur RAID 0
Avantages: Vitesses de lecture/écriture rapides (pas de vitesses de lecture/écriture aléatoires) ; utilise tout l'espace du disque dur
Cons: Aucune protection des données
Conseil: Le RAID 0 ne peut pas être utilisé pour stocker des données importantes.
La vitesse de lecture/écriture est limitée par l'interface du disque dur lorsqu'il n'y en a qu'un seul, un peu comme la capacité d'un seau qui limite la vitesse à laquelle on le remplit. Si vous remplissez deux seaux simultanément, la vitesse de lecture/écriture est deux fois plus rapide qu'avec un seul disque dur. C'est le niveau de stockage RAID 0.
Le RAID 0 combine deux disques ou plus pour former un seul grand disque logique dont la capacité totale est équivalente à la capacité de tous les disques durs pris individuellement. Lors de l'écriture des données, celles-ci sont segmentées et stockées sur des disques séparés, permettant ainsi à plusieurs disques de gérer simultanément les opérations de lecture et d'écriture.
Malgré sa vitesse et sa capacité maximales, le RAID 0 présente un inconvénient majeur : son manque de redondance et de tolérance aux pannes. En cas de défaillance d'un disque dur, toutes les données sont perdues et irrécupérables. Le stockage des données par segments implique qu'une panne sur un seul disque dur ne permet qu'une récupération incomplète. Par conséquent, l'utilisation du RAID 0 pour le stockage de données importantes est fortement déconseillée.

Image tirée de Wikipédia
Informations essentielles sur RAID 1
Avantages: Haute sécurité, aucune perte de données même si l'un des disques est endommagé.
Cons: Faible utilisation du disque, aucune augmentation des vitesses d'écriture
Quel type de RAID convient au stockage de données importantes ? Le RAID 1 est le plus sécurisé, utilisant deux disques durs qui se répliquent pour stocker les mêmes données sur chaque disque. L'intégralité des données est lisible tant qu'aucun des disques durs de la grappe n'est endommagé. Le RAID 1 offre la même vitesse de lecture que le RAID 0, mais cette vitesse peut être augmentée avec plusieurs disques durs. En revanche, la vitesse d'écriture reste identique à celle d'un disque dur unique et ne peut être améliorée.
Un disque dur endommagé dans un RAID 1 peut être débranché et la grappe restaurera automatiquement les données sur le disque dur nouvellement inséré, un processus connu sous le nom de reconstruction de la grappe.
Le problème du RAID 1 réside dans son rapport prix/performances relativement faible.. Même avec 100 disques durs en RAID 1, la capacité finale correspond à celle d'un seul disque. Si la capacité de chaque disque est différente, la capacité finale sera basée sur celle du plus petit disque. Le taux d'utilisation global du RAID 1 est le plus faible parmi tous les niveaux RAID. Le RAID 0 et le RAID 1 peuvent être considérés comme deux extrêmes : le RAID 0 offre des vitesses ultra-rapides tandis que le RAID 1 est ultra-sécurisé.
Vous pouvez envisager un RAID 2, 3, 4, 5 ou 6 si vous cherchez à augmenter la capacité et la sécurité, mais que la vitesse n'est pas votre priorité.

Image tirée de Wikipédia
Les RAID 2, 3 et 4 ont été conçus pour des applications spécifiques, mais ils sont rarement utilisés et de nombreuses cartes contrôleurs ne prennent pas en charge ces niveaux en raison de diverses limitations.
Le RAID 2 nécessite au moins trois disques durs. Lors des opérations de lecture et d'écriture, il est nécessaire d'encoder les données en temps réel et de les répartir sur différents disques. La quantité totale de données obtenues est supérieure à la quantité initiale. De plus, le RAID 2 requiert le calcul en temps réel des sommes de contrôle des données pendant ces opérations. La charge matérielle est plus importante car l'algorithme de calcul des sommes de contrôle utilisé est plus complexe.

Le RAID 3 nécessite au moins trois disques durs et présente une faible consommation matérielle grâce à des algorithmes plus simples. Lors des opérations de lecture et d'écriture, les données sont écrites par segments sur différents disques durs, tandis que les sommes de contrôle sont stockées séparément sur un autre disque. Cependant, la somme de contrôle d'un disque doit être vérifiée à chaque opération de lecture et d'écriture, car elle est facilement altérée en cas de forte charge prolongée. Les données sont irrécupérables lorsque la somme de contrôle d'un disque est corrompue.

Image tirée de Wikipédia
Le RAID 4 est similaire au RAID 3, mais la segmentation des données diffère. Le RAID 4 stocke également les données de parité sur un disque dur distinct. Contrairement au RAID 3, le RAID 4 segmente les données par blocs, dont la taille est déterminée par le système et est généralement bien supérieure à un bit. Ainsi, l'écriture de petits fichiers est plus rapide en RAID 4 qu'en RAID 3. Cependant, la probabilité de récupération des données sur un disque corrompu sans somme de contrôle est plus faible qu'en RAID 3. Ni le RAID 3 ni le RAID 4 ne permettent de récupérer des données lorsque la somme de contrôle d'un disque est corrompue.

Image tirée de Wikipédia
Le RAID 5 est similaire au RAID 3, à ceci près que le RAID 3 stocke les données de parité sur un seul disque dur, tandis que le RAID 5 les répartit sur plusieurs disques. Ainsi, en cas de défaillance d'un disque dur, les données présentes sur les autres disques et la somme de contrôle peuvent être utilisées conjointement pour la récupération des données, contrairement au RAID 3 où une somme de contrôle corrompue entraîne la défaillance de l'ensemble du système.

Image tirée de Wikipédia
Le RAID 5 nécessite au moins trois disques durs. Un tiers de l'espace est utilisé pour stocker des informations redondantes, ou sommes de contrôle, tandis que les deux tiers restants servent au stockage des données brutes. La vitesse de lecture du RAID 5 est similaire à celle du RAID 0, mais sa vitesse d'écriture peut être inférieure. Cependant, les données et les sommes de contrôle présentes sur les autres disques durs permettent une récupération complète des données, même en cas de corruption d'un disque du système, car un tiers de l'espace est dédié au stockage des sommes de contrôle. Le RAID 5 offre donc une sécurité supérieure au RAID 0.
En environnement d'entreprise, le serveur de fichiers envisage souvent le RAID 5 comme option pour son système de stockage. Serveur de fichiers Le serveur de fichiers centralise tous les fichiers partagés de l'entreprise, tels que les documents commerciaux, les rapports financiers et les fichiers de projet. Il doit garantir l'accès à ces fichiers aux employés autorisés à tout moment. La capacité du RAID 5 à se rétablir après la panne d'un disque en fait une solution idéale pour un serveur de fichiers. En cas de défaillance d'un disque dur dans la grappe RAID 5 du serveur de fichiers, ce dernier peut continuer à fonctionner et à fournir l'accès à la plupart des fichiers pendant la reconstruction de la grappe.
Le RAID 5 offre une sécurité accrue, mais présente également des inconvénients. Premièrement, la probabilité qu'un disque dur mécanique rencontre une erreur de lecture irrécupérable (URE) lors de la lecture de données est très faible (environ une fois tous les 12 To de données). Une seule erreur URE suffit au RAID 5 pour interpréter cela comme un problème avec les données et lancer une reconstruction de la grappe.
Des reconstructions répétées peuvent entraîner une forte sollicitation des disques durs pendant de longues périodes. Si les disques ont été achetés simultanément et que l'un d'eux tombe en panne, l'état des autres peut également se dégrader, ce qui risque d'endommager davantage les disques.
Le RAID 5 ne tolère la défaillance que d'un seul disque dur ; par conséquent, si un autre disque est endommagé pendant la reconstruction, les données ne seront pas sauvegardées. Son utilisation est déconseillée en raison de son faible taux de réussite lors de la reconstruction et de sa sécurité moindre comparée au RAID 6.
Le niveau RAID est un facteur essentiel lors du choix d'une solution de stockage. Pour les NAS, qu'il s'agisse d'une configuration à 2 ou 4 baies, la configuration RAID appropriée doit être prise en compte. Comprendre ces facteurs clés vous aidera à faire un choix éclairé. Explorez les détails de Options de stockage NAS à 2 et 4 baies.
Le RAID F1, basé sur le RAID 5, est conçu pour les disques SSD. Optimisé pour limiter l'usure en écriture, il stocke les sommes de contrôle sur un seul SSD afin de minimiser les écritures sur les autres. Le système prend en charge le transfert automatique des données lorsque le SSD approche de sa limite d'écriture. Cependant, le RAID F1 reste généralement inaccessible au grand public en raison du prix élevé des SSD.
RAID 6 et RAID 5 sont deux niveaux RAID courants. Par rapport à RAID 5, RAID 6 ajoute de l'espace disque supplémentaire pour les données de parité et nécessite au moins quatre disques durs.
Le RAID 6 offre une sécurité des données élevée grâce à l'utilisation de deux algorithmes de somme de contrôle différents, garantissant une récupération complète des données même en cas de corruption de deux disques durs. En comparaison, le RAID 5 est moins sécurisé. Cependant, le nombre de sommes de contrôle utilisées en RAID 6 est deux fois supérieur à celui du RAID 5, car le premier utilise deux algorithmes de somme de contrôle plus gourmands en ressources de calcul. De ce fait, les vitesses de lecture et d'écriture du RAID 6 sont inférieures à celles du RAID 5.

Image tirée de Wikipédia
Si vous n'êtes pas satisfait des RAID 0 à 6 et que vous souhaitez savoir s'il existe des types de RAID qui combinent les avantages de tous les niveaux, poursuivez votre lecture pour en savoir plus sur le RAID hybride.
Le RAID 10 est le RAID hybride le plus courant. Combinant les modes RAID 1 et RAID 0, il garantit la sécurité des données et augmente considérablement les vitesses de lecture et d'écriture, mais sa capacité disponible n'est que la moitié de sa capacité totale.
Le RAID 10 nécessite au moins quatre disques durs, dont deux seront utilisés pour former le RAID 1 et deux autres pour former le RAID 0.
Outre le RAID 10, il existe les configurations RAID 50 et RAID 60. Le RAID 50 combine les technologies RAID 5 et RAID 0 : il utilise le RAID 5 pour stocker les données et les informations de parité sur plusieurs disques durs, puis combine ces disques pour former un espace de stockage agrégé de grande capacité grâce au RAID 0, augmentant ainsi la capacité de stockage et les performances de lecture/écriture. Le RAID 60 combine les technologies RAID 6 et RAID 0 et adopte une approche similaire pour accroître la capacité de stockage et les performances de lecture/écriture, tout en offrant une meilleure redondance et une sécurité renforcée des données.
JBOD, acronyme de « Just a Bunch of Disks », utilise un modèle de stockage de données particulier. Dans JBOD, les données sont stockées séquentiellement sur les disques, en commençant par le premier. Seule une partition unique, contenant la capacité totale des disques durs, est visible dans le système. Cependant, les données deviennent inaccessibles en cas de panne d'un disque dur. Pire encore, la totalité du système est hors service si le premier disque dur est endommagé, car il constitue le seul emplacement de stockage pour la segmentation des données.
L'avantage du JBOD réside dans sa capacité à gérer plusieurs disques durs comme un tout, leur capacité totale étant disponible. De plus, un seul disque est sollicité par opération d'écriture. Ainsi, les autres disques restent inactifs pendant les opérations de lecture et d'écriture, évitant tout dommage dû à une utilisation excessive. Cependant, le JBOD présente des inconvénients majeurs. Sa sécurité des données est relativement faible, car la défaillance d'un seul disque dur peut entraîner une perte de données. Par ailleurs, les vitesses de lecture et d'écriture restent identiques à celles d'un disque dur unique. De ce fait, le JBOD est déconseillé pour les applications exigeant une sécurité des données et des performances de lecture/écriture élevées.
Unraid est un système d'exploitation basé sur Linux, similaire à JBOD, qui prend en charge la redondance des données. Sous Unraid, un ou deux disques durs peuvent être configurés pour la vérification des données. Une capacité plus importante est nécessaire pour récupérer les données en cas de défaillance d'un ou deux disques durs.
Unraid offre une extension de capacité simplifiée : il suffit d'insérer un nouveau disque dur pour augmenter l'espace de stockage. Même en cas de panne de plusieurs disques durs, seules les données du disque endommagé seront perdues. Les autres disques de la grappe continueront de fonctionner normalement.
Cependant, Unraid présente deux inconvénients majeurs qui limitent son utilisation. Premièrement, il est payant, son prix variant de 59 à 129 dollars, ce qui reste relativement abordable. À l'instar de JBOD, Unraid offre des vitesses d'écriture plus lentes, car l'opération de vérification supplémentaire augmente le temps d'écriture. De fait, les vitesses d'écriture d'Unraid peuvent même être inférieures à celles de JBOD, le plus lent de tous les systèmes de stockage RAID.
Néanmoins, Unraid offre une grande capacité de stockage, ce qui le rend idéal pour les utilisateurs qui n'ont pas besoin de performances élevées.
Synology Hybrid RAID (SHR) est un mode RAID unique, principalement destiné aux nouveaux utilisateurs qui ne connaissent pas les configurations RAID. SHR détermine et utilise automatiquement le mode RAID approprié en fonction du nombre et de la capacité des disques durs.
En SHR, la capacité d'un disque dur est utilisée par défaut pour stocker les données de vérification. Si tous les disques durs ont la même capacité et qu'un seul disque est utilisé, le SHR équivaut à un disque dur classique sans protection des données. Avec deux disques durs, le SHR adopte un mode similaire au RAID 1. Avec trois disques durs, le SHR est similaire au RAID 5. Le SHR 2 stocke les sommes de contrôle sur deux disques durs et nécessite quatre disques durs, comme le RAID 6.
Le SHR facilite la mise à niveau d'une matrice redondante de disques vers deux, offrant une plus grande flexibilité que le RAID classique. Cependant, la récupération de données est uniquement possible en mode GroupHi, le SHR étant un mode dédié à ce dernier. Un logiciel spécialisé est nécessaire pour la récupération des données, car les disques durs utilisés sur d'autres ordinateurs peuvent ne pas être en mesure de lire directement les données. Toutefois, ces logiciels présentent certaines limitations en matière de récupération de données.
RAID Z est un RAID logiciel basé sur le système ZFS. ZFS est un système de fichiers 128 bits qui prend en charge des fonctionnalités avancées, notamment :
RAID Z est une fonctionnalité de ZFS qui permet de mettre en œuvre un RAID sans logiciel ni matériel supplémentaire. Il existe trois types de RAID Z : RAID Z1, RAID Z2 et RAID Z3.
Associé aux fonctionnalités de ZFS, RAID-Z est une excellente option. Cependant, RAID-Z présente aussi quelques inconvénients, notamment une forte consommation de mémoire. ZFS nécessite une quantité importante de mémoire pour la mise en cache ; il est préférable que chaque téraoctet (To) corresponde à 1 Go de mémoire, sous peine de voir les performances s'en trouver affectées. Il est recommandé de commencer avec au moins 8 Go. L'utilisation d'une mémoire avec code de correction d'erreurs est également essentielle pour minimiser le risque d'erreurs de données.
Le deuxième inconvénient est l'augmentation des capacités.Il est nécessaire d'ajouter un groupe supplémentaire de six disques durs maximum si un troisième disque dur est configuré en RAID Z1. Cette solution est moins pratique que le RAID 5 et le RAID 6, qui permettent d'augmenter la capacité par l'ajout d'un nouveau disque dur.
Dans cet article, nous avons présenté le concept de RAID, ainsi que les avantages et les inconvénients de 15 niveaux de RAID différents. Comprendre les caractéristiques de ces différents niveaux permet aux utilisateurs de choisir une solution de stockage adaptée à leurs besoins et d'améliorer la sécurité et la fiabilité de leurs données.