Raid 0 4 disque. Raid10 vs raid01. Informations pour la pensée

Sur Internet, il y a beaucoup d'articles avec une description du raid. Par exemple, cela décrit tout en détail. Mais comme d'habitude, lisez que tout n'est pas assez de temps, vous avez donc besoin de quelque chose de court pour la compréhension - et il est nécessaire ou non, et qu'il vaut mieux utiliser par rapport au travail avec le SGM (Interbase, Firebird ou autre chose est en fait de toute façon) . Avant vos yeux - c'est un tel matériau.

Dans le premier rapprochement RAID, il s'agit d'une combinaison de disques dans un seul tableau. SATA, SAS, SCSI, SSD - Peu importe. De plus, presque toutes les cartes mère normales soutient désormais la possibilité d'organiser SATA RAID. Passons dans la liste, que sont raid et pourquoi ils. (Je voudrais noter immédiatement que le raid doit combiner les mêmes disques. Combinant des disques de différents fabricants, d'un seul différents types, ou différentes tailles sont dorloyantes pour une personne assise sur un ordinateur à la maison).

RAID 0 (Stripe)

À titre approfondi, il s'agit d'une combinaison cohérente de deux (ou plus) disques physiques dans un disque «physique». Il convient à l'organisation d'énormes espace disquePar exemple, pour ceux qui travaillent avec l'édition vidéo. Les bases de données sur de tels disques ne font aucun sens - en fait, même si vous avez même une base de données de 50 gigaoctets, alors pourquoi avez-vous acheté deux disques de 40 gigaoctets de taille et non 1 à 80 gigaoctets? La pire chose à faire est que, dans RAID 0, tout refus de l'un des disques conduit à l'inopérabilité totale d'un tel raid, car les données sont enregistrées alternativement sur les deux disques et, en conséquence, RAID 0 n'a pas de moyen de récupération en cas de défaillance .

Bien sûr, RAID 0 donne une accélération dans le travail en raison de l'alternance de lecture / écriture.

RAID 0 est souvent utilisé pour placer des fichiers temporaires.

RAID 1 (miroir)

Disques en miroir. Si Shadow in IB / FB est la mise en miroir logicielle (voir Guide des opérations.pdf), puis RAID 1 est la mise en miroir matérielle et rien de plus. Évitez vous de l'utilisation de la mise en miroir logicielle avec le système d'exploitation ou à un logiciel tiers. C'est nécessaire ou "fer" raid 1, ou ombre.

Si vous échouez, vérifiez soigneusement quel type de disque échoue. Le cas le plus courant de la perquialité de base de données sur RAID 1 est des actions incorrectes lors de la récupération (comme «tout» n'est pas le même disque).

En ce qui concerne la performance - en écrivant des gains 0, la lecture est possible jusqu'à 1,5 fois, car la lecture peut être effectuée "parallèle" (alternativement de différents disques). Pour les bases de données, l'accélération ne suffit pas, tandis que l'accès parallèle à différentes parties (!) (Fichiers) de l'accélération du disque sera absolument précis.

Raid 1 + 0

Sous RAID 1 + 0, je veux dire l'option RAID 10, lorsque deux RAID 1 sont combinés dans RAID 0. Option, lorsque deux RAID 0 sont combinés dans RAID 1 appelé RAID 0 + 1, et "extérieur" est le même RAID 10.

RAID 2-3-4

Ces raids sont rares, car ils utilisent les codes Hamming, ou des octets partitionnement des blocs + de la somme de contrôle, etc., mais le résumé total est tel, ces raids donnent uniquement une fiabilité, avec une augmentation de la productivité 0-W, et parfois même son aggravation .

Raid 5.

Pour cela, vous avez besoin de 3 disques minimalement. Ces parités sont réparties sur tous les disques de la matrice

On dit généralement que "RAID5 utilise un accès indépendant aux disques, de sorte que les requêtes pour différents disques puissent être effectuées en parallèle." Il convient de garder à l'esprit que nous parlons, bien sûr, des demandes parallèles de conclusions d'entrée. Si de telles demandes vont séquentiellement (en Supererserver), alors bien sûr, l'effet de la parallélisation de l'accès au RAID 5, vous ne recevrez pas. Bien sûr, RAID5 donnera une augmentation de la performance si le système d'exploitation et d'autres applications fonctionneront avec un tableau (par exemple, ce sera mémoire virtuelle, Temp, etc.).

En général, RAID 5 était l'ensemble des disques les plus couramment utilisés pour travailler avec le SGBD. Maintenant, un tel tableau peut être organisé sur Disque SATAx, et ce sera beaucoup moins cher que sur SCSI. Prix \u200b\u200bet contrôleurs que vous pouvez voir dans les articles
De plus, vous devez accorder une attention particulière au volume des disques achetés - par exemple, dans l'un des articles RAID5 mentionnés est collecté à partir de 4 34 disques GIG et 103 gigaoctets sont obtenus.

Testez cinq contrôleurs RAID SATA - http://www.thg.ru/storage/20051102/index.html.

Adaptec SATA RAID 21610SA dans RAID 5 Tableaux - http://www.ixbt.com/storage/adaptec21610raid5.shtml.

Pourquoi RAID 5 est mauvais - https://GeekTimes.ru/post/78311/

Attention! Lors de l'achat de disques pour RAID5, 3 disques sont généralement pris au minimum (plutôt à cause du prix). Si soudainement, après le temps, un des disques refusera, il peut y avoir une situation où il n'est pas possible d'acheter un disque, similaire à celui utilisé (cessé d'être émis, n'est pas temporairement disponible en vente, etc.). Par conséquent, plus idée intéressante Il semble que l'achat de 4 disques, l'organisation RAID5 de trois et la connexion du 4ème disque comme sauvegarde (pour des sauvegardes, d'autres fichiers et d'autres besoins).

Le volume de la matrice de disque RAID5 est calculé par la formule (N-1) * HDDDDSIZE, où N est le nombre de disques de la matrice et le disque dur est la taille d'un disque. Par exemple, pour un tableau de 4 disques de 80 gigaoctets, un volume total sera de 240 gigaoctets.

Il y a une «inadaptation» RAID5 pour les bases de données. Au minimum, il peut être envisagé du point de vue qu'il est nécessaire d'utiliser un contrôleur spécialisé pour obtenir de bonnes performances RAID5, et non qu'il y a de défaut sur la carte mère.

L'article RAID-5 doit mourir. Et sur la perte de données sur RAID5.

Noter. Le 5 septembre 2005, le coût du disque SATA Hitachi 80 Go est de 60 $.

RAID 10, 50

En outre, il y a déjà des combinaisons d'options répertoriées. Par exemple, RAID 10 est RAID 0 + RAID 1. RAID 50 est RAID 5 + RAID 0.

Fait intéressant, la combinaison RAID 0 + 1 en termes de fiabilité s'avère pire que RAID5. Dans le service de réparation de base de données, il existe un cas d'un seul disque dans le système RAID0 (3 disque) + RAID1 (3 plus du même disque). Dans le même temps, RAID1 ne pouvait pas "élever" disque de sauvegarde. La base a été gâtée sans une chance de réparer.

Pour RAID 0 + 1, 4 disques sont nécessaires et pour RAID 5 - 3. Pensez-y.

RAID 6.

Contrairement à RAID 5, qui utilise la parité pour protéger les données des défauts simples, dans RAID 6, la même parité est utilisée pour protéger contre les failles doubles. En conséquence, le processeur est plus puissant que dans RAID 5, et les disques ne sont pas nécessaires déjà 3 et au moins 5 (trois disques de données et 2 contrôles de parité). De plus, le nombre de disques de RAID6 n'a pas de cette flexibilité que dans RAID 5, et doit être égal à un nombre simple (5, 7, 11, 13, etc.)

Supposons que l'échec simultané de deux disques, cependant, cette affaire est très rare.

En termes de RAID 6, je n'ai pas vu de données (je n'ai pas recherché), mais il se peut que cela soit dû à un contrôle excédentaire, les performances peuvent être au niveau de la RAID 5.

Reconstruire le temps.

Tout massif RAID, qui reste réalisable lorsqu'un seul disque échoue, existe une telle chose que reconstruire le temps.. Bien sûr, lorsque vous avez remplacé une numérotation sur une nouvelle, le contrôleur doit organiser le fonctionnement d'un nouveau disque dans le tableau, ce qui nécessitera une certaine période.

Pendant la "connexion" d'un nouveau disque, par exemple, pour RAID 5, le contrôleur peut permettre de travailler avec un tableau. Mais la vitesse de la matrice dans ce cas sera assez faible, au minimum, car même avec le remplissage "linéaire" d'un nouveau disque, l'enregistrement "distraire" le contrôleur et la tête de disque à l'opération de synchronisation avec le reste de la déployer.

Le temps nécessaire à la restauration du fonctionnement de la matrice en mode normal dépend directement du volume des disques. Par exemple, la matrice Sun StorEdge 3510 FC avec la taille d'un réseau de 2 térabytes en mode monopole fait de la reconstruction pendant 4,5 heures (pour le prix du fer à repasser environ 400 000 $). Par conséquent, lors de l'organisation d'une planification de la matrice et de la récupération, si vous échouez, tout d'abord, il est nécessaire de penser à la reconstruction. Si votre base de données et vos sauvegardes n'occupent pas plus de 50 gigaoctets et que la croissance par an est de 1 à 2 gigaoctets, il est peu probable qu'il ait un sens de collecter un tableau de disques de 500 gigaoctets. Ce sera suffisant et 250 gigaoctets, et même pour RAID5, ce sera au moins 500 gigaoctets pour accueillir non seulement la base de données, mais également des films. Mais le temps de reconstruction pour 250 disques de gigaoctet sera d'environ 2 fois inférieur à 500 gigaoctets.

Résumé

Il s'avère que le plus significatif est d'utiliser RAID 1 ou RAID 5. Cependant, l'erreur la plus courante que presque tout est faite est l'utilisation de RAID "sous tout". C'est-à-dire qu'ils ont mis RAID, tout ce qui est, et ... obtenir une fiabilité au mieux, mais pas une amélioration de la performance.

Plus souvent, n'incluent pas le cache en écriture, à la suite de laquelle l'enregistrement RAID est plus lent que sur le disque unique habituel. Le fait est que la plupart des contrôleurs ont l'option par défaut est éteinte, car On pense qu'il est souhaitable que l'inclusion soit souhaitable pour au moins la batterie sur le contrôleur RAID, ainsi que la présence d'onduleurs.

Texte
Dans l'ancien article HDDSPEED.HTMLINK (et dans DOC_CALFORD_1.HTMLINK), il est montré comment obtenir une augmentation significative de la productivité en utilisant plusieurs disques physiques, même pour l'IDE. En conséquence, si vous organisez RAID - mettez la base de données sur elle, et le reste (TEMP, OS, Virtuette) sur d'autres disques durs. Après tout, de toute façon, Raid lui-même est un "disque", même s'il est plus fiable et plus rapide.
reconnu obsolète. Tout ce qui précède est assez éligible à l'existence sur RAID 5. Cependant, avant ce placement, il est nécessaire de découvrir - comment pouvez-vous créer un système d'exploitation de sauvegarde / restauration et combien de temps cela prendra-t-il, combien de temps prendra la Restauration du disque "décédé", existe-t-il) sous la main pour remplacer le "défunt" et ainsi de suite, c'est-à-dire qu'il sera nécessaire de connaître les réponses aux questions les plus élémentaires en cas de défaillance du système.

Je conseille toujours système opérateur Conservez sur un disque SATA séparé ou si vous le souhaitez, sur deux disques SATA associés au RAID 1. Dans tous les cas, disposez d'un système d'exploitation sur le raid, vous devez planifier vos actions s'il arrête soudainement à la carte mère - parfois transférant des disques raids Array à un autre carte mère (Chipset, contrôleur RAID) n'est pas possible en raison de l'incompatibilité des paramètres RAID par défaut.

Placement de la base, ombre et sauvegarde

Malgré tous les avantages du RAID, il n'est pas recommandé catégoriquement, par exemple, pour rendre la sauvegarde sur le même disque logique. Non seulement cela affecte la performance mal, mais peut également entraîner des problèmes avec le manque de espace libre (sur une grande base de données) - car en fonction des données sauvegarde de fichier. Cela peut être équivalent à la taille de la base de données, et encore plus. Faire une sauvegarde sur le même disque physique - où que rien ne soit allé, bien que l'option la plus optimale soit sauvegarde pour un disque dur séparé.

L'explication est très simple. La sauvegarde lit les données du fichier de base de données et écrivez dans le fichier de sauvegarde. Si physiquement tout cela se produit sur un disque (même RAID 0 ou RAID 1), la performance sera pire que si la lecture est fabriquée à partir d'un disque, et l'enregistrement est sur un autre. Une victoire encore plus d'une telle division - lorsque la sauvegarde est effectuée tout en travaillant avec des bases de données.

La même chose par rapport à l'ombre - il ne sert à rien de mettre l'ombre, par exemple, sur RAID 1, où la base est même là, même à différents disques logiques. S'il y a une ombre, le serveur écrit des pages de données dans le fichier de base et le fichier ombre. C'est-à-dire au lieu d'une opération d'enregistrement, deux sont produites. Lors de la division de la base de données et de l'ombre à l'aide de différents disques physiques, les performances d'enregistrement seront déterminées par le disque le plus lent.

Voyons maintenant quel type de types sont et ce qu'ils diffèrent.

Université de Californie à Berkeley préférera les niveaux de spécification RAID, qui ont été adoptés comme une norme de facto:

  • Raid 0. - Tableau de disque productivité accrue Avec alternance, aucune tolérance de faute;
  • - matrice de disque miroir;
  • RAID 2. réservé aux tableaux qui utilisent le code de chimition;
  • RAID 3 et 4 - tableaux de disques avec alternance et disque dédié;
  • - tableau de disques avec alternance et "disque de préparation non rectoré";
  • - matrice de disques avec alternance utilisant deux checksums calculés par deux méthodes indépendantes;
  • - RAID 0 Array, construit à partir de tableaux RAID 1;
  • - RAID 0 Array, construit à partir de tableaux RAID 5;
  • - RAID 0 Array, construit à partir de matrices RAID 6.

Le contrôleur de raid matérielle peut prendre en charge plusieurs matrices de RAID différents en même temps, le nombre total de disques durs dont ne dépasse pas le nombre de connecteurs pour eux. Dans le même temps, le contrôleur construit dans la carte mère, dans paramètres du BIOS Il n'a que deux états (activés ou désactivés), de sorte qu'un nouveau disque dur connecté à un connecteur de contrôleur inutilisé avec le mode RAID activé peut être ignoré par le système jusqu'à ce qu'il soit associé à un autre type JBOD de type RAID (rembourré), composé d'un disque.

Raid 0. (striping - "Alternance")

Mode lorsque vous utilisez ce qui est atteint performance maximum. Les données sont uniformément réparties sur les disques de la matrice, des disques d'une, qui peuvent être marqués pour plusieurs. Les opérations de lecture et d'écriture distribuées vous permettent d'augmenter de manière significative la vitesse de travail, car plusieurs disques sont simultanément en lecture / écriture de données. L'utilisateur est disponible entier le volume de disques, mais il réduit la fiabilité du stockage des données, car si l'un des disques échoue, le tableau est généralement détruit et les données sont presque impossibles à restaurer. Scope - Applications nécessitant des vitesses de décharge élevées avec disque, telles que le clip vidéo, l'édition vidéo. Il est recommandé d'utiliser avec des disques très fiables.

(miroir - "Miroir")

un tableau de deux disques qui sont des copies complètes de l'autre. Il ne doit pas être confondu avec RAID 1 + 0, RAID 0 + 1 et RAID 10 RAID 10, qui utilisent plus de deux disques et des mécanismes de mise en miroir plus complexes.

Fournit une vitesse d'enregistrement acceptable et une vitesse gagnante lors de la mise en valeur des demandes.

Il a une fiabilité élevée - cela fonctionne jusqu'à ce que au moins un disque fonctionne dans la matrice. La probabilité d'échec de deux disques est immédiatement égale au produit des probabilités de la défaillance de chaque disque, c'est-à-dire Significativement inférieur à la défaillance de la probabilité d'un disque séparé. En pratique, lorsque l'un des disques, l'un des disques doit prendre de toute urgence des mesures pour restaurer la redondance. Pour ce faire, avec n'importe quel niveau de raid (sauf zéro), il est recommandé d'utiliser les disques de réserve chaude.

Semblable à la distribution RAID10 des données sur les disques permettant l'utilisation d'un nombre impair de disques (nombre minimum - 3)

RAID 2, 3, 4

diverses variantes de stockage de données distribuées avec des disques dédiés sous des codes de parité et de différentes tailles de blocs. Actuellement, il n'est pratiquement pas utilisé en raison de la faible performance et de la nécessité d'allouer beaucoup de capacité de disque pour stocker des codes ECS et / ou des codes de parité.

Le principal inconvénient des niveaux de raid du 2e à 4th est l'incapacité de produire des opérations d'enregistrement parallèles, car un disque de contrôle distinct est utilisé pour stocker des informations sur la préparation. RAID 5 n'a pas cette pénurie. Les blocs de données et les checksums sont enregistrés cycliquement sur tous les disques de la matrice, aucune configuration de disque asymétrique. Les sommes de contrôle impliquent le résultat d'une opération XOR (à l'exclusion ou). Xor. Possède une fonctionnalité permettant de remplacer tout résultat de l'opérande et, en appliquant l'algorithme xor., obtenir le résultat de l'opérande manquant. Par example: un xor b \u003d c (Où uNE., b., c. - trois disques du tableau RAID), si uNE. refuse, nous pouvons l'obtenir, mettre à sa place c. Et passé xor. entre c. et b.: c xor b \u003d a. Ceci s'applique indépendamment du nombre d'opérandes: un xor b xor c xor d \u003d e. Si refusant c. ensuite e. se lève dans sa place et dépenses xor. En conséquence, nous obtenons c.: un xor b xor e xor d \u003d c. Cette méthode fournit essentiellement une tolérance de défaut de la version 5. Pour stocker le résultat, Xor ne nécessite que 1 disque, dont la taille est la taille de tout autre disque dans le raid.

Dignité

RAID5 s'est répandu, tout d'abord, en raison de son économie. Le volume du tableau de disques RAID5 est calculé par la formule (N-1) * HDDDDSIZE, où n est le nombre de disques de la matrice et le disque dur est la taille du plus petit disque. Par exemple, pour un tableau de quatre disques de 80 gigaoctets, le volume total sera (4 - 1) * 80 \u003d 240 gigaoctets. Des ressources supplémentaires sont dépensées pour les informations sur les informations RAID 5 et les boulons de performances, car des calculs supplémentaires et des opérations d'enregistrement sont nécessaires, mais lors de la lecture (par rapport à un disque dur séparé), il existe des gains, car des flux de données à partir de plusieurs disques peut être traité en parallèle.

désavantages

La performance de RAID 5 est sensiblement inférieure, en particulier sur les opérations d'écriture aléatoires, dans lesquelles la performance diminue de 10 à 25% de la performance RAID 0 (ou RAID 10), car elle nécessite davantage d'opérations avec des disques (chaque entrée d'opération, à l'exception de la soi-disant écrit à rayures complète, le serveur est remplacé par contrôleur de raid Quatre - deux opérations de lecture et deux opérations d'enregistrement). Les inconvénients de RAID 5 se manifestent à la sortie de l'un des disques - tout le volume pénètre dans le mode critique (dégradation), toutes les opérations d'écriture et de lecture sont accompagnées de manipulations supplémentaires, les performances tombent fortement. Dans le même temps, le niveau de fiabilité est réduit à la fiabilité de RAID-0 avec le nombre de disques correspondant (c'est-à-dire dans N fois inférieur à la fiabilité d'un seul disque). S'il ne parvient pas à restaurer complètement la matrice, une erreur de lecture de rausing se produira au moins une autre sur un autre disque, la matrice est détruite et les données à ce sujet ne sont pas soumises à la restauration des méthodes classiques. Il convient également de prendre en compte que le processus de reconstruction RAID (récupération des données RAID due à la redondance) après avoir sorti du disque, il provoque une charge de lecture intensive de disques pendant de nombreuses heures à de nombreuses heures, ce qui peut déclencher la sortie de l'une quelconque des des disques restants dans cette période la plus proche de la période de fonctionnement sécurisée de RAID, ainsi que d'identifier les lectures précédemment détectées dans des tableaux de données à froid (données auxquelles ils ne font pas appel lorsque travail normal Données massives, archives et peu efficaces), qui augmente le risque d'échec pendant la récupération de données.

Le nombre minimum de lecteurs utilisé est trois.

RAID 6 est similaire à RAID 5, mais a un degré de fiabilité plus élevé - la capacité de 2 disques est distinguée pour les checksums, 2 quantités d'algorithmes différents sont calculées. Nécessite un contrôleur RAID plus puissant. Fournit des performances après la défaillance simultanée de deux disques - Protection contre la défaillance multiple. Pour que l'organisation du tableau nécessite un minimum de 4 disques. Habituellement, l'utilisation de RAID-6 appelle environ 10-15% de baisse des performances du groupe de disques, par rapport à RAID 5, qui est provoquée par un volume de traitement important pour le contrôleur (la nécessité de calculer la seconde somme de contrôle, ainsi que de lire et écraser plus de blocs de disque lors de l'enregistrement de chaque bloc).

RAID 0 + 1

Sous RAID 0 + 1 peut être impliqué principalement deux options:

  • deux raid 0 sont combinés dans RAID 1;
  • trois disque ou plus sont combinés dans la matrice et chaque bloc de données est écrit à deux disques de ce tableau; Ainsi, avec cette approche, comme dans le RAID "pur" 1, un volume utile de la matrice est la moitié du volume total de tous les disques (s'il s'agit des disques du même conteneur).

RAID 10 (1 + 0)

RAID 10 est un tableau en miroir, des données dans lesquelles sont enregistrées de manière séquentielle dans plusieurs disques, comme àhorms 0. Cette architecture est une matrice de type RAID 0, dont les segments au lieu de disques individuels sont rADES RAID 1. En conséquence, la matrice de ce niveau doit contenir au moins 4 disques (et toujours au courant). RAID 10 combine la tolérance et la performance élevées.

L'affirmation selon laquelle RAID 10 est l'option la plus fiable pour stocker les données est tout à fait justifiée par le fait que le tableau sera désactivé après la défaillance de tous les lecteurs dans le même tableau. Avec un stockage a échoué, les risques d'échec de la seconde dans le même tableau sont de 1/3 * 100 \u003d 33%. RAID 0 + 1 échoue à deux lecteurs ont échoué dans différentes matrices. Le risque de restauration du lecteur dans la matrice à proximité est de 2/3 * 100 \u003d 66%, cependant, lorsque le lecteur de la matrice avec le lecteur a déjà échoué n'est plus utilisé, alors la chance que le lecteur suivant échoue à l'ensemble de la matrice. de 1/2 * 100 \u003d 100%

une matrice similaire à RAID5, cependant, en plus du stockage distribué des codes de parité, la distribution des zones de sauvegarde est utilisée - effectivement impliquée disque durCe qui peut être ajouté à la matrice RAID5 comme étant de rechange (ces tableaux sont appelés 5+ ou 5 + de rechange). Dans le Massif RAID 5, le disque de sauvegarde est inactif jusqu'à ce que l'un des principaux disques dursPendant la matrice RAID 5EE, ce disque est utilisé conjointement avec le reste du disque dur tout le temps, ce qui a un effet positif sur la productivité de la matrice. Par exemple, un tableau RAID5EE sur 5 HDD pourra effectuer 25% d'autres opérations d'entrée / sortie par seconde que la matrice RAID5 de 4 HDD de sauvegarde principale et d'une sauvegarde. Le nombre minimum de disques pour un tel tableau - 4.

combinant deux (ou plus, mais il est extrêmement rarement appliqué) RAID5 Tableaux en feu, c'est-à-dire Combinaison RAID5 et RAID0, corrigeant partiellement la principale inconvénient RAID5 - faible vitesse Entrées de données dues à une utilisation parallèle de plusieurs tableaux de ce type. La capacité totale de la matrice diminue au conteneur de deux disques, mais contrairement à RAID6, ce réseau transfère la défaillance d'un seul disque et le nombre minimum de disques requis pour créer le tableau RAID50 est 6. Avec le RAID10, cette est le plus recommandé niveau de raid Pour une utilisation dans des applications où des performances élevées sont nécessaires en combinaison avec une fiabilité acceptable.

combiner deux matrices RAID6 en totalité. La vitesse d'enregistrement augmente d'environ deux fois, par rapport à la vitesse d'enregistrement dans RAID6. Le nombre minimum de disques pour créer une telle matrice - 8. Les informations ne sont pas perdues dans la défaillance de deux disques de chaque MASTIF RAID 6

Petit, mais j'espère, une réponse raisonnable au sujet pourquoi RAID-5 - "Mustdie"? .
Ci-dessous, je produirai le calcul le plus simple de la fiabilité de RAID10 et RAID5 et la comparaison de leurs caractéristiques, et indiquer également certains des inconvénients fondamentaux de RAID1 et RAID10.

Petite introduction:

Nous allons considérer les cas les plus simples - RAID10 de 4 disques et RAID5 à partir de 3 disques. Tous les disques du système prendront la même chose.
Dans la version originale de l'article, au lieu de la RAID10, RAID0 + 1 a été mentionnée, mais cela contribue à une confusion supplémentaire. Le nom correct du cours RAID10 est une cendre crier.

Soit n la probabilité d'une seule défaillance de disque;

SO - RAID10:

Nombre de disques dans le tableau - 4;
Le prix de la matrice est égal au coût de quatre disques;
La capacité de la matrice sera égale à la double réservaison des lecteurs utilisés (un disque);
La vitesse de lecture maximale des données est égale à la double vitesse d'un disque;
La probabilité d'une panne de matrice pour le meilleur cas (lorsque le contrôleur implémente RAID1 + 0 en tant que matrice unique et peut combiner des lecteurs de manière aléatoire):
La probabilité d'échec d'un disque: P1 \u003d N (1-N) ^ 3;
La probabilité de la défaillance de deux disques: P2 \u003d (n ^ 2) * (1-N) ^ 2;
Probabilité de disques de seuil: P3 \u003d (n ^ 3) * (1-N);
La probabilité d'échec de quatre disques: p4 \u003d n ^ 4;
La probabilité de fonctionnement sans problème: p0 \u003d (1-N) ^ 4;
Probabilité complète: 4 * P1 + 6 * P2 + 4 * P3 + P4 + P0 \u003d 1;
La probabilité de la défaillance du massif: P (RAID10) \u003d 2 * P2 + 4 * P3 + P4;
* Au cours du premier mandat, au lieu de 6 coûts 2, comme dans deux cas seulement (lorsqu'il est endommagé de disques avec les mêmes données), un tableau ne peut pas être restauré.

Séparément, je note que la plupart des contrôleurs ne savent pas comment combiner des lecteurs, ce qui signifie que la défaillance de deux entraînements conduit à une perte de données, et la fiabilité de la matrice dans son ensemble est nettement inférieure.

Raid5:

Nombre de disques dans le tableau - 3;
Le prix de la matrice est égal au coût de trois disques;
La capacité de la matrice est égale au conteneur de deux disques;
La vitesse de lecture maximale est égale à la vitesse de lecture ponctuelle d'un disque;
La probabilité de la défaillance du massif est égale à la probabilité d'une défaillance de deux disques dedans:
La probabilité d'échec d'un disque: P1 \u003d N (1-N) ^ 2;
Probabilité de deux disques échoue: p2 \u003d (n ^ 2) * (1-N);
La probabilité de la défaillance de trois disques: p3 \u003d n ^ 3;
Probabilité de fonctionnement sans problème: p0 \u003d (1-N) ^ 3;
Probabilité complète: 3 * P1 + 3 * P2 + P3 + P0 \u003d 1;
La probabilité de la défaillance de la matrice: P (RAID5) \u003d 3 * P2 + P3;

Conclusions:

Commençons bien sûr, avec la probabilité de refus, nous prenons la probabilité de refuser de RAID5 de la probabilité de refus RAID10:
P (RAID10) -P (RAID5) \u003d 2N ^ 2 * (N - 1) ^ 2 - N ^ 3 + N ^ 4 + 3 * N ^ 2 * (N-1) -4 * N ^ 3 * (N -une)
Considérant que N-\u003e 0 P (RAID10) -P (RAID5)<0, т.е. надёжность RAID5 НИЖЕ надёжности RAID10. Разница совсем небольшая, но в пользу RAID10;
Si nous supposons que les lecteurs ne peuvent pas être combinés arbitrairement, RAID5 est plus fiable.
Rapport de taxe: RAID5 est de 1,333 fois moins cher.
Rapport de vitesse: RAID5 est de 1,333 fois plus lentement que RAID10, mais en même temps, une fois et demie plus rapidement qu'un seul lecteur.
ATTENTION Question Quelle option est la meilleure? Celui qui est plus cher et moins fiable, bien qu'un peu plus rapide. Ou celui est moins cher et plus fiable?
Personnellement, mon opinion est inclinée vers une raid plus fiable et bon marché5 n'est pas inclinée nulle part.

Une addition:
Dans les commentaires, la piste respectée indiquait que, dans certains cas, RAID-5 peut être beaucoup plus lente que RAID1. À mon humble avis, ce sont des cas très et très spécifiques, mais cela devrait être conservé.

Toutes sortes de commentaires:

Le temps de récupération:
Récupération RAID10 Idéalement égale à la copie de l'ensemble du volume de données.
Pour RAID5, la situation est plus compliquée, car elle nécessite une récupération de données sur les codes de correction.
Lorsque la mise en œuvre du programme, le temps de récupération RAID5 sera déterminé par la vitesse du processeur.
Lorsque la mise en œuvre matérielle, le temps de récupération RAID5 est égal au temps de récupération RAID10.
Considérant que les transformateurs modernes sans problèmes s'adaptent au flux de données de l'ordre de 100 Mo / s (vitesse maximale approximative de la lecture de lecteurs modernes), il peut être affirmé que, avec une bonne mise en œuvre, le programme RAID5 ne sera pas beaucoup plus lent que le RAID10.
Sur la fiabilité pendant la récupération. Pour le cas à l'examen, cela n'est pas nécessaire de parler du tout - vous devez faire des sauvegardes! Dans le cas général, il convient de prendre en compte qu'au moment de la récupération, le nombre de disques de RAID10 est supérieur à celui de RAID5, ce qui signifie que la probabilité de refus est plus élevée et qu'il est impossible de dire qu'au moment de la récupération RAID10 est définitivement plus fiable.

Une addition:
Si RAID-5EEE est utilisé, alors dans le cas du premier refus, il est "comprimé" dans RAID-5, qui peut prendre très longtemps. Cependant, il convient de garder à l'esprit que le résultat est un raid-5 à part entière, qui résiste aux défaillances solitaires, c'est-à-dire En fait (avec certaines restrictions), le système peut survivre à deux échecs d'affilée.

CPU Chargement:
La mise en œuvre du logiciel RAID5 charge le processeur. Pour les processeurs modernes, il n'est généralement pas critique, mais pour des lecteurs rapides, vous devez garder à l'esprit que le lecteur plus rapide, plus la charge du processeur est forte.
Et encore une fois fiabilité - le dernier clou dans la couverture du cercueil:
Pour une raison quelconque, lorsque vous parlez de RAID10 et en particulier de RAID1, tout le monde est négligé par un point très important.
Oui, dans le cas d'un basculement physique, il assure la récupération de données de la copie, mais ce qui se passera si les disques renvoient des données différentes? Après tout, dans RAID1, il n'y a aucun moyen de savoir quelles données sont correctes! Vous pouvez essayer de déterminer la précision des données sur leur contenu, mais ce n'est pas une tâche triviale qui ne peut être effectuée que manuellement et pas toujours.
C'est pour cette raison que je ne considère pas RAID1 du tout - il ne fournit pas de mécanisme de fiabilité de données. Et RAID10 dans le cas général aussi.
Et RAID5 (6?) Dans le cas général, il fournit également: si l'un des trois disques renvoie des données incorrectes, elle sera sans ambiguïté qu'elles ne sont pas fiables.
Comment se passe-t-il (inen -enclicité des données)?
Problèmes de surchauffe des disques. Problèmes de nutrition. Problèmes de disques de firmware. Options de masse! Jusqu'à l'épuisement électronique complet de l'électronique à la suite de la sortie de leur système d'alimentation en informatique. Dans ce cas, les disques peuvent être essayés de faire revivre, mettre le tableau avec des appareils similaires, mais il n'y aura aucune garantie que toutes les données sur les disques sont fiables.
Et une autre carnation là-bas. Dans le sujet à partir de laquelle tout a tout démarré peint à propos de BER (tarifs d'erreur bits). Sans entrer dans les détails, il suffit de remarquer que, d'une part, pour des disques durs, il est toujours possible de parler davantage de MTBF (temps moyen entre les échecs), d'autre part, si nous parlons de BER, alors à propos de Uber (taux d'erreur de bits non correctable), et troisièmement. Ce sera un argument en faveur de RAID5 - si les lecteurs renvoient des données déformées (qui ont traversé toutes les procédures de correction), comment savoir quel lecteur de croire?

Une addition:
Wiki dit que l'inverse - les informations de récupération ne sont pas utilisées avant l'échec de l'un des disques. L'expérience de la vie, cependant, dit autrement, mais c'était il y a longtemps et je ne me souviens même pas de quel contrôleur (peut-être que c'était un niveau de raid non standard). Donc, il s'agit certainement de la précision des données ne peut être indiquée que pour ZFS / RAID-6.

Verdict:

Le verdict est simple - si des problèmes inutiles ne sont pas nécessaires, vous n'avez pas besoin d'aimer ni de raid1 ni de RAID0 + 1 - vous devez regarder dans la direction de RAID5, 5E, 6, ZFS
Le verdict en relation avec le RAID5 "pur" n'est pas sans ambiguïté :)

Udpate:
J'ai corrigé le calcul de la probabilité - la sortie n'a pas changé. RAID0 + 1 corrigé "RAID10". Je note que dans l'affaire décrite, "RAID0 + 1" est identique "RAID1 + 0". Mais le nom correct bien sûr "raid10".

Udpate2:
C'est tellement facile et ne pas compliquer la signification de l'article a changé sinon le contraire, puis définitivement spectaculaire.

Le problème de l'amélioration de la fiabilité du stockage de l'information est toujours à l'ordre du jour. Cela est particulièrement vrai pour les grandes matrices de données, les bases de données sur lesquelles le travail des systèmes intégrés dans la vaste gamme de sphères de l'industrie dépend. Ceci est particulièrement important pour haute performance Les serveurs.

Comme on le sait, la performance des transformateurs modernes augmente de manière cohérente, pour laquelle nous n'avons clairement pas le temps dans son développement.
disques durs. La présence d'un disque, que ce soit SCSI ou, encore pire que l'IDE, déjà ne sera pas capable de décider Les tâches sont actuellement pertinentes pour notre temps. Vous avez besoin de beaucoup de disques qui se complètent, de remplacer en cas d'un d'entre eux, de garder des sauvegardes, de travailler efficacement et productif.

Cependant, la présence de plusieurs disques durs n'est pas suffisant, ils ont besoin d'eux combiner dans le systèmeCe qui fonctionnera bien et ne permettra pas de perdre des données dans des échecs liés au disque.

Sur la création d'un tel système, vous devez faire attention à l'avance, car le célèbre proverbe dit - jusqu'à ce que frit coq ne se pliera pas - N'ont pas assez. Vous pouvez perdre vos données irrémédiable.

Ce système peut devenir RAID - Technologie de stockage virtuelle d'informations combinant plusieurs disques dans un élément logique. RAID s'appelle un tableau excès de masse disques indépendants. Utilisez généralement pour améliorer les performances et la fiabilité.

Ce qui est nécessaire pour créer un raid? Au moins la présence de deux disques durs. Selon le niveau de la matrice varie, le nombre de dispositifs de stockage utilisés.

Quels sont les matrices raid

Il y a des matrices RAID basiques et combinées. Institut à Berkeley, Californie a proposé de diviser le raid sur niveaux de spécification:

  • De base:
    • RAID 1 ;
    • RAID 2 ;
    • RAID 3 ;
    • RAID 4 ;
    • RAID 5 ;
    • RAID 6 .
  • Combiné:
    • RAID 10 ;
    • RAID 01 ;
    • RAID 50 ;
    • RAID 05 ;
    • RAID 60 ;
    • RAID 06 .

Considérons les plus couramment utilisés.

Raid 0.

Raid 0. conçu Augmenter la vitesse et l'enregistrement. Cela n'augmente pas la fiabilité du stockage, dans le cadre de cela n'est pas redondant. Son appel est toujours saisonner (striping - "Alternance"). D'habitude utilisé De 2 à 4 disques.

Les données sont divisées en blocs qui sont enregistrés à leur tour des disques. La vitesse Enregistrement / lecture augmente dans le temps, multiple du nombre de disques. De désavantages Vous pouvez noter la probabilité accrue de la perte de données avec un tel système. Bases de données sur de tels disques stockés n'a pas de sens, car tout grave Échec conduira à l'irrégularité complète du raid, car il n'y a pas de moyen de récupération.

Raid 1.

RAID 1 fournit miroir Stockage de données au niveau matériel. Également appelé un tableau Miroir., Quels moyens « miroir» . C'est-à-dire que les disques dans ce cas sont dupliqués. Pouvez utiliser Avec le nombre de dispositifs de stockage de 2 à 4.

La vitesse L'enregistrement / la lecture n'est pratiquement pas modifié, ce qui peut être attribué à avantages. Un tableau fonctionne si au moins un disque RAID est en marche, mais le volume du système est égal au volume d'un disque. En pratique, outlet du bâtiment L'un des disques durs que vous devrez prendre des mesures pour le remplacer dès que possible.

RAID 2.

RAID 2 - Utilise le soi-disant code chimitant. Les données sont divisées par des disques durs de manière similaire à RAID 0, sur les disques restants sont stockés codes de correction d'erreur, avec un échec pour lequel vous pouvez régénérer informations. Cette méthode permet à la volée trouveet alors réparer Échecs dans le système.

Rapidité lecture / écriture Dans ce cas, par rapport à l'utilisation d'un disque se lève. Le moins est un grand nombre de disques dans lesquels il est rationnel de s'appliquer afin qu'il n'y ait pas de redondance de données, généralement 7 ans et plus.

RAID 3 - Dans le tableau, les données sont divisées en tout disque sauf une dans laquelle les octets de parité sont stockés. K. durable K. Échecs du système. Si un disques sortir de la construction. Il est facile de "augmenter" il utilise facilement ces contrôles de parité.

Comparé de raid 2 pas d'occasion Correction d'erreur à la volée. Ce tableau est différent haute performance et la capacité d'utiliser à partir de 3 disques et plus encore.

La chose principale moins Un tel système peut être considéré comme une charge accrue sur le disque, le stockage des octets de parité et la faible fiabilité de ce disque.

RAID 4.

En général, RAID 4 est similaire à RAID 3 avec ce différenceque ces parité sont stockées en blocs et non dans des octets, ce qui a permis d'augmenter le taux de transfert de petit volume.

Moins Le tableau spécifié est la vitesse d'enregistrement, car l'enregistrement de l'enregistrement est généré par un seul disque comme RAID 3.

C'est une bonne solution pour ces serveurs où les fichiers sont souvent lus qu'écrit.

Raid 5.

RAID de 2 à 4 ont des inconvénients liés à l'impossibilité de parallementer des opérations d'enregistrement. Raid 5. Élimine Cet inconvénient. Les blocs de parité sont écrits en même temps sur tous les dispositifs de disque, pas d'asynchronie Dans la distribution des données, et donc la parité est distribuée.

Nombre les disques durs utilisés de 3. La matrice est très courante en raison de sa universalité et ÉconomieLe plus grand nombre de disques sera utilisé, l'espace d'épargne sera orthographié. La vitessehaute en parallèle les données, mais performance Réduit de comparaison avec RAID 10, en raison d'un grand nombre d'opérations. Si un disque échoue, la fiabilité est réduite au niveau RAID 0. Il faut beaucoup de temps pour restaurer.

RAID 6.

RAID 6 La technologie est similaire à RAID 5, mais se lève fiabilité En augmentant le nombre de disques de parité.

Cependant, des disques sont déjà nécessaires au moins 5 et un processeur plus puissant pour traiter l'augmentation du nombre d'opérations, et le nombre de disques doit être égal à un nombre simple de 5,7,11 et ainsi de suite.

RAID 10, 50, 60

Suivant Go combinaisons Spécifié précédemment les raids. Par exemple, RAID 10 est raid 0 + RAID 1.

Ils héritent de moi. avantages Les tableaux de leurs composants en termes de fiabilité, de performances et de nombre de disques, et en même temps économie.

Créer un raid de tableau sur le PC à la maison

Les avantages de la création d'un raid de la maison de la maison ne sont pas évidents, en raison du fait qu'il noteconomie, la perte de données n'est pas si critique par rapport aux serveurs et informations Vous pouvez stocker dans des sauvegardes, effectuer périodiquement des sauvegardes.

À ces fins dont vous avez besoin contrôleur de raidAvec son propre BIOS et vos paramètres. Dans les cartes mères modernes, le contrôleur RAID peut être intégré Dans le pont sud du chipset. Mais même dans une telle dette en se connectant à un connecteur PCI ou PCI-E, vous pouvez connecter un autre contrôleur. Les exemples peuvent être des périphériques de Silicon Image et Jmicron.

Chaque contrôleur peut avoir son propre utilitaire pour configurer.

Envisagez de créer un RAID à l'aide de l'option Intel Matrix Storage Manager ROM.

Transfert toutes les données de vos disques, sinon dans le processus de création de la matrice, ils vont effacé.

Aller à BIOS.Installer. Votre carte mère et allumez le mode de fonctionnement RAID Pour votre disque dur SATA.

Pour exécuter les ordinateurs de redémarrage de l'utilitaire, cliquez sur ctrl + I. Pendant la procédure PUBLIER.. Dans la fenêtre du programme, vous verrez une liste de disques disponibles. Cliquez sur Créer massive.Suivant, sélectionnez niveau de matrice nécessaire.

À l'avenir, suivez l'interface intuitive, entrez taille de la matrice et confirmer Sa création.

Les matrices RAID ont été conçues pour augmenter la fiabilité du stockage des données, une augmentation de la vitesse de travail avec et pour assurer la possibilité de combiner plusieurs disques en une grande. Différents types de raid résolvent différentes tâches, nous examinerons ici les configurations RAID quelque peu les plus courantes de tableaux de la même taille.



Raid 0.

  • Raid 0. (Bande). Le mode lorsque vous utilisez la performance maximale est atteint. Les données sont réparties de manière uniforme sur les disques de la matrice, sont combinées en une, qui peut être marquée pour plusieurs. Les opérations de lecture et d'écriture distribuées vous permettent d'augmenter considérablement la vitesse de travail, car quelque peu lisez / écrivez simultanément votre partie de données. L'utilisateur est disponible entier entier, mais il réduit la fiabilité du stockage de données, car si l'un des disques échoue, le tableau est généralement détruit et les données sont presque impossibles à restaurer. Scope - Applications nécessitant des vitesses de décharge élevées avec disque, telles que le clip vidéo, l'édition vidéo. Il est recommandé d'utiliser avec des disques très fiables.

    Raid 1.
  • Raid 1. (Miroir). Plusieurs disques (généralement 2) fonctionnent de manière synchrone pour enregistrer, c'est-à-dire complètement en double. L'amélioration des performances ne se produit que lors de la lecture. Le moyen le plus fiable de protéger les informations de la défaillance de l'un des disques. En raison du coût élevé, il est généralement utilisé lors de la conservation de données très importantes. Le coût élevé est due au fait que seule la moitié de la capacité totale est disponible pour l'utilisateur.

    RAID 10.
  • RAID 10.est aussi parfois appelé Raid 1 + 0 - Combinaison des deux premières options. (Array RAID0 de RAID1 Tableaux). Il a toutes les avantages de la vitesse du RAID0 et l'avantage de la fiabilité RAID1, tout en maintenant l'inconvénient - le coût élevé du tableau de disques, car la capacité effective de la matrice est égale à la moitié des disques utilisés. Pour créer un tel tableau, un minimum de 4 disques est requis. (Dans le même temps, leur nombre devrait être même).
  • RAID 0 + 1 - Tableau RAID1 à partir de matrices RAID0. En fait, il n'est pas appliqué en raison du manque d'avantages par rapport à RAID10 et moins de tolérance aux défaillances.

    Raid 1e.
  • Raid 1e. - une valeur similaire sur la version RAID10 de la distribution de données sur des disques, ce qui permet d'utiliser le nombre impair (quantité minimale - 3)
  • RAID 2, 3, 4 - diverses variantes de stockage de données distribuées avec des disques isolés sous des codes de parité et de différentes tailles de blocs. Actuellement, il n'est pratiquement pas utilisé en raison de la faible performance et de la nécessité d'allouer beaucoup de capacité de disque pour stocker des codes ECS et / ou des codes de parité.


    Raid 5.
  • Raid 5. - Un tableau qui utilise également un stockage de données distribué est similaire à RAID 0 (et combinant dans un grand logique) + stockage distribué de codes de parité pour récupérer des données lors des défaillances. En ce qui concerne les configurations précédentes, la taille du bloc de rayures est encore plus accrue. Peut-être à la fois la lecture et l'enregistrement simultanés. Le plus de cette option est que la capacité de la matrice conviviale diminue à la capacité d'un seul disque, bien que la fiabilité du stockage de données soit inférieure à celle du RAID 1. En fait, il s'agit d'un compromis entre RAID0 et RAID1, fournissant un vitesse suffisamment élevée de travail avec une bonne fiabilité de stockage.. Si un disque refuse de la matrice, les données peuvent être restaurées sans perte en mode automatique. Le nombre minimum de disques pour un tel tableau - 3.
    Les implémentations "logiciels" de RAID5 intégrées dans les ponts en plastique Materna Sud ne sont pas distingués par une vitesse d'enregistrement élevée, jusqu'à présent de toutes les applications à venir.


    Raid 5ee.
  • Raid 5ee. - une matrice similaire à RAID5, cependant, en plus du stockage distribué des codes de parité, la distribution des zones de sauvegarde est utilisée - en fait, elle est utilisée, qui peut être ajoutée à la matrice RAID5 comme étant de rechange (ces tableaux sont appelés. 5+ ou 5 + de rechange). Dans le tableau RAID 5, le disque de sauvegarde est inactif jusqu'à l'un des principaux, tandis que dans la matrice RAID 5ee, ce disque est utilisé conjointement avec le reste du disque dur tout le temps, ce qui a un effet positif sur la productivité du déployer. Par exemple, un tableau RAID5EE sur 5 HDD pourra effectuer 25% d'autres opérations d'entrée / sortie par seconde que la matrice RAID5 de 4 HDD de sauvegarde principale et d'une sauvegarde. Le nombre minimum de disques pour un tel tableau - 4.


    RAID 6.
  • RAID 6. - RAID analogique5 avec un grand niveau de redondance - les informations ne sont pas perdues dans la défaillance de deux disques, respectivement, la capacité globale de la matrice diminue au conteneur de deux disques. Le nombre minimum de disques nécessaires pour créer un tableau d'un tel niveau - 4. La vitesse des travaux dans l'affaire général est approximativement similaire à RAID5. Il est recommandé aux applications où la plus grande fiabilité est importante.


    Raid 50.
  • Raid 50. - Combinant deux (ou plus, mais il est extrêmement appliqué rarement) RAID5 Tableaux en feu, c'est-à-dire La combinaison RAID5 et RAID0, corrigeant partiellement l'inconvénient principal de la vitesse d'enregistrement de données RAID5 - basse de données en raison de l'utilisation parallèle de plusieurs tableaux de ce type. La capacité totale de la matrice diminue au conteneur de deux, mais contrairement à RAID6, ce réseau transfère la défaillance d'un seul disque et le nombre minimum requis de disques à créer le tableau RAID50 est 6. Avec le RAID10, c'est-à-dire Le niveau RAID le plus recommandé destiné à être utilisé dans les annexes où une performance élevée est requise en combinaison avec une fiabilité acceptable.


    RAID 60.
  • RAID 60. - combinant deux matrices RAID6 en totalité. La vitesse d'enregistrement augmente d'environ deux fois, par rapport à la vitesse d'enregistrement dans RAID6. Le nombre minimum de disques pour créer une telle matrice - 8. Les informations ne sont pas perdues dans la défaillance de deux disques de chaque massif RAID 6.
  • RAID MATRIX. - Technologie mise en œuvre par Intel dans ses ponts méridionaux, commençant par ICH6R, qui vous permet d'organiser plusieurs matrices RAID0 et RAID1 sur deux disques, tout en créant des sections à la fois avec une vitesse de travail accrue et avec une fiabilité accrue du stockage de données.
  • Jbod. (De l'anglais "juste un tas de disques") - une combinaison cohérente de plusieurs physiques dans une seule logique, qui n'affecte pas la performance (la fiabilité goutte de la même manière à RAID0), et peut avoir des dimensions différentes. Actuellement, il n'est pratiquement pas appliqué.
  • Avez-vous aimé l'article? Partager avec des amis: