Protection des trous d'écriture pour différents RAID

153 0 0 0

Bonjour les membres de la communauté,

Aujourd'hui, je vais vous présenter le trou d'écriture, tout d'abord je vous montre le phénomène du trou d'écriture, puis je vous parlerai du trou d'écriture dans différents RAID, enfin je parlerai de la façon de l'éviter.

Phénomène "trou d'écriture"

L'effet "trou d'écriture" peut se produire si une panne de courant se produit pendant l'écriture . Cela se produit dans tous les types de baies, y compris, mais sans s'y limiter, RAID5, RAID6 et RAID1. Dans ce cas, il est impossible de déterminer lesquels des blocs de données ou des blocs de parité ont été écrits sur les disques et lesquels ne l'ont pas été. Dans cette situation, les données de parité ne correspondent pas au reste des données de la bande. De plus, vous ne pouvez pas déterminer avec certitude quelles données sont incorrectes - la parité ou l'un des blocs de données.

Trou d'écriture dans RAID5

Le «trou d'écriture» est largement reconnu pour affecter un RAID5, et la plupart des discussions sur l'effet de «trou d'écriture» se réfèrent au RAID5. Il est important de savoir que d'autres types de tableaux sont également affectés.

Si les données utilisateur ne sont pas complètement écrites , un système de fichiers corrige généralement les erreurs lors du redémarrage en relisant le journal des transactions. Si un système de fichiers ne prend pas en charge la journalisation, les erreurs seront toujours corrigées lors du prochain contrôle de cohérence.

Si la parité (en RAID5) ou la copie miroir (en RAID1) n'est pas écrite correctement, elle ne sera pas remarquée jusqu'à ce que l'un des disques membres de la baie tombe en panne. Si le disque tombe en panne, vous devez le remplacer et démarrer la reconstruction RAID. Dans ce cas, l'un des blocs serait récupéré de manière incorrecte. Si une récupération RAID est nécessaire en raison d'une défaillance du contrôleur, un décalage de parité n'a pas d'importance.

Un décalage de parité ou de données en miroir peut être récupéré sans intervention de l'utilisateur, si à un moment ultérieur une bande complète est écrite sur un RAID5, ou si le même bloc de données est réécrit dans un RAID1. Dans un tel cas, l'ancienne parité (incorrecte) n'est pas utilisée, mais de nouvelles données de parité (correctes) seraient calculées puis écrites. De plus, de nouvelles données de parité seraient écrites si vous forcez la resynchronisation de la baie (cette option est disponible pour de nombreux contrôleurs RAID et NAS ).

Généralement, une panne de courant pendant l'écriture est rare, une alimentation sans coupure est bon marché et le bloc de bande n'est pas si gros. Par conséquent, la probabilité de rencontrer un «trou d'écriture» dans la pratique est faible.

Trou d'écriture dans RAID1

Comme pour un RAID5, l'effet de trou d'écriture peut se produire dans un RAID1. Même si un disque est désigné comme "premier" ou "faisant autorité", et que les opérations d'écriture sont organisées de manière à ce que les données soient toujours écrites en premier sur ce disque, en veillant à ce qu'elles contiennent la dernière copie des données, deux difficultés subsistent:

un disque dur peut mettre en cache les données lui-même. La mise en cache peut violer l'arrangement fait par le contrôleur.

si le disque désigné comme premier / faisant autorité tombe en panne, des trous d'écriture peuvent déjà être présents sur le deuxième disque et il serait impossible de les trouver sans les premières données de disque.

Trou d'écriture dans RAID6

Théoriquement, un phénomène de trou RAID peut également se produire dans un RAID6 composé du grand nombre de disques membres. Le trou d'écriture RAID dans un RAID5 / RAID1 se produit lorsque l'un des disques membres ne correspond pas aux autres et par la nature du RAID5 / RAID1 simple redondant, il est impossible de dire lequel des disques est mauvais. Un trou d'écriture dans un RAID 6 se produit lorsque deux disques ne correspondent pas aux autres simultanément. Une telle situation peut se produire, par exemple, si l'alimentation est coupée au milieu de l'écriture pleine bande.

Trou d'écriture dans les types RAID complexes

Les types RAID complexes héritent d'une vulnérabilité de trou d'écriture des types RAID sur lesquels ils sont basés.

RAID 10 hérite du trou d'écriture d'un RAID 1. Si l'une des copies en miroir a été écrite mais pas la seconde, il est impossible de savoir laquelle est correcte.

Dans un RAID 50 , qui peut être représenté comme un ensemble de matrices RAID 5, un trou d'écriture peut se produire dans chacune de ces matrices.

De la même manière, RAID 100 est vulnérable et RAID 60 également, mais avec une probabilité moindre.

Comment éviter le "trou d'écriture"?

Afin d'éviter complètement le trou d'écriture, vous devez fournir une atomicité d'écriture . Nous appelons les opérations qui ne peuvent pas être interrompues au milieu du processus "atomiques". L'opération "atomique" est soit complètement terminée, soit pas du tout effectuée. Si le fonctionnement atomique est interrompu pour des raisons externes (par exemple une panne de courant), il est garanti qu'un système reste dans son état d'origine ou final.

Dans un système composé de plusieurs appareils indépendants, l'atomicité naturelle n'existe pas. La variance des caractéristiques des disques durs mécaniques et des particularités du bus de données ne permet pas de fournir la synchronisation requise. Dans ces cas, les transactions sont généralement utilisées. La transaction est un groupe d'opérations pour lesquelles l'atomicité est fournie artificiellement. Cependant, des frais généraux coûteux sont nécessaires pour fournir l'atomicité des transactions. Par conséquent, les transactions ne sont pas utilisées dans les RAID.

Une option de plus pour éviter un identifiant de trou d'écriture pour utiliser un ZFS qui est un hybride d'un système de fichiers et d'un RAID. ZFS utilise la «copie sur écriture» pour fournir une atomicité en écriture. Cependant, cette technologie nécessite un type spécial de RAID (RAID-Z) qui ne peut pas être réduit à une combinaison de types de RAID courants (RAID 0, RAID 1 ou RAID 5).

Comment réduire l'effet négatif d'un "trou d'écriture"?

En pratique, le risque de perdre des données en raison du trou d'écriture peut être réduit jusqu'au niveau acceptable même pour les baies habituelles, telles que RAID 1 et RAID 5.

Fournissez une alimentation sans coupure. Vous pouvez simplement utiliser une alimentation sans coupure (UPS) pour l'ensemble du RAID. La deuxième option consiste à utiliser la batterie de secours (BBU) qui est directement connectée à un contrôleur RAID. Cette batterie permet de sauvegarder le contenu du cache d'écriture d'un contrôleur en cas de panne de courant. Toutes les opérations d'écriture, qui sont dans le cache et ne sont pas terminées en raison d'une panne de courant, seront effectuées après la remise sous tension. BBU protège uniquement le cache du contrôleur, pas les caches d'écriture du disque dur.

Synchronisez régulièrement votre baie. La synchronisation est un processus lorsque les valeurs de parité (pour un RAID 5) ou d'autres données fournissant une redondance (pour RAID 6, RAID 7 ou RAID DP) sont recalculées. Dans un RAID1, les données d'un disque sont copiées sur l'autre pendant la synchronisation. La synchronisation détruit tous les trous d'écriture accumulés pendant l'opération. Une fois la synchronisation terminée, les données redondantes correspondront exactement aux données utilisateur. Dans le même temps, la synchronisation détecte les secteurs défectueux dans les zones rarement utilisées d'un tableau, car pendant la synchronisation, tous les secteurs du tableau sont lus et écrits. Les contrôleurs matériels modernes permettent généralement de synchroniser une baie par programme. Les RAID créés à l'aide de Windows ne peuvent pas être synchronisés par planification.

Si des disques SSD sont utilisés en RAID, vous pouvez généralement désactiver le cache d'écriture et toujours obtenir suffisamment de performances pour votre tâche particulière. La désactivation du cache d'écriture n'évite pas totalement un trou d'écriture, mais diminue la probabilité de perdre des données et la quantité de données qui peuvent être perdues en raison d'une panne de courant.

Protection "trou d'écriture" pour Huawei

Lorsqu'une défaillance du système (telle qu'une panne de courant) provoque une écriture incomplète (pas des pannes d'écriture), certaines bandes, et même certaines données de parité des bandes, entrent dans l'état d'incertitude. L'écriture de données dans ces bandes rencontrera des erreurs. Ce phénomène est appelé trou d'écriture.

Le stockage des données d'échec d'écriture dans la zone de protection contre les pannes de courant et la réécriture des données le cas échéant peuvent résoudre le problème de trou d'écriture. Les principaux scénarios de protection sont les suivants:

·          Pour RAID 5, 6 et 50, les données des trous d'écriture sont stockées dans la zone de protection contre les pannes de courant et la protection des trous d'écriture n'a pas besoin d'être activée manuellement.

§   Lorsque le dispositif de protection contre les coupures de courant est disponible, les données des trous d'écriture sont récupérées après un redémarrage.

§   Lorsque le dispositif de protection contre les coupures de courant n'est pas disponible, les données des trous d'écriture enregistrées dans la zone de protection contre les coupures de courant sont perdues après un redémarrage.

·          Lorsqu'un disque RAID 6 se déconnecte, la protection contre les trous d'écriture est prise en charge.

·          Lorsque RAID 50 est partiellement dégradé, la protection contre les trous d'écriture est prise en charge et les données seront restaurées par intervalle. Lorsque RAID 50 est entièrement dégradé, la protection contre les trous d'écriture n'est pas prise en charge.

·          RAID 0, 1 et 10 ne prennent pas en charge la protection des trous d'écriture.

C'est tout pour aujourd'hui. J'espère que cela vous sera utile à tous!



  • x
  • Standard:

Commentaire

envoyer
Connectez-vous pour répondre. Se connecter | Enregistrer

Remarque Remarque : Afin de protéger vos droits et intérêts légitimes, ceux de la communauté et des tiers, ne divulguez aucun contenu qui pourrait présenter des risques juridiques pour toutes les parties. Le contenu interdit comprend, sans toutefois s'y limiter, le contenu politiquement sensible, le contenu lié à la pornographie, aux jeux d'argent, à l'abus et au trafic de drogues, le contenu qui peut divulguer ou enfreindre la propriété intellectuelle d'autrui, y compris les secrets professionnels, les marques commerciales, les droits d'auteur et les brevets, ainsi que la vie privée personnelle. Ne partagez pas votre nom d'utilisateur ou votre mot de passe avec d'autres personnes. Toutes les opérations effectuées à partir de votre compte seront considérées comme vos propres actions, et toutes les conséquences en découlant vous seront imputées. Pour plus de détails, voir « Politique de confidentialité ».
Si le bouton de la pièce-jointe n'est pas disponible, mettez à jour Adobe Flash Player à la dernière version.
Connectez-vous pour participer à la communication et au partage

Connectez-vous pour participer à la communication et au partage

S'identifier