Introducción a la tecnología RAID de almacenamiento

122 0 1 0

1 Introducción a RAID

RAID es una matriz redundante de discos independientes (RAID).En 1987, la teoría RAID fue propuesta por la Universidad de California, Berkeley.Como un sistema de almacenamiento de alto rendimiento, ha sido ampliamente utilizado.El nivel de RAID se ha desarrollado desde el concepto de RAID hasta la actualidad, y hay varios niveles de desarrollo.Hay niveles estándar claros de 0, 1, 2, 3, 4 y 5, y otros son 6, 7, 10, 30, 50, etc.RAID reduce los costos, aumenta la eficiencia de la ejecución y proporciona estabilidad para el funcionamiento del sistema.

2 Nivel RAID

2.1RAID 0

Almacenamiento a rayas (Stripe).

RAID 0 divide los datos por bits o bytes y lee y escribe datos en varios discos.Por lo tanto, RAID 0 tiene una alta velocidad de transferencia de datos, pero no tiene redundancia de datos.Por lo tanto, RAID 0 no es una estructura RAID real.RAID 0 solo mejora el rendimiento y no garantiza la fiabilidad de los datos.Si se produce un error en un disco, todos los datos se ven afectados.Por lo tanto, RAID 0 se utiliza a menudo en imágenes y vídeos y no se puede utilizar en escenarios que requieren una alta seguridad de los datos.

010219bu5s1qs1161sf8fd.png?import1.PNG


2.2 RAID 1

Almacenamiento de espejo (espejo).RAID 2

La redundancia de datos se implementa a través de la creación de reflejo de datos de disco.Se realiza una copia de seguridad de los datos en un par de discos independientes.Cuando los datos sin procesar están ocupados, los datos se pueden leer directamente desde la copia reflejada.Por lo tanto, RAID 1 puede mejorar el rendimiento de lectura.RAID 1 es el costo unitario más alto en arreglos de discos, pero proporciona alta seguridad y disponibilidad de datos.Cuando se produce un error en un disco, el sistema cambia automáticamente al disco reflejado para leer y escribir datos sin volver a ensamblar datos no válidos.Por lo tanto, RAID 1 se utiliza a menudo en aplicaciones que tienen requisitos estrictos para la tolerancia a errores, como finanzas y finanzas.

010224xnplnpq6nqclnogc.png?import2.PNG

2.3 RAID 2

El código de hemming (Código de Hamming) verifica el almacenamiento de bandas.

Los bloques de datos se distribuyen en diferentes discos duros.La unidad de bloque es bit o byte, que se denomina código Hemming para proporcionar comprobación de errores y recuperación.Esta tecnología de codificación requiere varios discos para almacenar información de comprobación y recuperación para que la información de redundancia de RAID 2 sea costosa (varios discos de paridad).La implementación de la tecnología es más compleja, por lo que rara vez se utiliza en el entorno empresarial.

010228nkk1wsls2s250aw3.png?import3.PNG

2.4 RAID 3

Almacenamiento de franjas de comprobación de paridad (XOR), disco de paridad compartido y unidad de almacenamiento de franjas de datos: Byte.

Al igual que RAID 2, los bloques de datos se distribuyen en diferentes discos duros.La diferencia es que RAID 3 utiliza una comprobación de paridad simple y utiliza un solo disco para almacenar la información de comprobación de paridad.Si se produce un error en un disco, el disco de paridad y otros discos de datos pueden generar datos de nuevo.Si se produce un error en el disco de paridad, el uso de datos no se ve afectado.RAID 3 proporciona una buena velocidad de transmisión para una gran cantidad de datos continuos.Sin embargo, para los datos aleatorios, el disco de paridad se convierte en el cuello de botella de las operaciones de escritura.

010231abnrri3a3201rx7y.png?import4.PNG

2.5RAID 4

Comprobación de paridad (XOR) almacenamiento de franjas, disco de paridad compartido y unidad de almacenamiento de franjas de datos: Bloquear.

El RAID 4 también bloquea los bloques de datos y los distribuye en diferentes discos, pero la unidad de bloque sin bloqueo o registro.Raid 4 utiliza un disco como disco de paridad.Cada operación de escritura requiere acceso al disco de paridad.En este caso, el disco de paridad se convierte en el cuello de botella de la operación de escritura.Por lo tanto, el RAID 4 rara vez se utiliza en el entorno comercial.

010237dx8bbcwzb9lhi3zc.png?import5.PNG

2.6 RAID 5

Comprobación de paridad (XOR) almacenamiento de franjas.Los datos de paridad se almacenan en modo distribuido.La unidad de almacenamiento de la tira de datos es bloque.

RAID 5 no especifica un disco de paridad.En su lugar, accede a los datos y a la información de comprobación de paridad en todos los discos.En RAID 5, el puntero de lectura/escritura se puede utilizar para operar la matriz de almacenamiento al mismo tiempo, lo que proporciona un mayor tráfico de datos.RAID 5 es más adecuado para bloques de datos pequeños y datos de lectura y escritura aleatorios.La principal diferencia entre RAID 3 y RAID 5 es que todos los arreglos de discos están implicados en la transmisión de datos RAID 3.Para RAID 5, la mayoría de las operaciones de transferencia de datos se realizan en un solo disco y se pueden realizar operaciones paralelas.En RAID 5, se produce una pérdida de escritura.Es decir, cada operación de escritura genera cuatro operaciones de lectura y escritura reales, dos de las cuales leen datos antiguos e información de paridad, y escriben nuevos datos e información de paridad dos veces.Por ejemplo, si necesita restaurar A0 en la siguiente figura, debe agregar paridad A0, C0, D0 y 0 para calcular y obtener A0 para restaurar datos.Por lo tanto, cuando dos discos son defectuosos, los datos de todo el grupo RAID deforman no ser válidos.

010255yvykqlpzgehspsse.png?import6.PNG

2.7RAID 6

Comprobación de paridad (XOR) almacenamiento de franjas: Compruebe los datos de dos almacenamientos distribuidos.La unidad de almacenamiento de la tira de datos es bloque.

En comparación con RAID 5, RAID 6 añade un segundo bloque de información de comprobación de paridad independiente.Dos sistemas de paridad independientes utilizan algoritmos diferentes.La fiabilidad de los datos es alta.Incluso si dos discos fallan al mismo tiempo, el uso de datos no se ve afectado.Sin embargo, RAID 6 necesita asignar más espacio en disco que la información de comprobación de paridad.En comparación con RAID 5, RAID 6 tiene una pérdida de escritura mayor.Por lo tanto, el rendimiento de escritura es deficiente.El bajo rendimiento y los complejos métodos de implementación hacen que RAID 6 sea muy pocas aplicaciones prácticas.

010300ndiy4eerp6ip2frj.png?import7.PNG

2.8RAID 7

Este es un nuevo estándar RAID.Cuenta con un sistema operativo inteligente en tiempo real y una herramienta de software para la gestión del almacenamiento.Se puede ejecutar independientemente de los hosts y no ocupa los recursos de CPU del host.RAID 7 puede considerarse como un ordenador de almacenamiento (Storage Computer), que obviamente es diferente de otros estándares RAID.

El nivel RAID 7 es un modo RAID con el mayor rendimiento teórico hasta el momento, porque ha sido muy diferente del modo anterior.En la figura anterior, un disco duro es una columna de una matriz de discos.En el RAID 7, varios discos duros forman una columna, que tienen sus propios canales.De esta manera, puede dividir la imagen en varios discos duros y conectarlos al canal principal, es sólo más subdividido que el nivel anterior.De este modo, cuando se leen o escriben los datos de un área, los datos se pueden ubicar rápidamente.En el RAID 7, un solo disco duro se divide en varios discos duros independientes, tiene sus propios canales de lectura y escritura.

010305s2298luvvl822g25.png?import8.PNG

3 Comparación RAID

3.1Comparación de Niveles de RAID Comunes.

010702v2sk4opjkmmjmlwz.png?import14.PNG

3.2 Comparación entre RAID 10 y RAID 01

RAID 10 se refleja primero y luego se raya.

RAID 01: El rayado se realiza primero y, a continuación, se realiza la creación de reflejos.

Por ejemplo, si se utilizan cuatro discos como ejemplo, RAID 10 divide los discos en dos grupos de réplicas y, a continuación, elimina los dos grupos de RAID 1.En RAID 01, se utilizan dos discos como RAID 0 y los otros dos discos se utilizan como la creación de reflejo de RAID 0.A continuación se utilizan cuatro discos como ejemplo para describir las diferencias de seguridad.

3.2.1 RAID 10

010309siw44fgh4470hyrr.png?import9.PNG

En este caso, se supone que cuando el Disk0 está dañado, todo el RAID falla sólo cuando un disco del Disk1 es defectuoso, y la tasa de fallas es 1/3.

3.2.2RAID 01

010314or92f4979pqmo72n.png?import10.PNG

En este caso, si el Disk0 está dañado, la franja de la izquierda no se puede leer.En los tres discos restantes, si alguno de los discos Disk2 y Disk3 está dañado, todo el grupo RAID deja de ser válido.Por lo tanto, la tasa de fallas es 2/3.

Por lo tanto, RAID 10 es más seguro que RAID 01.

Según la ubicación lógica del almacenamiento de datos, RAID 01 y RAID 10 son los mismos.Además, el número de E/S generadas por cada operación de lectura y escritura es el mismo.Por lo tanto, el rendimiento de lectura y escritura es el mismo.Cuando un disco es defectuoso, por ejemplo, el Disk0 asumido anteriormente está dañado, el rendimiento de lectura de los dos casos es diferente y el rendimiento de lectura del RAID 10 es mejor que el del RAID 01.

3.3 Comparación entre RAID 10 y RAID 5

Para facilitar la comparación, utilice cuatro discos del mismo tipo para la comparación.Seleccione 3D+1P para RAID 5 y 2D+2D para RAID 10, como se muestra en la siguiente figura:

010318qexlp9j5bfj0vzz1.png?import11.PNG

3.3.1 Comparación de seguridad

Cuando el disco 1 está dañado, RAID 10 no surten efecto solo cuando el disco reflejado correspondiente al disco 1 está dañado.Para RAID 5, si algún disco de los tres discos restantes está defectuoso, el grupo RAID deja de ser válido.

En términos de seguridad, RAID 10 es mayor que RAID 5.

3.3.2 Comparación de la utilización del espacio

La tasa de utilización de RAID 10 es del 50%, y la de RAID 5 es del 75%.Cuanto mayor sea el número de discos duros, mayor será el uso de espacio de RAID 5.

En términos de utilización del espacio, RAID 5 es mayor que RAID 10.

3.3.3 Comparación del rendimiento de lectura y escritura

Diferencias de rendimiento en las operaciones de lectura

El número de discos que pueden leer datos válidos en RAID 10 es 4.El número de discos que pueden leer datos válidos en RAID 5 es 4 (la información de paridad se distribuye en todos los discos).Por lo tanto, el rendimiento de lectura de los dos discos debe ser el mismo.

Diferencia de rendimiento en escritura continua

010322bdimiqmqierpmmra.png?import12.PNG

Como se muestra en la figura anterior, RAID 5 de los cuatro discos se puede verificar en la memoria y se escriben tres registros de datos (+1 comprobación de paridad) en la memoria.RAID 10 puede escribir dos registros de datos y +2 imágenes al mismo tiempo.Según el principio de caché, la memoria caché de escritura puede almacenar en caché las operaciones de escritura.Después de acumular los datos de escritura en un período determinado, la memoria caché de escritura se escribe en el disco.Además, el proceso de escritura de datos en la matriz de discos se producirá tarde o temprano.Por lo tanto, cuando RAID 5 y RAID 10 escriben datos continuamente, la velocidad de escritura de datos de la memoria caché en el disco es ligeramente diferente.Si la escritura continua no es continua, la diferencia no es demasiado grande mientras no se alcance el límite de escritura en disco

Diferencia de rendimiento de escritura discreta

010326yhhah599j92bsjss.png?import13.PNG

Como se muestra en la figura anterior: Por ejemplo, si desea cambiar un número de 2 a 4, la operación de E/S se realiza cuatro veces en RAID 5.Lea 2 y marque 6, y luego calcule una nueva suma de comprobación en la memoria caché y escriba el nuevo dígito 4 y la nueva paridad 8.Para RAID 10, solo se requieren dos E/S para RAID 10 y cuatro E/S para RAID 5.

Comparación de IOPS de disco

Supongamos que el iops del servicio es 10000, la relación de aciertos de caché de lectura es del 30%, la iops de lectura es del 60%, la iops es del 40% y el número de discos es 120.Calcule las iops de cada disco en el caso de RAID 5 y RAID 10.

RAID 5:

iops de un solo disco=(10000*(1-0.3)*0.6 + 4 * (10000*0.4))/120

 =(4200 + 16000)/120

     =168

En la información anterior, 10000*(1-0.3)*0.6 indica la iops de lectura.La relación es 0,6.Se elimina el acierto de caché.En realidad, sólo 4200 iops están disponibles.4 * (10000 *0.4) indica que iops está escrito.Para cada escritura, en realidad se generan cuatro E/S en RAID 5.Por lo tanto, el valor de iops es 16000.Para asegurarse de que las dos operaciones de lectura pueden ser golpeadas durante la operación de escritura de RAID 5, el cálculo preciso es el siguiente:

iops de un solo disco=(10000*(1-0.3)*0.6 + 2 * (10000*0.4)*(1-0.3) + 2 * (10000*0.4))/120

=( 4200 + 5600 + 8000)/120

=148

Las iops calculadas de un solo disco es 148, que básicamente alcanza el límite de disco.

RAID 10:

iops de un solo disco=(10000*(1-0.3)*0.6 + 2 * (10000*0.4))/120

 =(4200 + 8000)/120

=102

Como se muestra en la figura anterior, RAID 10 solo tiene dos E/S para una operación de escritura.Por lo tanto, en la misma presión, las iops de cada disco son 102, que es mucho menor que la iops máxima del disco.

4 Resumen

Por lo tanto, se requiere una utilización de espacio alto.El requisito de alta seguridad no es alto.El sistema de almacenamiento de archivos de gran tamaño utiliza RAID 5.Por el contrario, los requisitos de seguridad son altos y los costos no se calculan.El sistema que utiliza una pequeña cantidad de datos para escribir datos utiliza con frecuencia RAID 10.

  • x
  • convención:

Responder

Responder
Debe iniciar sesión para responder la publicación Inicio de sesión | Registrarse

Aviso Aviso: Para garantizar sus legítimos derechos e intereses, la comunidad y los terceros no publicarán contenido que pueda generar riesgos legales a las partes, por ejemplo, pornografía, contenido político, contenido sobre juego, consumo y tráfico de drogas, así como contenido que viole los derechos de propiedad intelectual de terceros, por ejemplo, secretos comerciales, marcas, derechos de autor, patentes y privacidad personal. No comparta su cuenta ni su contraseña con terceros. Todas las operaciones realizadas usando su cuenta se considerarán como sus acciones y todas las consecuencias que estas acciones generen serán responsabilidad suya. Para obtener información detallada, consulte la “ Política de privacidad.”
Si el botón para adjuntar no está disponible, actualice Adobe Flash Player con la versión más reciente
¡Ingresa y disfruta de todos los beneficios para los miembros!

¡Ingresa y disfruta de todos los beneficios para los miembros!

Aterrizaje