¿Qué son las matrices RAID y por qué son necesarias? Preguntas frecuentes sobre la implementación práctica de RAID

Y así sucesivamente, así sucesivamente, así sucesivamente. Entonces, hoy hablaremos de RAID matrices basadas en ellos.

Como sabes, estos mismos discos duros también tienen un cierto margen de seguridad a partir del cual fallan, así como características que afectan el rendimiento.

Como resultado, probablemente muchos de ustedes, de una forma u otra, alguna vez hayan oído hablar de ciertas matrices raid que se pueden crear a partir de discos duros comunes para acelerar el funcionamiento de estos mismos discos y de la computadora en su conjunto o para garantizar una mayor confiabilidad del almacenamiento de datos.

Seguramente también sabes (y si no lo sabes, no importa) que estos arreglos tienen números de secuencia diferentes ( 0, 1, 2, 3, 4 etc.), y también realizan funciones bastante diferentes. En realidad, este fenómeno tiene lugar en la naturaleza y, como ya habrás adivinado, son precisamente estos mismos RAID matrices es lo que quiero contarles en este artículo. Más precisamente ya os lo digo ;)

Vamos.

¿Qué es RAID y por qué es necesario?

RAID- se trata de una matriz de discos (es decir, un complejo o, si se prefiere, un paquete) de varios dispositivos: discos duros. Como dije anteriormente, esta matriz sirve para aumentar la confiabilidad del almacenamiento de datos y/o para aumentar la velocidad de lectura/escritura de información (o ambas).

En realidad, lo que hace exactamente este grupo de discos, es decir, acelerar el trabajo o aumentar la seguridad de los datos, depende de usted, o más precisamente, de la elección de la configuración actual de las incursiones. Los diferentes tipos de estas configuraciones están marcados con números diferentes: 1, 2, 3, 4 y, en consecuencia, realizar diferentes funciones.

Simplemente, por ejemplo, en el caso de la construcción 0 -ésima versión (descripción de variaciones 0, 1, 2, 3 etc. - lea a continuación) Obtendrá un aumento notable en la productividad. Y, en general, el disco duro hoy en día es solo un canal estrecho en el rendimiento del sistema.

¿Por qué sucedió esto en general?

Los discos duros solo crecen en volumen debido a la velocidad de rotación de sus cabezales (con la excepción de modelos raros como rapaz"ov) ha estado congelado durante bastante tiempo alrededor de 7200 , el caché tampoco está creciendo exactamente, la arquitectura sigue siendo casi la misma.

En general, en términos de rendimiento, los discos están estancados (la situación solo se puede salvar mediante el desarrollo), pero juegan un papel importante en el funcionamiento del sistema y, en algunos lugares, en las aplicaciones completas.

En el caso de construir una sola unidad (en el sentido de número 1 ) raid, perderás un poco de rendimiento, pero recibirás una garantía tangible de la seguridad de tus datos, porque estarán completamente duplicados y, de hecho, incluso si falla un disco, todo estará ubicado íntegramente en el segundo. sin ninguna pérdida.

En general, repito, las incursiones serán de utilidad para todos. Incluso diría que son obligatorios :)

¿Quieres saber y poder hacer más tú mismo?

Te ofrecemos capacitación en las siguientes áreas: informática, programas, administración, servidores, redes, construcción de sitios web, SEO y más. ¡Descubre los detalles ahora!

¿Qué es RAID en el sentido físico?

Físicamente RAID-matriz representa desde dos a norte-número de discos duros conectados que admiten la capacidad de crear RAID(o al controlador correspondiente, que es menos común porque son costosos para el usuario promedio (los controladores generalmente se usan en servidores debido a su mayor confiabilidad y rendimiento)), es decir A simple vista, nada cambia dentro de la unidad del sistema; simplemente no hay conexiones innecesarias ni conexiones de discos entre sí ni con ninguna otra cosa.

En general, todo en el hardware es casi igual que siempre, y solo cambia el enfoque del software, que, de hecho, establece, al seleccionar el tipo de raid, exactamente cómo deben funcionar los discos conectados.

Programáticamente, en el sistema, después de crear una incursión, tampoco aparecen peculiaridades especiales. De hecho, toda la diferencia entre trabajar con un raid radica únicamente en el pequeño entorno que realmente organiza el raid (ver más abajo) y en el uso del conductor. De lo contrario, TODO es absolutamente igual: en "Mi PC" lo mismo CD y otros discos, todas las mismas carpetas, archivos... En general y en software, a simple vista, son completamente idénticos.

Instalar la matriz no es difícil: simplemente tomamos una placa base que admita la tecnología. RAID, tomamos dos completamente idénticos, - ¡Esto es importante!, - tanto según las características (tamaño, caché, interfaz, etc.) como según el fabricante y modelo del disco y conéctelos a esta placa base. A continuación, simplemente encienda la computadora, vaya a BIOS y establecer el parámetro Configuración SATA: RAID.

Después de esto, durante el proceso de inicio de la computadora (generalmente antes de iniciar ventanas) aparece un panel que muestra información sobre el disco en el raid y fuera de él, donde realmente debe hacer clic CTR-I para configurar la incursión (agregarle discos, eliminarlos, etc., etc.). En realidad, eso es todo. Luego hay otras alegrías de la vida, es decir, nuevamente, todo es como siempre.

Nota importante para recordar

Al crear o eliminar una incursión ( 1 Esto no parece aplicarse a la tercera incursión, pero no es un hecho) toda la información se elimina inevitablemente de los discos y, por lo tanto, claramente no vale la pena simplemente realizar un experimento, crear y eliminar varias configuraciones. Por lo tanto, antes de crear una incursión, primero guarde toda la información necesaria (si la tiene) y luego experimente.

En cuanto a las configuraciones... Como ya dije, RAID Hay varios tipos de matrices (al menos desde la base principal, esto es RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6). Para empezar, hablaré de dos de los más comprensibles y populares entre los usuarios habituales:

  • RAID 0- matriz de discos para aumentar la velocidad de grabación.
  • RAID 1- matriz de discos reflejados.

Y al final del artículo repasaré rápidamente los demás.

RAID 0: ¿qué es y para qué sirve?

Entonces.. RAID 0(también conocido como striping): utiliza de dos a cuatro (más, con menos frecuencia) discos duros que procesan información de forma conjunta, lo que aumenta la productividad. Para que quede claro, llevar bolsas para una persona lleva más tiempo y es más difícil que para cuatro personas (aunque las bolsas siguen siendo las mismas en sus propiedades físicas, sólo cambian los poderes que interactúan con ellas). Mediante programación, la información sobre una incursión de este tipo se divide en bloques de datos y se escribe en ambos o varios discos por turno.

Un bloque de datos en un disco, otro bloque de datos en otro, y así sucesivamente. Esto aumenta significativamente el rendimiento (la cantidad de discos determina el aumento del rendimiento, es decir, 4 discos funcionarán más rápido que dos), pero la seguridad de los datos en toda la matriz se ve afectada. Si alguno de los componentes incluidos en dicho RAID discos duros (es decir, discos duros), toda la información se pierde casi por completo e irremediablemente.

¿Por qué? El hecho es que cada archivo consta de un cierto número de bytes... cada uno de los cuales contiene información. pero en RAID 0 En una matriz, los bytes de un archivo se pueden ubicar en varios discos. En consecuencia, si uno de los discos "muere", se perderá una cantidad arbitraria de bytes del archivo y será simplemente imposible recuperarlo. Pero hay más de un archivo.

En general, cuando se utiliza una matriz raid de este tipo, se recomienda almacenar permanentemente información valiosa en medios externos. El raid realmente proporciona una velocidad notable; te lo digo por experiencia propia, porque tengo esa felicidad instalada en casa durante años.

RAID 1: ¿qué es y para qué se utiliza?

¿Qué pasa con RAID 1?(Reflejo - "espejo"). En realidad, comenzaré con el inconveniente. A diferencia de RAID 0 resulta que parece que está "perdiendo" la capacidad del segundo disco duro (se utiliza para escribir en él una copia completa (byte por byte) del primer disco duro, mientras que en RAID 0 este espacio está completamente disponible).

La ventaja, como ya entendiste, es que tiene una alta confiabilidad, es decir, todo funciona (y todos los datos existen en la naturaleza y no desaparecen cuando falla uno de los dispositivos) siempre que al menos un disco esté funcionando, es decir. Incluso si destruyes aproximadamente un disco, no perderás ni un solo byte de información, porque el segundo es una copia pura del primero y lo reemplaza cuando falla. Este tipo de raid se utiliza a menudo en servidores debido a la increíble viabilidad de los datos, lo cual es importante.

Con este enfoque, se sacrifica el rendimiento y, según mi opinión personal, es incluso menor que cuando se utiliza un disco sin raids. Sin embargo, para algunos, la confiabilidad es mucho más importante que el rendimiento.

RAID 2, 3, 4, 5, 6: ¿qué son y para qué se utilizan?

La descripción de estas matrices está aquí tanto como sea posible, es decir. puramente como referencia, e incluso entonces en forma comprimida (de hecho, solo se describe el segundo). ¿Por qué es así? Al menos por la baja popularidad de estos arrays entre el usuario medio (y, en general, entre cualquier otro) y, como consecuencia, mi poca experiencia en su uso.

RAID 2 reservado para matrices que usan algún tipo de código Hamming (no estaba interesado en qué era, así que no te lo diré). El principio de funcionamiento es aproximadamente el siguiente: los datos se registran en los dispositivos correspondientes de la misma forma que en RAID 0, es decir, se dividen en pequeños bloques en todos los discos que intervienen en el almacenamiento de información.

Los discos restantes (especialmente asignados para este propósito) almacenan códigos de corrección de errores, que pueden usarse para restaurar información si falla algún disco duro. Entonces, en matrices de este tipo, los discos se dividen en dos grupos: para datos y para códigos de corrección de errores.

Por ejemplo, tiene dos discos que proporcionan espacio para el sistema y los archivos, y dos más estarán completamente dedicados a corregir datos en caso de que los dos primeros discos fallen. En esencia, esto es algo así como una incursión cero, solo que con la capacidad de, al menos de alguna manera, guardar información en caso de falla de uno de los discos duros. Rara vez es caro: cuatro discos en lugar de dos con un aumento de seguridad muy controvertido.

RAID 3, 4, 5, 6... Acerca de ellos, por extraño que pueda parecer en las páginas de este sitio, intente leer sobre ellos en Wikipedia. El hecho es que en mi vida me he encontrado con estas matrices muy raramente (excepto que la quinta llegó a mis manos con más frecuencia que otras) y no puedo describir con palabras accesibles los principios de su funcionamiento, y no quiero reimprimir en absoluto artículo del recurso propuesto anteriormente, al menos debido a la presencia de formulaciones exasperantes en estos, que incluso yo apenas puedo entender.

¿Qué RAID debería elegir?

Si juegas, copias música y películas con frecuencia, instalas programas que consumen muchos recursos, definitivamente te resultará útil. RAID 0. Pero tenga cuidado al elegir los discos duros (en este caso su calidad es especialmente importante) o asegúrese de realizar copias de seguridad en medios externos.

Si trabaja con información valiosa que perder equivale a la muerte, entonces definitivamente necesita RAID 1- Es extremadamente difícil perder información con él.

lo repito Muy es deseable que los discos instalados en RAID la matriz era idéntica en género. Tamaño, marca, serie, tamaño de caché: preferiblemente todo debería ser igual.

Epílogo

Así son las cosas.

Por cierto, escribí cómo montar este milagro en el artículo: " Cómo crear una matriz RAID usando métodos estándar", y sobre un par de parámetros en el material " RAID 0 de dos SSD: pruebas prácticas con Read Ahead y Read Cache". Utilice la búsqueda.

Espero sinceramente que este artículo te sea de utilidad y que definitivamente te hagas una incursión de un tipo u otro. Créame, vale la pena.

Si tiene preguntas sobre cómo crearlos y configurarlos, en general, puede comunicarse conmigo en los comentarios; intentaré ayudarlo (si hay instrucciones para su placa base en línea). También estaré encantado de recibir adiciones, deseos, pensamientos y todo eso.

Saludos a todos, queridos lectores del sitio del blog. Creo que muchos de ustedes se han encontrado al menos una vez en Internet con una expresión tan interesante: "matriz RAID". Qué significa y por qué el usuario medio podría necesitarlo, de eso hablaremos hoy. Es un hecho bien conocido que es el componente más lento de una PC y es inferior al procesador y.

Para compensar la lentitud "innata", que está completamente fuera de lugar (estamos hablando principalmente de servidores y PC de alto rendimiento), se les ocurrió el uso de la llamada matriz de discos RAID, una especie de "paquete" de varios discos duros idénticos funcionando en paralelo. Esta solución le permite aumentar significativamente la velocidad de operación junto con la confiabilidad.

En primer lugar, una matriz RAID le permite proporcionar una alta tolerancia a fallas para los discos duros (HDD) de su computadora al combinar varios discos duros en un elemento lógico. En consecuencia, para implementar esta tecnología necesitará al menos dos discos duros.. Además, RAID es simplemente conveniente, porque toda la información que antes era necesario copiar a fuentes de respaldo (discos duros externos) ahora se puede dejar "como está", porque el riesgo de pérdida total es mínimo y tiende a cero, pero No siempre, sobre esto un poco más abajo.

RAID se traduce más o menos así: un conjunto protegido de discos económicos. El nombre proviene de la época en que los discos duros grandes eran muy caros y resultaba más barato ensamblar una matriz común de discos más pequeños. La esencia no ha cambiado desde entonces, en general, como el nombre, solo que ahora es posible crear un almacenamiento gigante a partir de varios discos duros grandes, o hacerlo de modo que un disco duplique a otro. Además podrás combinar ambas funciones, obteniendo así las ventajas de una y otra.

Todas estas matrices tienen sus propios números, lo más probable es que hayas oído hablar de ellas: raid 0, 1...10, es decir, matrices de diferentes niveles.

Tipos de incursión

Incursión de velocidad 0

Raid 0 no tiene nada que ver con la confiabilidad, porque solo aumenta la velocidad. Necesita al menos 2 discos duros y, en este caso, los datos se “cortarán” y se escribirán en ambos discos simultáneamente. Es decir, tendrá acceso a la capacidad total de estos discos y, en teoría, esto significa que obtendrá velocidades de lectura/escritura 2 veces mayores.

Pero imaginemos que uno de estos discos se estropea; en este caso, la pérdida de TODOS sus datos es inevitable. En otras palabras, aún tendrás que realizar copias de seguridad periódicas para poder restaurar la información más adelante. Normalmente se utilizan aquí de 2 a 4 discos.

Raid 1 o “espejo”

La confiabilidad no se ve comprometida aquí. Obtiene el espacio en disco y el rendimiento de un solo disco duro, pero tiene el doble de confiabilidad. Un disco se rompe: la información se guardará en el otro.

La matriz de nivel RAID 1 no afecta la velocidad, sino el volumen: aquí tiene a su disposición solo la mitad del espacio total en disco, del cual, por cierto, en RAID 1 puede haber 2, 4, etc., eso es decir, un número par. En general, la característica principal de una incursión de primer nivel es la fiabilidad.

Incursión 10

Combina todo lo mejor de los tipos anteriores. Propongo ver cómo funciona esto usando el ejemplo de cuatro discos duros. Entonces, la información se escribe en paralelo en dos discos y estos datos se duplican en otros dos discos.

El resultado es un aumento del doble de la velocidad de acceso, pero también de la capacidad de sólo dos de los cuatro discos de la matriz. Pero si fallan dos discos, no se producirá ninguna pérdida de datos.

Incursión 5

Este tipo de matriz es muy similar a RAID 1 en su propósito, solo que ahora necesitará al menos 3 discos, uno de ellos almacenará la información necesaria para la recuperación. Por ejemplo, si dicha matriz contiene 6 discos duros, solo 5 de ellos se utilizarán para registrar información.

Debido a que los datos se escriben en varios discos duros a la vez, la velocidad de lectura es alta, lo que es perfecto para almacenar allí una gran cantidad de datos. Pero, sin un costoso controlador raid, la velocidad no será muy alta. Dios no permita que uno de los discos se rompa; restaurar la información llevará mucho tiempo.

Incursión 6

Esta matriz puede sobrevivir a la falla de dos discos duros a la vez. Esto significa que para crear una matriz de este tipo necesitará al menos cuatro discos, a pesar de que la velocidad de escritura será incluso menor que la de RAID 5.

Tenga en cuenta que sin un controlador de raid potente, es poco probable que se pueda ensamblar una matriz de este tipo (6). Si sólo tiene 4 discos duros, es mejor construir RAID 1.

Cómo crear y configurar una matriz RAID

Controlador RAID

Se puede crear una matriz raid conectando varios discos duros a la placa base de una computadora que admita esta tecnología. Esto significa que dicha placa base tiene un controlador integrado, que normalmente está integrado en el archivo . Pero el controlador también puede ser externo, que se conecta mediante un conector PCI o PCI-E. Cada controlador suele tener su propio software de configuración.

La incursión se puede organizar tanto a nivel de hardware como de software; esta última opción es la más común entre las PC domésticas.

A los usuarios no les gusta el controlador integrado en la placa base debido a su escasa fiabilidad. Además, si la placa base está dañada, la recuperación de datos será muy problemática. A nivel de software, desempeña el papel de controlador; si sucede algo, puede transferir fácilmente su matriz raid a otra PC.

Hardware

  1. ¿Cómo hacer una matriz RAID? Para hacer esto necesitas:
  2. Compra al menos dos discos duros idénticos. Es mejor que sean idénticos no solo en características, sino también del mismo fabricante y modelo, y conectados a la alfombra. tablero usando uno.
  3. Transfiera todos los datos de sus discos duros a otros medios; de lo contrario, serán destruidos durante el proceso de creación de la incursión.
  4. A continuación, deberá habilitar la compatibilidad con RAID en el BIOS, pero no puedo decirle cómo hacerlo en el caso de su computadora, debido a que el BIOS de cada persona es diferente. Por lo general, este parámetro se llama así: "Configuración SATA o Configurar SATA como RAID".
  5. Luego reinicie su PC y debería aparecer una tabla con configuraciones de incursión más detalladas. Es posible que deba presionar la combinación de teclas "ctrl+i" durante el procedimiento POST para que aparezca esta tabla. Para aquellos que tienen un controlador externo, lo más probable es que necesiten presionar “F2”. En la propia tabla, haga clic en "Crear masivo" y seleccione el nivel de matriz requerido.

Después de crear una matriz raid en el BIOS, debe ir a "administración de discos" en OS –10 y formatear el área no asignada; esta es nuestra matriz.

Programa

Para crear un RAID de software, no es necesario habilitar ni deshabilitar nada en el BIOS. De hecho, ni siquiera necesitas soporte raid en tu placa base. Como se mencionó anteriormente, la tecnología se implementa utilizando el procesador central de la PC y el propio Windows. Sí, ni siquiera necesitas instalar ningún software de terceros. Es cierto que de esta manera sólo se puede crear un RAID del primer tipo, que es un "espejo".

Haga clic derecho en "mi computadora" - "administrar" - "administración de discos". Luego haga clic en cualquiera de los discos duros destinados a la incursión (disco1 o disco2) y seleccione "Crear volumen espejo". En la siguiente ventana, seleccione un disco que será un espejo de otro disco duro, luego asigne una letra y formatee la partición final.

En esta utilidad, los volúmenes reflejados se resaltan en un color (rojo) y se designan con una letra. En este caso, los archivos se copian en ambos volúmenes, una vez en un volumen y el mismo archivo se copia en el segundo volumen. Cabe destacar que en la ventana "mi computadora" nuestra matriz se mostrará como una sección, la segunda sección está oculta para no ser una monstruosidad, porque allí se encuentran los mismos archivos duplicados.

Si falla un disco duro, aparecerá el error "Redundancia fallida", mientras que todo lo que hay en la segunda partición permanecerá intacto.

resumamos

RAID 5 es necesario para una gama limitada de tareas, cuando se ensamblan una cantidad mucho mayor de HDD (que 4 discos) en matrices enormes. Para la mayoría de los usuarios, raid 1 es la mejor opción. Por ejemplo, si hay cuatro discos con una capacidad de 3 terabytes cada uno, en RAID 1 en este caso están disponibles 6 terabytes de capacidad. RAID 5 en este caso proporcionará más espacio, sin embargo, la velocidad de acceso disminuirá significativamente. RAID 6 proporcionará los mismos 6 terabytes, pero una velocidad de acceso aún menor y también requerirá un controlador costoso.

Agreguemos más discos RAID y verás como todo cambia. Por ejemplo, tomemos ocho discos de la misma capacidad (3 terabytes). En RAID 1, solo estarán disponibles 12 terabytes de espacio para grabar, ¡la mitad del volumen estará cerrada! RAID 5 en este ejemplo proporcionará 21 terabytes de espacio en disco y será posible obtener datos de cualquier disco duro dañado. RAID 6 dará 18 terabytes y los datos se pueden obtener de dos discos cualesquiera.

En general, RAID no es algo barato, pero personalmente me gustaría tener a mi disposición un RAID de nivel 1 de discos de 3 terabytes. Existen métodos aún más sofisticados, como RAID 6 0, o “raid from raid arrays”, pero esto tiene sentido con una gran cantidad de HDD, al menos 8, 16 o 30; debe estar de acuerdo, esto va mucho más allá del alcance de El uso normal “doméstico” y la demanda de uso se da principalmente en servidores.

Algo como esto, deje comentarios, agregue el sitio a favoritos (para mayor comodidad), habrá muchas más cosas interesantes y útiles, ¡y hasta pronto en las páginas del blog!

¡Hola a todos los lectores del sitio! Amigos, hace tiempo que quería hablarles sobre cómo crear una matriz RAID (matriz redundante de discos independientes) en una computadora. A pesar de la aparente complejidad del tema, en realidad todo es muy simple y estoy seguro de que muchos lectores adoptarán y disfrutarán de inmediato esta tecnología tan útil relacionada con la seguridad de sus datos.

como crear Matriz RAID y por qué es necesaria

No es ningún secreto que nuestra información en una computadora prácticamente no está asegurada y se encuentra en un simple disco duro, que tiende a fallar en el momento más inoportuno. Desde hace tiempo se reconoce que el disco duro es el lugar más débil y poco confiable de nuestra unidad de sistema, ya que contiene partes mecánicas. Aquellos usuarios que alguna vez han perdido datos importantes (incluido yo mismo) debido a la falla del “tornillo”, después de estar un tiempo de duelo, se preguntan cómo evitar problemas similares en el futuro y lo primero que les viene a la mente es esto. creando una matriz RAID.

¡El objetivo de tener una matriz redundante de discos independientes es guardar sus archivos en su disco duro en caso de una falla total de ese disco! Cómo hacer esto, te preguntarás, es muy simple, solo necesitas dos discos duros (tal vez incluso de diferente volumen).

En el artículo de hoy, utilizando el sistema operativo Windows 8.1, crearemos el disco duro más simple y popular a partir de dos discos duros vacíos. Matriz RAID 1, también se le llama “Reflejo”. El significado de “espejo” es que la información de ambos discos está duplicada (escrita en paralelo) y los dos discos duros son copias exactas entre sí.

Si copió un archivo en el primer disco duro, aparecerá exactamente el mismo archivo en el segundo y, como ya entendió, si falla un disco duro, todos sus datos permanecerán intactos en segundo disco duro ( espejo). La probabilidad de que fallen dos discos duros a la vez es insignificante.

La única desventaja de una matriz RAID 1 es que necesita comprar dos discos duros, pero funcionarán como uno solo, es decir, si instala dos discos duros de 500 GB en la unidad del sistema, entonces se obtendrán los mismos 500 GB. disponible para almacenar archivos GB, no 1 TB.

Si uno de cada dos discos duros falla, simplemente lo tomas y lo cambias, agregándolo como espejo a un disco duro ya instalado con datos y listo.

Personalmente, durante muchos años, lo uso en el trabajo Matriz RAID 1 de dos discos duros de 1 TB y hace un año pasó algo malo, un disco duro perdió su vida, tuve que reemplazarlo inmediatamente, entonces pensé con horror qué pasaría si no tuviera una matriz RAID, Un ligero escalofrío me recorrió la espalda, porque los datos acumulados durante varios años de trabajo habrían desaparecido, así que simplemente reemplacé el “terabyte” defectuoso y seguí trabajando. Por cierto, en casa también tengo una pequeña matriz RAID de dos discos duros de 500 GB.

creación de software RAID 1 una serie de dos discos duros vacíos con Windows 8.1

En primer lugar, instalamos dos discos duros limpios en la unidad de nuestro sistema. Por ejemplo, llevaré dos discos duros de 250 GB.

Qué hacer si el tamaño de los discos duros es diferente o si ya tiene información en un disco duro, lea nuestro próximo artículo.

Abrir administración de discos

Disco 0- Unidad de estado sólido SSD con sistema operativo Windows 8.1 instalado en la partición (C:).

Disco 1 Y Disco 2- discos duros con una capacidad de 250 GB a partir de los cuales montaremos una matriz RAID 1.

Haga clic derecho en cualquier disco duro y seleccione "Crear volumen espejo"

Agregue un disco que será un espejo del disco seleccionado previamente. Seleccionamos el Disco 1 como el primer volumen reflejado, lo que significa que seleccionamos el Disco 2 en el lado izquierdo y hacemos clic en el botón "Agregar".

Seleccione la letra del software RAID 1 array, le dejo la letra (D:). Próximo

Marque la casilla Formato rápido y haga clic en Siguiente.

En Administración de discos, los volúmenes reflejados se indican en rojo sangre y tienen una sola letra de unidad, en nuestro caso (D:). Copie cualquier archivo a cualquier disco y aparecerá inmediatamente en otro disco.

En la ventana Esta PC, La matriz RAID 1 por software aparece como un solo disco.

Si uno de los dos discos duros falla, en la administración de discos la matriz RAID se marcará con el error "Redundancia fallida", pero todos los datos del segundo disco duro estarán seguros.

© Andrey Egorov, 2005, 2006. Grupo de empresas TIM.

Los visitantes del foro nos hacen la pregunta: "¿Qué nivel de RAID es el más confiable?" Todo el mundo sabe que el nivel más común es RAID5, pero no está exento de graves inconvenientes que no son evidentes para los no especialistas.

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 o ¿qué son los niveles de RAID?

En este artículo, intentaré caracterizar los niveles RAID más populares y luego formularé recomendaciones para utilizar estos niveles. Para ilustrar el artículo, creé un diagrama en el que coloqué estos niveles en el espacio tridimensional de confiabilidad, rendimiento y rentabilidad.

JBOD(Just a Bunch of Disks) es una simple combinación de discos duros, que formalmente no es un nivel RAID. Un volumen JBOD puede ser una matriz de un solo disco o una agregación de varios discos. El controlador RAID no necesita realizar ningún cálculo para operar dicho volumen. En nuestro diagrama, la unidad JBOD sirve como punto de partida “único”: su confiabilidad, rendimiento y valores de costo son los mismos que los de un solo disco duro.

RAID 0("Striping") no tiene redundancia y distribuye información inmediatamente entre todos los discos incluidos en la matriz en forma de pequeños bloques ("stripes"). Debido a esto, el rendimiento aumenta significativamente, pero la confiabilidad se ve afectada. Al igual que con JBOD, obtenemos el 100% de la capacidad del disco por nuestro dinero.

Permítanme explicarles por qué disminuye la confiabilidad del almacenamiento de datos en cualquier volumen compuesto, ya que si alguno de los discos duros incluidos falla, toda la información se pierde completa e irremediablemente. De acuerdo con la teoría de la probabilidad, matemáticamente, la confiabilidad de un volumen RAID0 es igual al producto de las confiabilidades de sus discos constituyentes, cada uno de los cuales es menor que uno, por lo que la confiabilidad total es obviamente menor que la confiabilidad de cualquier disco.

Buen nivel - RAID 1(“Reflejo”, “espejo”). Tiene protección contra fallas de la mitad del hardware disponible (en el caso general, uno de dos discos duros), proporciona una velocidad de escritura aceptable y gana en velocidad de lectura debido a la paralelización de solicitudes. La desventaja es que hay que pagar el coste de dos discos duros para obtener la capacidad utilizable de un disco duro.

Inicialmente, se supone que el disco duro es algo confiable. En consecuencia, la probabilidad de falla de dos discos a la vez es igual (según la fórmula) al producto de las probabilidades, es decir ¡órdenes de magnitud más bajos! Desafortunadamente, ¡la vida real no es una teoría! Se toman dos discos duros del mismo lote y funcionan en las mismas condiciones, y si uno de los discos falla, la carga en el restante aumenta, por lo que en la práctica, si uno de los discos falla, se deben tomar medidas urgentes para restaurarlo. redundancia. Para hacer esto, se recomienda utilizar discos de repuesto dinámicos con cualquier nivel RAID (excepto cero) repuesto caliente. La ventaja de este enfoque es mantener una confiabilidad constante. La desventaja son los costos aún mayores (es decir, el costo de 3 discos duros para almacenar el volumen de un disco).

El espejo en muchos discos es un nivel. RAID 10. Cuando se utiliza este nivel, los pares de discos reflejados se organizan en una "cadena", por lo que el volumen resultante puede exceder la capacidad de un solo disco duro. Las ventajas y desventajas son las mismas que para el nivel RAID1. Como en otros casos, se recomienda incluir discos de repuesto dinámicos HotSpare en la matriz a razón de un repuesto por cada cinco trabajadores.

RAID 5 De hecho, es el más popular de los niveles, principalmente debido a su eficiencia. Al sacrificar la capacidad de un solo disco de la matriz por motivos de redundancia, obtenemos protección contra fallas de cualquiera de los discos duros del volumen. Escribir información en un volumen RAID5 requiere recursos adicionales, ya que se requieren cálculos adicionales, pero al leer (en comparación con un disco duro separado), hay una ganancia, porque los flujos de datos de varias unidades de matriz están paralelizados.

Las desventajas de RAID5 aparecen cuando falla uno de los discos: todo el volumen entra en modo crítico, todas las operaciones de escritura y lectura van acompañadas de manipulaciones adicionales, el rendimiento cae drásticamente y los discos comienzan a calentarse. Si no se toman medidas inmediatas, puede perder todo el volumen. Por lo tanto, (ver arriba) definitivamente deberías usar un disco Hot Spare con un volumen RAID5.

Además de los niveles básicos RAID0 - RAID5 descritos en el estándar, existen niveles combinados RAID10, RAID30, RAID50, RAID15, que los distintos fabricantes interpretan de forma diferente.

La esencia de tales combinaciones es brevemente la siguiente. RAID10 es una combinación de uno y cero (ver arriba). RAID50 es una combinación de volúmenes “0” de nivel 5. RAID15 es un "espejo" de los "cinco". Etcétera.

Así, los niveles combinados heredan las ventajas (y desventajas) de sus “padres”. Entonces, la aparición de un "cero" en el nivel. RAID 50 no le agrega ninguna confiabilidad, pero tiene un efecto positivo en el rendimiento. Nivel RAID 15, probablemente muy confiable, pero no es el más rápido y, además, extremadamente antieconómico (la capacidad útil del volumen es menos de la mitad del tamaño de la matriz de discos original).

RAID 6 se diferencia de RAID 5 en que en cada fila de datos (en inglés raya) no tiene uno, pero dos bloque de suma de comprobación. Las sumas de verificación son "multidimensionales", es decir independientes entre sí, por lo que incluso el fallo de dos discos en la matriz le permite guardar los datos originales. Calcular sumas de comprobación utilizando el método Reed-Solomon requiere cálculos más intensivos en comparación con RAID5, por lo que anteriormente prácticamente no se utilizaba el sexto nivel. Ahora cuenta con el respaldo de muchos productos, desde que comenzaron a instalar microcircuitos especializados que realizan todas las operaciones matemáticas necesarias.

Según algunos estudios, restaurar la integridad después de un fallo de un solo disco en un volumen RAID5 compuesto por discos SATA de gran tamaño (400 y 500 gigabytes) provoca la pérdida de datos en el 5% de los casos. En otras palabras, en un caso de cada veinte, durante la regeneración de una matriz RAID5 a un disco Hot Spare, el segundo disco puede fallar... De ahí las recomendaciones de las mejores unidades RAID: 1) Siempre hacer copias de seguridad; 2) uso RAID6!

Recientemente han aparecido nuevos niveles RAID1E, RAID5E, RAID5EE. La letra "E" en el nombre significa Mejorado.

RAID nivel 1 mejorado (RAID nivel 1E) combina duplicación y división de datos. Esta mezcla de niveles 0 y 1 se organiza de la siguiente manera. Los datos de una fila se distribuyen exactamente como en RAID 0. Es decir, la fila de datos no tiene redundancia. La siguiente fila de bloques de datos copia la anterior con un desplazamiento de un bloque. Así, como en el modo RAID 1 estándar, cada bloque de datos tiene una copia reflejada en uno de los discos, por lo que el volumen útil de la matriz es igual a la mitad del volumen total de los discos duros incluidos en la matriz. RAID 1E requiere una combinación de tres o más unidades para funcionar.

Me gusta mucho el nivel RAID1E. Para una potente estación de trabajo gráfica o incluso para un ordenador doméstico, ¡la mejor elección! Tiene todas las ventajas de los niveles cero y primero: excelente velocidad y alta confiabilidad.

Pasemos ahora al nivel. RAID nivel 5 mejorado (RAID nivel 5E). Esto es lo mismo que RAID5, solo que con un disco de respaldo integrado en la matriz. unidad de repuesto. Esta integración se realiza de la siguiente manera: en todos los discos del array se deja libre 1/N parte del espacio, que se utiliza como repuesto dinámico si falla uno de los discos. Debido a esto, RAID5E demuestra, además de confiabilidad, un mejor rendimiento, ya que la lectura/escritura se realiza en paralelo desde un mayor número de unidades al mismo tiempo y la unidad de repuesto no está inactiva, como en RAID5. Obviamente, el disco de respaldo incluido en el volumen no se puede compartir con otros volúmenes (dedicados o compartidos). Un volumen RAID 5E se basa en un mínimo de cuatro discos físicos. El volumen útil de un volumen lógico se calcula mediante la fórmula N-2.

Nivel RAID 5E mejorado (nivel RAID 5EE) similar al RAID nivel 5E, pero tiene una asignación de unidades de repuesto más eficiente y, como resultado, un tiempo de recuperación más rápido. Al igual que el nivel RAID5E, este nivel RAID distribuye bloques de datos y sumas de comprobación en filas. Pero también distribuye bloques de unidades de repuesto gratuitos y no reserva simplemente parte del espacio en disco para estos fines. Esto reduce el tiempo necesario para reconstruir la integridad de un volumen RAID5EE. El disco de respaldo incluido en el volumen no se puede compartir con otros volúmenes, como en el caso anterior. Un volumen RAID 5EE se basa en un mínimo de cuatro discos físicos. El volumen útil de un volumen lógico se calcula mediante la fórmula N-2.

Curiosamente, no se menciona el nivel. RAID 6E No pude encontrarlo en Internet; hasta ahora, ningún fabricante ofrece ni anuncia este nivel. Pero el nivel RAID6E (¿o RAID6EE?) se puede ofrecer según el mismo principio que el anterior. Disco repuesto caliente Necesariamente debe acompañar a cualquier volumen RAID, incluido RAID 6. Por supuesto, no perderemos información si uno o dos discos fallan, pero es extremadamente importante comenzar a regenerar la integridad de la matriz lo antes posible para poder recuperar rápidamente el sistema. del modo “crítico”. Dado que la necesidad de un disco Hot Spare está fuera de toda duda para nosotros, sería lógico ir más allá y “repartirlo” por el volumen como se hace en RAID 5EE para obtener los beneficios de utilizar una mayor cantidad de discos (mejor velocidad de lectura-escritura y restauración más rápida de la integridad).

Niveles de RAID en “números”.

He recopilado algunos parámetros importantes de casi todos los niveles RAID en una tabla para que puedas compararlos entre sí y comprender mejor su esencia.

Nivel
~~~~~~~

Cabañas-
exactamente
ness
~~~~~~~

Usar
Capacidad del disco
~~~~~~~

Producción
ditel-
ness
lectura

~~~~~~~

Producción
ditel-
ness
archivos

~~~~~~~

Incorporado
disco
reservar

~~~~~~~

Mín. número de discos
~~~~~~~

Máx. número de discos

~~~~~~~

Excª

Excª

Excª

Excª

Todos los niveles "espejo" son RAID 1, 1+0, 10, 1E, 1E0.

Intentemos nuevamente comprender a fondo en qué se diferencian estos niveles.

RAID 1.
Este es un "espejo" clásico. Dos (¡y sólo dos!) discos duros funcionan como uno solo, siendo una copia completa uno del otro. La falla de cualquiera de estas dos unidades no resulta en la pérdida de sus datos, ya que el controlador continúa operando la unidad restante. RAID1 en números: 2x redundancia, 2x confiabilidad, 2x costo. El rendimiento de escritura es equivalente al de un solo disco duro. El rendimiento de lectura es mayor porque el controlador puede distribuir las operaciones de lectura entre dos discos.

RAID 10.
La esencia de este nivel es que los discos de la matriz se combinan en pares en "espejos" (RAID 1), y luego todos estos pares de espejos, a su vez, se combinan en una matriz rayada común (RAID 0). Por eso a veces se le conoce como RAID 1+0. Un punto importante es que en RAID 10 sólo puedes combinar un número par de discos (mínimo 4, máximo 16). Ventajas: la confiabilidad se hereda del "espejo", el rendimiento tanto de lectura como de escritura se hereda de "cero".

RAID 1E.
La letra "E" del nombre significa "mejorado", es decir. "mejorado". El principio de esta mejora es el siguiente: los datos se "separan" en bloques en todos los discos de la matriz y luego se "separan" nuevamente con un cambio a un disco. RAID 1E puede combinar de tres a 16 discos. La confiabilidad corresponde a los "diez" indicadores y el rendimiento mejora un poco debido a una mayor "alternancia".

RAID 1E0.
Este nivel se implementa así: creamos una matriz "nula" a partir de matrices RAID1E. Por tanto, el número total de discos debe ser múltiplo de tres: ¡un mínimo de tres y un máximo de sesenta! En este caso, es poco probable que obtengamos una ventaja en velocidad y la complejidad de la implementación puede afectar negativamente a la confiabilidad. La principal ventaja es la capacidad de combinar una cantidad muy grande (hasta 60) de discos en una matriz.

La similitud de todos los niveles RAID 1X radica en sus indicadores de redundancia: en aras de la confiabilidad, se sacrifica exactamente el 50% de la capacidad total de los discos de la matriz.

El cambio de enfoque de aplicaciones centradas en procesadores a aplicaciones centradas en datos está impulsando la creciente importancia de los sistemas de almacenamiento de datos. Al mismo tiempo, el problema del bajo rendimiento y la tolerancia a fallos característicos de estos sistemas siempre ha sido bastante importante y siempre ha requerido una solución.

En la industria informática moderna, los discos magnéticos se utilizan ampliamente como sistema de almacenamiento secundario de datos porque, a pesar de todas sus deficiencias, tienen las mejores características para el tipo de dispositivo correspondiente a un precio asequible.

Las características de la tecnología de construcción de discos magnéticos han provocado una discrepancia significativa entre el aumento del rendimiento de los módulos de procesador y los propios discos magnéticos. Si en 1990 los mejores entre los de serie eran los discos de 5,25″ con un tiempo de acceso medio de 12 ms y un tiempo de latencia de 5 ms (a una velocidad de giro de unas 5.000 rpm 1), hoy la palma pertenece a los discos de 3,5″ con un tiempo de acceso promedio de 5 ms y tiempo de retardo de 1 ms (a velocidad del husillo de 10.000 rpm). Aquí vemos una mejora en las características técnicas de alrededor del 100%. Al mismo tiempo, el rendimiento del procesador aumentó en más de un 2000%. Esto es en gran medida posible porque los procesadores tienen los beneficios directos de utilizar VLSI (integración a muy gran escala). Su uso no sólo permite aumentar la frecuencia, sino también el número de componentes que se pueden integrar en el chip, lo que permite introducir ventajas arquitectónicas que permiten la computación en paralelo.

1 - Datos promedio.

La situación actual se puede caracterizar como una crisis de E/S del sistema de almacenamiento secundario.

Aumento del rendimiento

La imposibilidad de aumentar significativamente los parámetros tecnológicos de los discos magnéticos conlleva la necesidad de buscar otras formas, una de las cuales es el procesamiento paralelo.

Si organiza un bloque de datos en N discos de alguna matriz y organiza esta ubicación para que sea posible leer información simultáneamente, entonces este bloque se puede leer N veces más rápido (sin tener en cuenta el tiempo de formación del bloque). Dado que todos los datos se transfieren en paralelo, esta solución arquitectónica se llama matriz de acceso paralelo(matriz con acceso paralelo).

Los arreglos paralelos se usan típicamente para aplicaciones que requieren grandes transferencias de datos.

Algunas tareas, por el contrario, se caracterizan por una gran cantidad de pequeñas solicitudes. Estas tareas incluyen, por ejemplo, tareas de procesamiento de bases de datos. Al distribuir los registros de la base de datos entre los discos de la matriz, puede distribuir la carga colocando los discos de forma independiente. Esta arquitectura se suele llamar matriz de acceso independiente(conjunto con acceso independiente).

Aumento de la tolerancia a fallos

Desafortunadamente, a medida que aumenta la cantidad de discos en una matriz, la confiabilidad de toda la matriz disminuye. Con fallas independientes y una ley de distribución exponencial del tiempo entre fallas, el MTTF de toda la matriz (tiempo medio hasta la falla) se calcula usando la fórmula Matriz MTTF = MMTF hdd /N hdd (MMTF hdd es el tiempo medio hasta la falla de un disco ; NHDD es el número de discos).

Por tanto, existe la necesidad de aumentar la tolerancia a fallos de las matrices de discos. Para aumentar la tolerancia a fallos de las matrices, se utiliza codificación redundante. Hay dos tipos principales de codificación que se utilizan en matrices de discos redundantes: duplicación y paridad.

La duplicación o duplicación se utiliza con mayor frecuencia en matrices de discos. Los sistemas espejo simples utilizan dos copias de datos, cada copia ubicada en discos separados. Este esquema es bastante simple y no requiere costos de hardware adicionales, pero tiene un inconveniente importante: utiliza el 50% del espacio en disco para almacenar una copia de la información.

La segunda forma de implementar matrices de discos redundantes es utilizar codificación redundante mediante cálculo de paridad. La paridad se calcula aplicando XOR a todos los caracteres de la palabra de datos. El uso de la paridad en matrices de discos redundantes reduce la sobrecarga a un valor calculado mediante la fórmula: HP hdd =1/N hdd (HP hdd es la sobrecarga; N hdd es el número de discos en la matriz).

Historia y desarrollo de RAID.

A pesar de que los sistemas de almacenamiento basados ​​en discos magnéticos se fabrican desde hace 40 años, la producción en masa de sistemas tolerantes a fallos comenzó hace poco tiempo. Los conjuntos de discos redundantes, comúnmente llamados RAID (conjuntos redundantes de discos económicos), fueron introducidos por investigadores (Petterson, Gibson y Katz) de la Universidad de California, Berkeley, en 1987. Pero los sistemas RAID se generalizaron sólo cuando los discos que eran adecuados para su uso en matrices redundantes estuvieron disponibles y fueron suficientemente productivos. Desde el libro blanco sobre RAID en 1988, la investigación sobre matrices de discos redundantes se ha disparado en un intento de proporcionar una amplia gama de compensaciones entre costo, rendimiento y confiabilidad.

Hubo un tiempo en que hubo un incidente con la abreviatura RAID. El hecho es que en el momento de escribir este artículo, todos los discos que se usaban en las PC se llamaban discos económicos, a diferencia de los costosos discos para mainframes (computadoras mainframe). Pero para su uso en matrices RAID, era necesario utilizar equipos bastante costosos en comparación con otras configuraciones de PC, por lo que RAID comenzó a descifrarse como una matriz redundante de discos independientes 2: una matriz redundante de discos independientes.

2 - Definición de consejo asesor RAID

La industria introdujo RAID 0 como la definición de una matriz de discos no tolerante a fallos. Berkeley definió RAID 1 como una matriz de discos reflejados. RAID 2 está reservado para matrices que utilizan código Hamming. Los niveles RAID 3, 4, 5 utilizan la paridad para proteger los datos de fallos únicos. Fueron estos niveles, incluido el nivel 5, los que se presentaron en Berkeley, y esta taxonomía RAID se adoptó como estándar de facto.

Los niveles RAID 3,4,5 son bastante populares y tienen una buena utilización del espacio en disco, pero tienen un inconveniente importante: sólo son resistentes a fallos únicos. Esto es especialmente cierto cuando se utiliza una gran cantidad de discos, cuando aumenta la probabilidad de que se produzca un tiempo de inactividad simultáneo de más de un dispositivo. Además, se caracterizan por una larga recuperación, lo que también impone algunas restricciones a su uso.

Hoy en día, se ha desarrollado una cantidad bastante grande de arquitecturas que garantizan el funcionamiento de la matriz incluso en caso de falla simultánea de dos discos cualesquiera sin pérdida de datos. Entre todo el conjunto, cabe destacar la paridad bidimensional y EVENODD, que utilizan paridad para la codificación, y RAID 6, que utiliza codificación Reed-Solomon.

En un esquema que utiliza paridad de espacio dual, cada bloque de datos participa en la construcción de dos palabras de código independientes. Por lo tanto, si falla un segundo disco con la misma palabra de código, se utiliza una palabra de código diferente para reconstruir los datos.

La redundancia mínima en una matriz de este tipo se logra con el mismo número de columnas y filas. Y es igual a: 2 x Cuadrado (N Disco) (en “cuadrado”).

Si la matriz de dos espacios no está organizada en un "cuadrado", entonces al implementar el esquema anterior, la redundancia será mayor.

La arquitectura EVNODD tiene un esquema de tolerancia a fallas similar a la paridad de espacio dual, pero una ubicación diferente de los bloques de información que garantiza una utilización mínima de la capacidad redundante. Como en la paridad de espacio dual, cada bloque de datos participa en la construcción de dos palabras de código independientes, pero las palabras se colocan de tal manera que el coeficiente de redundancia es constante (a diferencia del esquema anterior) y es igual a: 2 x Cuadrado (N Disco).

Al utilizar dos caracteres de verificación, códigos de paridad y no binarios, la palabra de datos se puede diseñar para proporcionar tolerancia a fallas cuando ocurre una falla doble. Este diseño se conoce como RAID 6. El código no binario, basado en la codificación Reed-Solomon, normalmente se calcula mediante tablas o como un proceso iterativo utilizando registros lineales de bucle cerrado, una operación relativamente compleja que requiere hardware especializado.

Teniendo en cuenta que el uso de opciones RAID clásicas, que proporcionan suficiente tolerancia a fallos para muchas aplicaciones, a menudo tiene un rendimiento inaceptablemente bajo, los investigadores implementan de vez en cuando varias medidas que ayudan a aumentar el rendimiento de los sistemas RAID.

En 1996, Savage y Wilks propusieron AFRAID: una matriz de discos independientes frecuentemente redundante. Esta arquitectura, hasta cierto punto, sacrifica la tolerancia a fallos en aras del rendimiento. En un intento de compensar el problema de escritura pequeña típico de los arreglos RAID de nivel 5, es posible dejar la división sin cálculo de paridad durante un cierto período de tiempo. Si el disco designado para la grabación de paridad está ocupado, la grabación de paridad se retrasa. Se ha demostrado teóricamente que una reducción del 25 % en la tolerancia a fallos puede aumentar el rendimiento en un 97 %. AFRAID cambia efectivamente el modelo de falla de matrices tolerantes a fallas únicas porque una palabra de código que no tiene paridad actualizada es susceptible a fallas en el disco.

En lugar de sacrificar la tolerancia a fallos, puede utilizar técnicas de rendimiento tradicionales como el almacenamiento en caché. Dado que el tráfico del disco está en ráfagas, puede utilizar una caché de reescritura para almacenar datos cuando los discos estén ocupados. Y si la memoria caché tiene forma de memoria no volátil, en caso de un corte de energía, los datos se guardarán. Además, las operaciones de disco diferidas permiten combinar pequeños bloques aleatoriamente para realizar operaciones de disco más eficientes.

También hay muchas arquitecturas que sacrifican volumen para aumentar el rendimiento. Entre ellos se encuentran la modificación retrasada en el disco de registro y varios esquemas para modificar la ubicación lógica de los datos en física, lo que permite distribuir las operaciones en la matriz de manera más eficiente.

Una de las opciones es registro de paridad(registro de paridad), que implica resolver el problema de escritura pequeña y un uso más eficiente de los discos. El registro de paridad difiere los cambios de paridad en RAID 5 registrándolos en un registro FIFO, que se encuentra en parte en la memoria del controlador y en parte en el disco. Dado que acceder a una pista completa es, en promedio, 10 veces más eficiente que acceder a un sector, el registro de paridad recopila grandes cantidades de datos de paridad modificados, que luego se escriben juntos en un disco dedicado a almacenar la paridad en toda la pista.

Arquitectura datos flotantes y paridad(flotante y de paridad), que permite reasignar la ubicación física de los bloques de disco. Se colocan sectores libres en cada cilindro para reducir latencia rotacional(retrasos de rotación), los datos y la paridad se asignan a estos espacios libres. Para garantizar el funcionamiento durante un corte de energía, la paridad y el mapa de datos deben almacenarse en una memoria no volátil. Si pierde el mapa de ubicación, se perderán todos los datos de la matriz.

decapado virtual- es una arquitectura de paridad y datos flotantes que utiliza caché de reescritura. Naturalmente, darse cuenta de los lados positivos de ambos.

Además, existen otras formas de mejorar el rendimiento, como las operaciones RAID. Hubo un tiempo en que Seagate incorporó soporte para operaciones RAID en sus unidades con interfaces Fiber Chanel y SCSI. Esto hizo posible reducir el tráfico entre el controlador central y los discos en la matriz para sistemas RAID 5. Esta fue una innovación fundamental en el campo de las implementaciones RAID, pero la tecnología no tuvo un comienzo, ya que algunas características de la fibra. Los estándares Chanel y SCSI debilitan el modelo de falla de las matrices de discos.

Para el mismo RAID 5, se introdujo la arquitectura TickerTAIP. Se ve así: el nodo originador del mecanismo de control central (nodo iniciador) recibe las solicitudes de los usuarios, selecciona un algoritmo de procesamiento y luego transfiere el trabajo del disco y la paridad al nodo trabajador (nodo de trabajo). Cada nodo trabajador procesa un subconjunto de discos de la matriz. Como en el modelo Seagate, los nodos trabajadores transfieren datos entre ellos sin la participación del nodo iniciador. Si un nodo trabajador falla, los discos que servía dejan de estar disponibles. Pero si la palabra clave se construye de tal manera que cada uno de sus símbolos sea procesado por un nodo trabajador separado, entonces el esquema de tolerancia a fallas repite RAID 5. Para evitar fallas en el nodo iniciador, se duplica, por lo que obtenemos una arquitectura que es resistente a fallos de cualquiera de sus nodos. A pesar de todas sus características positivas, esta arquitectura adolece del problema del "agujero de escritura". Lo que significa que se produce un error cuando varios usuarios cambian la palabra clave al mismo tiempo y el nodo falla.

También debemos mencionar un método bastante popular para restaurar rápidamente RAID: utilizando un disco libre (de repuesto). Si uno de los discos de la matriz falla, el RAID se puede restaurar utilizando un disco libre en lugar del que falló. La característica principal de esta implementación es que el sistema vuelve a su estado anterior (estado a prueba de fallos sin intervención externa). Cuando se utiliza una arquitectura de repuesto distribuida, los bloques lógicos de un disco de repuesto se distribuyen físicamente entre todos los discos de la matriz, lo que elimina la necesidad de reconstruir la matriz si falla un disco.

Para evitar el problema de recuperación típico de los niveles RAID clásicos, se ha creado una arquitectura llamada desagregación de paridad(distribución de paridad). Implica colocar menos unidades lógicas de mayor capacidad en unidades físicas más pequeñas y de mayor capacidad. Con esta tecnología, el tiempo de respuesta del sistema a una solicitud durante la reconstrucción se mejora a más de la mitad y el tiempo de reconstrucción se reduce significativamente.

Arquitectura de niveles RAID básicos

Ahora veamos la arquitectura de los niveles básicos de RAID con más detalle. Antes de considerarlo, hagamos algunas suposiciones. Para demostrar los principios de construcción de sistemas RAID, considere un conjunto de N discos (para simplificar, asumiremos que N es un número par), cada uno de los cuales consta de M bloques.

Denotaremos los datos - D m,n, donde m es el número de bloques de datos, n es el número de subbloques en los que se divide el bloque de datos D.

Los discos pueden conectarse a uno o varios canales de transferencia de datos. El uso de más canales aumenta la capacidad del sistema.

RAID 0. Matriz de discos seccionados sin tolerancia a fallos

Es una matriz de discos en la que los datos se dividen en bloques y cada bloque se escribe (o lee) en un disco independiente. Por lo tanto, se pueden realizar múltiples operaciones de E/S simultáneamente.

Ventajas:

  • mayor rendimiento para aplicaciones que requieren un procesamiento intensivo de solicitudes de E/S y grandes volúmenes de datos;
  • facilidad de implementación;
  • Bajo costo por unidad de volumen.

Defectos:

  • no es una solución a prueba de fallos;
  • La falla de una unidad resulta en la pérdida de todos los datos de la matriz.

RAID 1. Matriz de discos redundantes o duplicación

La duplicación es una forma tradicional de aumentar la confiabilidad de una pequeña matriz de discos. En la versión más sencilla se utilizan dos discos en los que se registra la misma información, y si uno de ellos falla, queda un duplicado del mismo, que sigue funcionando en el mismo modo.

Ventajas:

  • facilidad de implementación;
  • facilidad de recuperación de la matriz en caso de falla (copia);
  • Rendimiento suficientemente alto para aplicaciones con alta intensidad de solicitud.

Defectos:

  • alto costo por unidad de volumen: 100% de redundancia;
  • baja velocidad de transferencia de datos.

RAID 2. Matriz de discos tolerante a fallos que utiliza Hamming Code ECC.

La codificación redundante utilizada en RAID 2 se denomina código Hamming. El código Hamming le permite corregir fallas simples y detectar fallas dobles. Hoy en día se utiliza activamente en la tecnología de codificación de datos en RAM tipo ECC. Y codificar datos en discos magnéticos.

En este caso, se muestra un ejemplo con un número fijo de discos debido a la engorrosa descripción (una palabra de datos consta de 4 bits, respectivamente, el código ECC es 3).

Ventajas:

  • corrección rápida de errores (“sobre la marcha”);
  • velocidad de transferencia de datos muy alta para grandes volúmenes;
  • a medida que aumenta la cantidad de discos, los costos generales disminuyen;
  • implementación bastante simple.

Defectos:

  • alto costo con una pequeña cantidad de discos;
  • baja velocidad de procesamiento de solicitudes (no adecuado para sistemas orientados a transacciones).

RAID 3. Matriz tolerante a fallos con transferencia de datos en paralelo y paridad (Discos de transferencia en paralelo con paridad)

Los datos se dividen en subbloques a nivel de bytes y se escriben simultáneamente en todos los discos de la matriz excepto uno, que se utiliza para la paridad. El uso de RAID 3 resuelve el problema de la alta redundancia en RAID 2. La mayoría de los discos de control utilizados en el nivel RAID 2 son necesarios para determinar la posición del bit fallido. Pero esto no es necesario, ya que la mayoría de los controladores pueden determinar cuándo un disco ha fallado mediante señales especiales o codificación adicional de información escrita en el disco y utilizada para corregir fallas aleatorias.

Ventajas:

  • velocidad de transferencia de datos muy alta;
  • la falla del disco tiene poco efecto en la velocidad de la matriz;

Defectos:

  • implementación difícil;
  • Bajo rendimiento con solicitudes de alta intensidad para datos pequeños.

RAID 4. Matriz tolerante a fallas de discos independientes con disco de paridad compartido (discos de datos independientes con disco de paridad compartido)

Los datos se desglosan a nivel de bloque. Cada bloque de datos se escribe en un disco independiente y se puede leer por separado. La paridad para un grupo de bloques se genera al escribir y se verifica al leer. RAID Nivel 4 mejora el rendimiento de pequeñas transferencias de datos a través del paralelismo, permitiendo que se produzca más de un acceso de E/S simultáneamente. La principal diferencia entre RAID 3 y 4 es que en este último, la división de datos se realiza a nivel de sector, en lugar de a nivel de bit o byte.

Ventajas:

  • muy alta velocidad de lectura de grandes volúmenes de datos;
  • alto rendimiento con alta intensidad de solicitudes de lectura de datos;
  • gastos generales bajos para implementar la redundancia.

Defectos:

  • muy bajo rendimiento al escribir datos;
  • baja velocidad de lectura de datos pequeños con solicitudes únicas;
  • asimetría del desempeño en lectura y escritura.

RAID 5. Matriz de discos independientes tolerante a fallos con bloques de paridad distribuida

Este nivel es similar a RAID 4, pero a diferencia del anterior, la paridad se distribuye cíclicamente entre todos los discos de la matriz. Este cambio mejora el rendimiento de escribir pequeñas cantidades de datos en sistemas multitarea. Si las operaciones de escritura se planifican correctamente, es posible procesar hasta N/2 bloques en paralelo, donde N es el número de discos del grupo.

Ventajas:

  • alta velocidad de grabación de datos;
  • velocidad de lectura de datos bastante alta;
  • alto rendimiento con alta intensidad de solicitudes de lectura/escritura de datos;
  • gastos generales bajos para implementar la redundancia.

Defectos:

  • La velocidad de lectura de datos es menor que en RAID 4;
  • baja velocidad de lectura/escritura de datos pequeños con solicitudes únicas;
  • implementación bastante compleja;
  • recuperación de datos complejos.

RAID 6. Matriz de discos independientes tolerante a fallas con dos esquemas de paridad distribuida independientes (discos de datos independientes con dos esquemas de paridad distribuida independientes)

Los datos se particionan a nivel de bloque, similar a RAID 5, pero además de la arquitectura anterior, se utiliza un segundo esquema para mejorar la tolerancia a fallos. Esta arquitectura es tolerante a doble falla. Sin embargo, cuando se realiza una escritura lógica, en realidad hay seis accesos al disco, lo que aumenta considerablemente el tiempo de procesamiento de una solicitud.

Ventajas:

  • alta tolerancia a fallas;
  • velocidad bastante alta de procesamiento de solicitudes;
  • Gastos generales relativamente bajos para implementar la redundancia.

Defectos:

  • implementación muy compleja;
  • recuperación de datos compleja;
  • Velocidad de escritura de datos muy baja.

Los controladores RAID modernos le permiten combinar diferentes niveles RAID. De esta forma, es posible implementar sistemas que combinen las ventajas de diferentes niveles, así como sistemas con una gran cantidad de discos. Normalmente se trata de una combinación de nivel cero (eliminación) y algún tipo de nivel tolerante a fallos.

RAID 10. Matriz tolerante a fallos con duplicación y procesamiento paralelo

Esta arquitectura es una matriz RAID 0 cuyos segmentos son matrices RAID 1. Combina una tolerancia a fallas y un rendimiento muy altos.

Ventajas:

  • alta tolerancia a fallas;
  • rendimiento alto.

Defectos:

  • costo muy alto;
  • escalamiento limitado.

RAID 30. Matriz tolerante a fallos con transferencia de datos en paralelo y mayor rendimiento.

Es una matriz RAID 0, cuyos segmentos son matrices RAID 3. Combina tolerancia a fallas y alto rendimiento. Normalmente se utiliza para aplicaciones que requieren grandes volúmenes de transferencia de datos en serie.

Ventajas:

  • alta tolerancia a fallas;
  • rendimiento alto.

Defectos:

  • alto costo;
  • escalamiento limitado.

RAID 50: matriz tolerante a fallos con paridad distribuida y mayor rendimiento

Es una matriz RAID 0, cuyos segmentos son matrices RAID 5. Combina tolerancia a fallas y alto rendimiento para aplicaciones con alta intensidad de solicitudes y altas tasas de transferencia de datos.

Ventajas:

  • alta tolerancia a fallas;
  • alta velocidad de transferencia de datos;
  • alta velocidad de procesamiento de solicitudes.

Defectos:

  • alto costo;
  • escalamiento limitado.

RAID 7: matriz tolerante a fallos optimizada para el rendimiento. (Asincronía optimizada para altas tasas de E/S, así como altas tasas de transferencia de datos). RAID 7® es una marca registrada de Storage Computer Corporation (SCC)

Para comprender la arquitectura RAID 7, veamos sus características:

  1. Todas las solicitudes de transferencia de datos se procesan de forma asincrónica e independiente.
  2. Todas las operaciones de lectura/escritura se almacenan en caché a través del x-bus de alta velocidad.
  3. El disco de paridad se puede colocar en cualquier canal.
  4. El microprocesador del controlador de matriz utiliza un sistema operativo en tiempo real centrado en los procesos de procesamiento.
  5. El sistema tiene buena escalabilidad: hasta 12 interfaces de host y hasta 48 discos.
  6. El sistema operativo controla los canales de comunicación.
  7. Se utilizan discos, buses, placas base y módulos de memoria SCSI estándar.
  8. Se utiliza un bus X de alta velocidad para trabajar con la memoria caché interna.
  9. El procedimiento de generación de paridad está integrado en la memoria caché.
  10. Los discos conectados al sistema se pueden declarar como separados.
  11. Se puede utilizar un agente SNMP para administrar y monitorear el sistema.

Ventajas:

  • alta velocidad de transferencia de datos y alta velocidad de procesamiento de solicitudes (1,5 - 6 veces mayor que otros niveles RAID estándar);
  • alta escalabilidad de las interfaces del host;
  • la velocidad de escritura de datos aumenta con la cantidad de discos en la matriz;
  • No es necesaria ninguna transmisión de datos adicional para calcular la paridad.

Defectos:

  • propiedad de un fabricante;
  • costo muy alto por unidad de volumen;
  • período de garantía corto;
  • no puede ser atendido por el usuario;
  • debe utilizar una fuente de alimentación ininterrumpida para evitar la pérdida de datos de la memoria caché.

Veamos ahora los niveles estándar juntos para comparar sus características. La comparación se realiza en el marco de las arquitecturas mencionadas en la tabla.

RAIDMínimo
discos
Necesidad
en discos
Falla
sostenibilidad
Velocidad
transmisión de datos
Intensidad
tratamiento
solicitudes
Práctico
uso
0 2 norte muy alto
hasta N x 1 disco
gráficos, vídeo
1 2 2N* R > 1 disco
W = 1 disco
hasta 2 x 1 disco
W = 1 disco
servidores de archivos pequeños
2 7 2N ~ RAID 3Bajocomputadoras centrales
3 3 N+1 Bajográficos, vídeo
4 3 N+1 RWR=RAID 0
W.
servidores de archivos
5 3 N+1 RWR=RAID 0
W.
servidores de bases de datos
6 4 N+2más altobajoR > 1 disco
W.
usado muy raramente
7 12 N+1 más altomás altodiferentes tipos de aplicaciones

Aclaraciones:

  • * - se considera la opción más utilizada;
  • k - número de subsegmentos;
  • R - lectura;
  • W - registro.

Algunos aspectos de la implementación de sistemas RAID

Consideremos tres opciones principales para implementar sistemas RAID:

  • software (basado en software);
  • hardware - basado en bus;
  • hardware - subsistema autónomo (basado en subsistemas).

Es imposible decir de manera inequívoca que una implementación es mejor que otra. Cada opción para organizar una matriz satisface las necesidades de uno u otro usuario, dependiendo de las capacidades financieras, la cantidad de usuarios y las aplicaciones utilizadas.

Cada una de las implementaciones anteriores se basa en la ejecución del código del programa. En realidad, difieren en dónde se ejecuta este código: en el procesador central de la computadora (implementación de software) o en un procesador especializado en un controlador RAID (implementación de hardware).

La principal ventaja de la implementación de software es el bajo costo. Pero al mismo tiempo tiene muchas desventajas: bajo rendimiento, carga en el procesador central con trabajo adicional y mayor tráfico de autobuses. Los niveles RAID simples 0 y 1 generalmente se implementan en software, ya que no requieren cálculos importantes. Teniendo en cuenta estas características, los sistemas RAID basados ​​en software se utilizan en servidores de nivel básico.

En consecuencia, las implementaciones de RAID de hardware cuestan más que las de software, ya que utilizan hardware adicional para realizar operaciones de E/S. Al mismo tiempo, descargan o liberan el procesador central y el bus del sistema y, en consecuencia, permiten un mayor rendimiento.

Las implementaciones orientadas al bus son controladores RAID que utilizan el bus de alta velocidad del ordenador en el que están instalados (últimamente se suele utilizar el bus PCI). A su vez, las implementaciones orientadas al bus se pueden dividir en de bajo nivel y de alto nivel. Los primeros normalmente no tienen chips SCSI y utilizan el llamado puerto RAID en la placa base con un controlador SCSI incorporado. En este caso, las funciones de procesamiento de código RAID y operaciones de E/S se distribuyen entre el procesador del controlador RAID y los chips SCSI de la placa base. De este modo, el procesador central se libera de procesar código adicional y el tráfico del bus se reduce en comparación con la versión del software. El coste de este tipo de placas suele ser bajo, especialmente si están destinadas a sistemas RAID 0 o 1 (también existen implementaciones de RAID 3, 5, 10, 30, 50, pero son más caras), por lo que poco a poco se van desplazando las implementaciones de software del mercado de servidores de nivel básico. Los controladores de alto nivel con implementación de bus tienen una estructura ligeramente diferente a la de sus hermanos menores. Asumen todas las funciones relacionadas con la entrada/salida y la ejecución del código RAID. Además, no dependen tanto de la implementación de la placa base y, por regla general, tienen más capacidades (por ejemplo, la capacidad de conectar un módulo para almacenar información en el caché en caso de falla de la placa base o corte de energía) . Estos controladores suelen ser más caros que los controladores de gama baja y se utilizan en servidores de gama media y alta. Por regla general, implementan los niveles RAID 0.1, 3, 5, 10, 30, 50. Teniendo en cuenta que las implementaciones orientadas al bus están conectadas directamente al bus PCI interno de la computadora, son los más productivos entre los sistemas considerados ( al organizar sistemas de un solo host). El rendimiento máximo de estos sistemas puede alcanzar 132 MB/s (PCI de 32 bits) o 264 MB/s (PCI de 64 bits) a una frecuencia de bus de 33 MHz.

Además de las ventajas enumeradas, la arquitectura orientada al bus tiene las siguientes desventajas:

  • dependencia del sistema operativo y la plataforma;
  • escalabilidad limitada;
  • capacidades limitadas para organizar sistemas tolerantes a fallas.

Todas estas desventajas pueden evitarse mediante el uso de subsistemas autónomos. Estos sistemas tienen una organización externa completamente autónoma y, en principio, son una computadora separada que se utiliza para organizar los sistemas de almacenamiento de información. Además, si la tecnología de canales de fibra óptica se desarrolla con éxito, el rendimiento de los sistemas autónomos no será en absoluto inferior al de los sistemas orientados al bus.

Normalmente, un controlador externo se coloca en un bastidor separado y, a diferencia de los sistemas con organización de bus, puede tener una gran cantidad de canales de entrada/salida, incluidos los canales host, lo que permite conectar varias computadoras host al sistema y organizar el clúster. sistemas. En sistemas con un controlador independiente, se pueden implementar controladores hot standby.

Una de las desventajas de los sistemas autónomos es su elevado coste.

Teniendo en cuenta lo anterior, observamos que los controladores autónomos se suelen utilizar para implementar sistemas de clúster y almacenamiento de datos de alta capacidad.




Arriba