¿Qué es una matriz de incursión? Tipos y configuraciones. Matrices RAID: confiabilidad y rendimiento ¿Qué significa raid 0?

Si está interesado en este artículo, probablemente haya encontrado o espere encontrar pronto uno de los siguientes problemas en su computadora:

- Es evidente que no hay suficiente capacidad física del disco duro como unidad lógica única. La mayoría de las veces, este problema ocurre cuando se trabaja con archivos grandes (video, gráficos, bases de datos);
- El rendimiento del disco duro claramente no es suficiente. Muy a menudo, este problema ocurre cuando se trabaja con sistemas de edición de video no lineales o cuando una gran cantidad de usuarios acceden simultáneamente a archivos en el disco duro;
- La fiabilidad del disco duro es claramente deficiente. La mayoría de las veces, este problema surge cuando es necesario trabajar con datos que nunca deben perderse o que siempre deben estar disponibles para el usuario. La triste experiencia demuestra que incluso el equipo más fiable a veces se estropea y, por regla general, en el momento más inoportuno.
Crear un sistema RAID en su computadora puede resolver estos y algunos otros problemas.

¿Qué es "RAID"?

En 1987, Patterson, Gibson y Katz, de la Universidad de California, Berkeley, publicaron “A Case for Redundant Arrays of Inexpensive Disks (RAID)”. Este artículo describe diferentes tipos de matrices de discos, abreviado RAID - Matriz redundante de discos independientes (o económicos) (matriz redundante de unidades de disco independientes (o económicas)). RAID se basa en la siguiente idea: al combinar varias unidades de disco pequeñas y/o económicas en una matriz, se puede obtener un sistema que es superior en capacidad, velocidad y confiabilidad a las unidades de disco más caras. Además, desde el punto de vista de una computadora, un sistema de este tipo parece una sola unidad de disco.
Se sabe que el tiempo medio entre fallas de una matriz de unidades es igual al tiempo medio entre fallas de una sola unidad dividido por el número de unidades de la matriz. Como resultado, el tiempo medio entre fallas del arreglo es demasiado corto para muchas aplicaciones. Sin embargo, una matriz de discos puede hacerse resistente al fallo de una sola unidad de varias maneras.

En el artículo anterior, se definieron cinco tipos (niveles) de matrices de discos: RAID-1, RAID-2, ..., RAID-5. Cada tipo ofrecía tolerancia a fallos, así como diferentes ventajas sobre una sola unidad. Junto con estos cinco tipos, también ha ganado popularidad la matriz de discos RAID-0, que NO es redundante.

¿Qué niveles de RAID existen y cuál debería elegir?

RAID-0. Normalmente se define como un grupo no redundante de unidades de disco sin paridad. A RAID-0 a veces se le llama "Striping" según la forma en que se coloca la información en las unidades incluidas en la matriz:

Dado que RAID-0 no tiene redundancia, la falla de una unidad provoca la falla de toda la matriz. Por otro lado, RAID-0 proporciona la máxima velocidad de transferencia de datos y un uso eficiente del espacio en el disco. Debido a que RAID-0 no requiere cálculos matemáticos o lógicos complejos, sus costos de implementación son mínimos.

Ámbito de aplicación: aplicaciones de audio y vídeo que requieren una transferencia continua de datos a alta velocidad, que no puede ser proporcionada por una sola unidad. Por ejemplo, una investigación realizada por Mylex para determinar la configuración óptima del sistema de disco para una estación de edición de video no lineal muestra que, en comparación con una sola unidad de disco, una matriz RAID-0 de dos unidades de disco proporciona un aumento del 96 % en escritura/lectura. velocidad, de tres unidades de disco, en un 143% (según la prueba de referencia Miro VIDEO EXPERT).
El número mínimo de unidades en una matriz "RAID-0" es 2.

RAID-1. Más conocido como "Duplicación" es un par de unidades que contienen la misma información y forman una unidad lógica:

La grabación se realiza en ambas unidades de cada par. Sin embargo, las unidades en un par pueden realizar operaciones de lectura simultáneas. Por lo tanto, la "duplicación" puede duplicar la velocidad de lectura, pero la velocidad de escritura permanece sin cambios. RAID-1 tiene 100% de redundancia y una falla de una unidad no provoca una falla de toda la matriz: el controlador simplemente cambia las operaciones de lectura/escritura a la unidad restante.
RAID-1 proporciona la velocidad más alta de todos los tipos de matrices redundantes (RAID-1 - RAID-5), especialmente en un entorno multiusuario, pero el peor uso del espacio en disco. Debido a que RAID-1 no requiere cálculos matemáticos o lógicos complejos, sus costos de implementación son mínimos.
El número mínimo de unidades en una matriz "RAID-1" es 2.
Para aumentar la velocidad de escritura y garantizar un almacenamiento de datos confiable, se pueden combinar varias matrices RAID-1 en RAID-0. Esta configuración se denomina RAID de “dos niveles” o RAID-10 (RAID 0+1):


El número mínimo de unidades en una matriz "RAID 0+1" es 4.
Ámbito de aplicación: matrices económicas en las que lo principal es la fiabilidad del almacenamiento de datos.

RAID-2. Distribuye datos en franjas del tamaño de sectores en un grupo de unidades de disco. Algunas unidades están dedicadas al almacenamiento ECC (código de corrección de errores). Dado que la mayoría de las unidades almacenan códigos ECC por sector de forma predeterminada, RAID-2 no ofrece muchos beneficios sobre RAID-3 y, por lo tanto, no se utiliza en la práctica.

RAID-3. Como en el caso de RAID-2, los datos se distribuyen en franjas de un sector de tamaño y una de las unidades de la matriz se asigna para almacenar información de paridad:

RAID-3 se basa en códigos ECC almacenados en cada sector para detectar errores. Si una de las unidades falla, la información almacenada en ella se puede restaurar calculando OR exclusivo (XOR) utilizando la información de las unidades restantes. Normalmente, cada registro se distribuye en todas las unidades y, por lo tanto, este tipo de matriz es buena para aplicaciones con uso intensivo de discos. Debido a que cada operación de E/S accede a todas las unidades de disco de la matriz, RAID-3 no puede realizar múltiples operaciones simultáneamente. Por lo tanto, RAID-3 es bueno para entornos de un solo usuario y una sola tarea con registros largos. Para trabajar con registros cortos, es necesario sincronizar la rotación de las unidades de disco, ya que de lo contrario es inevitable una disminución en la velocidad de intercambio. Raramente usado, porque inferior a RAID-5 en términos de uso de espacio en disco. La implementación requiere costos significativos.
El número mínimo de unidades en una matriz "RAID-3" es 3.

RAID-4. RAID-4 es idéntico a RAID-3 excepto que el tamaño de la franja es mucho mayor que un sector. En este caso, las lecturas se realizan desde una única unidad (sin contar la unidad que almacena información de paridad), por lo que se pueden realizar múltiples operaciones de lectura simultáneamente. Sin embargo, dado que cada operación de escritura debe actualizar el contenido de la unidad de paridad, no es posible realizar varias operaciones de escritura simultáneamente. Este tipo de matriz no tiene ventajas notables sobre una matriz RAID-5.
RAID-5. Este tipo de matriz a veces se denomina "matriz de paridad rotativa". Este tipo de matriz supera con éxito la desventaja inherente de RAID-4: la incapacidad de realizar múltiples operaciones de escritura simultáneamente. Esta matriz, como RAID-4, utiliza rayas grande en tamaño, pero, a diferencia de RAID-4, la información de paridad no se almacena en una unidad, sino en todas las unidades a su vez:

Las operaciones de escritura acceden a una unidad con datos y a otra unidad con información de paridad. Debido a que la información de paridad para diferentes franjas se almacena en diferentes unidades, no son posibles múltiples escrituras simultáneas a menos que la franja de datos o la franja de paridad estén en la misma unidad. Cuantas más unidades haya en la matriz, con menos frecuencia coincidirá la ubicación de las franjas de información y paridad.
Ámbito de aplicación: matrices fiables de gran volumen. La implementación requiere costos significativos.
El número mínimo de unidades en una matriz "RAID-5" es 3.

¿RAID-1 o RAID-5?
RAID-5, en comparación con RAID-1, utiliza espacio en disco de manera más económica, ya que, por motivos de redundancia, no almacena una "copia" de información, sino un número de cheque. Como resultado, RAID-5 puede combinar cualquier número de unidades, de las cuales sólo una contendrá información redundante.
Pero una mayor eficiencia del espacio en disco se produce a expensas de tasas de intercambio de información más bajas. Al escribir información en RAID-5, la información de paridad debe actualizarse cada vez. Para hacer esto, necesita determinar qué bits de paridad han cambiado. En primer lugar se lee la información antigua a actualizar. Luego, esta información se realiza mediante operación XOR con la nueva información. El resultado de esta operación es una máscara de bits en la que cada bit =1 significa que se debe reemplazar el valor de la información de paridad en la posición correspondiente. Luego, la información de paridad actualizada se escribe en la ubicación adecuada. Por lo tanto, para cada solicitud de programa para escribir información, RAID-5 realiza dos lecturas, dos escrituras y dos operaciones XOR.
Usar el espacio en disco de manera más eficiente (almacenar un bloque de paridad en lugar de una copia de los datos) tiene un costo: se requiere tiempo adicional para generar y escribir información de paridad. Esto significa que la velocidad de escritura en RAID-5 es menor que en RAID-1 en una proporción de 3:5 o incluso 1:3 (es decir, la velocidad de escritura en RAID-5 es de 3/5 a 1/3 de la velocidad de escritura). RAID-1). Debido a esto, no tiene sentido crear RAID-5 en software. Tampoco se pueden recomendar en casos en los que la velocidad de grabación sea crítica.

¿Qué método de implementación RAID debería elegir: software o hardware?

Después de leer las descripciones de los distintos niveles de RAID, notará que en ninguna parte se menciona ningún requisito de hardware específico necesario para implementar RAID. De lo cual podemos concluir que todo lo que se necesita para implementar RAID es conectar la cantidad requerida de unidades de disco al controlador disponible en la computadora e instalar un software especial en la computadora. Esto es cierto, ¡pero no del todo!
De hecho, es posible implementar RAID en software. Un ejemplo es el sistema operativo Microsoft Windows NT 4.0 Server, en el que es posible la implementación de software de RAID-0, -1 e incluso RAID-5 (la estación de trabajo Microsoft Windows NT 4.0 proporciona sólo RAID-0 y RAID-1). Sin embargo, esta solución debe considerarse extremadamente simplificada y no permite aprovechar plenamente las capacidades de la matriz RAID. Basta señalar que con la implementación del software RAID, toda la carga de colocar información en las unidades de disco, calcular códigos de control, etc. recae en el procesador central, lo que naturalmente no aumenta el rendimiento y la confiabilidad del sistema. Por las mismas razones, aquí prácticamente no hay funciones de servicio y todas las operaciones para reemplazar una unidad defectuosa, agregar una nueva unidad, cambiar el nivel RAID, etc. se llevan a cabo con pérdida total de datos y con una prohibición total de cualquier otra operación. . La única ventaja de la implementación de software RAID es su costo mínimo.
- un controlador especializado libera al procesador central de las operaciones RAID básicas, y la eficacia del controlador es más notable cuanto mayor es el nivel de complejidad del RAID;
- los controladores, por regla general, están equipados con controladores que le permiten crear RAID para casi cualquier sistema operativo popular;
- el BIOS integrado del controlador y los programas de gestión incluidos en él permiten al administrador del sistema conectar, desconectar o reemplazar fácilmente unidades incluidas en RAID, crear varias matrices RAID, incluso en diferentes niveles, monitorear el estado de la matriz de discos, etc. Con los controladores "avanzados", estas operaciones se pueden realizar "sobre la marcha", es decir. sin apagar la unidad del sistema. Muchas operaciones se pueden realizar en "segundo plano", es decir. sin interrumpir el trabajo actual e incluso de forma remota, es decir. desde cualquier lugar de trabajo (por supuesto, si tiene acceso);
- Los controladores pueden equiparse con una memoria intermedia ("caché"), en la que se almacenan los últimos bloques de datos, lo que, con un acceso frecuente a los mismos archivos, puede aumentar significativamente el rendimiento del sistema de disco.
La desventaja de la implementación de RAID por hardware es el costo relativamente alto de los controladores RAID. Sin embargo, por un lado, hay que pagar por todo (fiabilidad, rapidez, servicio). Por otro lado, recientemente, con el desarrollo de la tecnología de microprocesadores, el costo de los controladores RAID (especialmente los modelos más jóvenes) comenzó a caer drásticamente y se volvió comparable al costo de los controladores de disco comunes, lo que permite instalar sistemas RAID no solo en mainframes caros, pero también en servidores de nivel básico e incluso estaciones de trabajo.

¿Cómo elegir un modelo de controlador RAID?

Existen varios tipos de controladoras RAID según su funcionalidad, diseño y coste:
1. Controladores de unidades con funcionalidad RAID.
De hecho, se trata de un controlador de disco normal que, gracias a un firmware BIOS especial, permite combinar unidades de disco en una matriz RAID, normalmente de nivel 0, 1 o 0+1.

Controlador SCSI Ultra (Ultra Wide) de Mylex KT930RF (KT950RF).
Externamente, este controlador no se diferencia de un controlador SCSI normal. Toda la "especialización" se encuentra en el BIOS, que se divide en dos partes: "Configuración SCSI" / "Configuración RAID". A pesar de su bajo coste (menos de 200 dólares), este controlador tiene un buen conjunto de funciones:

- combinar hasta 8 unidades en RAID 0, 1 o 0+1;
- apoyo Repuesto caliente para el reemplazo sobre la marcha de una unidad de disco defectuosa;
- la capacidad de reemplazar automáticamente (sin intervención del operador) una unidad defectuosa;
- control automático de la integridad y la identidad de los datos (para RAID-1);
- presencia de una contraseña para acceder al BIOS;
- Programa RAIDPlus que proporciona información sobre el estado de las unidades en RAID;
- controladores para DOS, Windows 95, NT 3.5x, 4.0

El problema de aumentar la confiabilidad del almacenamiento de información y al mismo tiempo aumentar el rendimiento de un sistema de almacenamiento de datos ha estado en la mente de los desarrolladores de periféricos informáticos durante mucho tiempo. En cuanto al aumento de la fiabilidad del almacenamiento, todo está claro: la información es un bien y, a menudo, muy valioso. Para protegerse contra la pérdida de datos, se han inventado muchos métodos, el más famoso y confiable de los cuales es la copia de seguridad de la información.

La cuestión de aumentar el rendimiento del subsistema de disco es muy compleja. El crecimiento de la potencia informática de los procesadores modernos ha provocado un claro desequilibrio entre las capacidades de los discos duros y las necesidades de los procesadores. Al mismo tiempo, ni las costosas unidades SCSI, ni mucho menos las IDE, podrán salvarle. Sin embargo, si las capacidades de un disco no son suficientes, ¿quizás tener varios discos resuelva parcialmente este problema? Por supuesto, la mera presencia de dos o más discos duros en una computadora o servidor no cambia el asunto: es necesario hacer que estas unidades funcionen juntas (en paralelo) entre sí para mejorar el rendimiento del subsistema de disco en operaciones de escritura/lectura. Además, ¿es posible, mediante el uso de varios discos duros, mejorar no sólo el rendimiento, sino también la fiabilidad del almacenamiento de datos, de modo que el fallo de uno de los discos no provoque una pérdida de información? Este es exactamente el enfoque propuesto en 1987 por los investigadores estadounidenses Patterson, Gibson y Katz de la Universidad de California en Berkeley. En su artículo, "Un caso para matrices redundantes de discos económicos, RAID", describieron cómo se podían combinar múltiples discos duros de bajo costo en un solo dispositivo lógico, lo que daba como resultado una mayor capacidad y rendimiento del sistema, y ​​la falla de los discos individuales no conducir al fallo de todo el sistema.

Han pasado 15 años desde la publicación del artículo, pero la tecnología de construcción de matrices RAID no ha perdido su relevancia en la actualidad. Lo único que ha cambiado desde entonces es la decodificación de las siglas RAID. El hecho es que inicialmente las matrices RAID no se construyeron en discos baratos, por lo que la palabra Barato (económico) se cambió a Independiente (independiente), que era más cierto.

Además, es ahora cuando la tecnología RAID se ha generalizado.

Entonces, si hace apenas unos años las matrices RAID se usaban en costosos servidores de escala empresarial que usaban discos SCSI, hoy se han convertido en una especie de estándar de facto incluso para servidores de nivel básico. Además, el mercado de controladores RAID IDE se está expandiendo gradualmente, es decir, la tarea de construir matrices RAID en estaciones de trabajo utilizando discos IDE baratos se está volviendo urgente. Así, algunos fabricantes de placas base (Abit, Gigabyte) ya han comenzado a integrar controladores IDE RAID en las propias placas.

Entonces, RAID es una matriz redundante de discos independientes (Matrices redundantes de discos independientes), que tiene la tarea de garantizar la tolerancia a fallas y aumentar el rendimiento. La tolerancia a fallos se logra mediante la redundancia. Es decir, parte de la capacidad del espacio en disco se asigna para fines oficiales, quedando inaccesible para el usuario.

El mayor rendimiento del subsistema de discos está garantizado por el funcionamiento simultáneo de varios discos y, en este sentido, cuantos más discos haya en la matriz (hasta un cierto límite), mejor.

La operación conjunta de discos en una matriz se puede organizar mediante acceso paralelo o independiente.

Cabe señalar que el modelo de acceso paralelo se implementa solo si el tamaño de la solicitud de escritura de datos es mayor que el tamaño del bloque en sí. De lo contrario, es simplemente imposible realizar la grabación en paralelo de varios bloques.

Imaginemos una situación en la que el tamaño de un bloque individual es de 8 KB y el tamaño de la solicitud para escribir datos es de 64 KB. En este caso, la información fuente se divide en ocho bloques de 8 KB cada uno. Si tiene una matriz de cuatro discos, puede escribir cuatro bloques, o 32 KB, a la vez. Evidentemente, en el ejemplo considerado, las velocidades de escritura y lectura serán cuatro veces mayores que cuando se utiliza un solo disco. Sin embargo, esta situación es ideal, ya que el tamaño de la solicitud no siempre es un múltiplo del tamaño del bloque y la cantidad de discos en la matriz.

Si el tamaño de los datos registrados es menor que el tamaño del bloque, entonces se implementa un modelo de acceso fundamentalmente diferente: el acceso independiente. Además, este modelo también se puede implementar en el caso de que el tamaño de los datos escritos sea mayor que el tamaño de un bloque. Con el acceso independiente, todos los datos de una sola solicitud se escriben en un disco separado, es decir, la situación es idéntica a trabajar con un disco. La ventaja del modelo de acceso paralelo es que si llegan varias solicitudes de escritura (lectura) simultáneamente, todas se ejecutarán de forma independiente, en discos separados (Fig. 3). Una situación similar es típica, por ejemplo, en los servidores.

De acuerdo con los diferentes tipos de acceso, existen diferentes tipos de matrices RAID, que generalmente se caracterizan por niveles de RAID. Además del tipo de acceso, los niveles RAID difieren en la forma en que acomodan y generan información redundante. La información redundante se puede colocar en un disco especialmente asignado o distribuirse entre todos los discos. Hay varias formas más de generar esta información.

El más simple de ellos es la duplicación completa (100 por ciento de redundancia) o duplicación. Además, se utilizan códigos de corrección de errores, así como cálculos de paridad.

Niveles de RAID

El nivel RAID 0, estrictamente hablando, no es una matriz redundante y, en consecuencia, no proporciona un almacenamiento de datos confiable. Sin embargo, este nivel se usa ampliamente en los casos en que es necesario garantizar un alto rendimiento del subsistema de disco. Este nivel es especialmente popular en estaciones de trabajo. Al crear una matriz RAID de nivel 0, la información se divide en bloques, que se escriben en discos separados (Fig. 4), es decir, se crea un sistema con acceso paralelo (si, por supuesto, el tamaño del bloque lo permite). Al permitir E/S simultáneas desde múltiples discos, RAID 0 proporciona las velocidades de transferencia de datos más rápidas y la máxima eficiencia del espacio en disco porque no se requiere espacio de almacenamiento para las sumas de verificación. La implementación de este nivel es muy sencilla. RAID 0 se utiliza principalmente en áreas donde se requiere una transferencia rápida de grandes cantidades de datos.

RAID 1 (disco reflejado)

RAID Nivel 1 es una matriz de discos con 100 por ciento de redundancia. Es decir, los datos simplemente se duplican (reflejan) por completo, por lo que se logra un nivel muy alto de confiabilidad (así como de costo). Tenga en cuenta que para implementar el nivel 1, no es necesario particionar primero los discos y los datos en bloques. En el caso más simple, dos discos contienen la misma información y son un disco lógico (Fig. 5). Si un disco falla, sus funciones las realiza otro (lo cual es absolutamente transparente para el usuario).

Además, este nivel duplica la velocidad de lectura de información, ya que esta operación se puede realizar simultáneamente desde dos discos. Este esquema de almacenamiento de información se utiliza principalmente en los casos en que el costo de la seguridad de los datos es mucho mayor que el costo de implementar un sistema de almacenamiento.

RAID 2

Además, se calcula un código de corrección de errores (ECC) para cada palabra, que se escribe en discos dedicados para almacenar información de control (Fig. 6). Su número es igual al número de bits de la palabra de control y cada bit de la palabra de control se escribe en un disco independiente. La cantidad de bits en la palabra de control y, en consecuencia, la cantidad requerida de discos para almacenar información de control se calcula según la siguiente fórmula: donde K es la profundidad de bits de la palabra de datos.

Naturalmente, cuando se calcula utilizando la fórmula especificada, L se redondea al número entero más cercano. Sin embargo, para no meterse con las fórmulas, puede utilizar otra regla mnemotécnica: la profundidad de bits de la palabra de control está determinada por el número de bits necesarios para la representación binaria del tamaño de la palabra. Si, por ejemplo, el tamaño de la palabra es cuatro (en notación binaria 100), entonces para escribir este número en forma binaria se requieren tres dígitos, lo que significa que el tamaño de la palabra de control es tres. Por lo tanto, si hay cuatro discos para almacenar datos, se necesitarán tres discos más para almacenar los datos de control. De manera similar, si tiene siete discos para datos (en notación binaria 111), necesitará tres discos para almacenar palabras de control. Si se asignan ocho discos para datos (en notación binaria 1000), entonces se necesitan cuatro discos para la información de control.

El código Hamming que forma la palabra de control se basa en el uso de la operación bit a bit “OR exclusivo” (XOR) (también llamada “disparidad”).

Recuerde que la operación lógica XOR da uno si los operandos no coinciden (0 y 1) y cero si coinciden (0 y 0 o 1 y 1).

La palabra de control en sí, obtenida utilizando el algoritmo de Hamming, es la inversión del resultado de la operación OR exclusiva bit a bit de los números de aquellos bits de información de la palabra cuyos valores son iguales a 1. A modo de ilustración, considere la palabra original 1101. En el primero (001), tercero (011) y cuarto (100) los dígitos de esta palabra valen uno.

Al leer los datos, el código Hamming se calcula nuevamente y se compara con el código fuente. Para comparar dos códigos, se utiliza una operación "OR exclusiva" bit a bit. Si el resultado de la comparación en todos los bits es cero, entonces la lectura es correcta; de lo contrario, su valor es el número del bit del código principal recibido erróneamente. Por ejemplo, supongamos que la palabra fuente sea 1.100.000. Dado que los unos están en las posiciones sexta (110) y séptima (111), la palabra de control es:

Si durante la lectura se registra la palabra 1100100, entonces la palabra de control correspondiente es igual a 101. Comparando la palabra de control original con la recibida (operación OR exclusiva bit a bit), tenemos:

es decir, un error de lectura en la tercera posición.

En consecuencia, sabiendo exactamente qué bit es erróneo, se puede corregir fácilmente sobre la marcha.

RAID 2 es uno de los pocos niveles que le permite no solo corregir errores individuales sobre la marcha, sino también detectar errores dobles. Además, es el más redundante de todos los niveles con códigos de corrección. Este esquema de almacenamiento de datos rara vez se utiliza porque no responde bien a una gran cantidad de solicitudes, es complejo de organizar y tiene pequeñas ventajas sobre el nivel RAID 3.

RAID 3

RAID Nivel 3 es una matriz tolerante a fallas con E/S paralelas y un disco adicional en el que se escribe información de control (Figura 7). Al escribir, el flujo de datos se divide en bloques a nivel de bytes (aunque posiblemente a nivel de bits) y se escribe simultáneamente en todos los discos de la matriz, excepto en el que está asignado para almacenar información de control. Para calcular la información de control (también llamada suma de verificación), se aplica una operación exclusiva o (XOR) a los bloques de datos que se escriben. Si algún disco falla, los datos que contiene se pueden restaurar utilizando los datos de control y los datos que quedan en los discos en buen estado.

A modo de ilustración, consideremos bloques de cuatro bits. Deje que haya cuatro discos para almacenar datos y un disco para registrar sumas de verificación. Si hay una secuencia de bits 1101 0011 1100 1011, dividida en bloques de cuatro bits, entonces para calcular la suma de verificación es necesario realizar la operación:

Por tanto, la suma de comprobación escrita en el quinto disco es 1001.

Si uno de los discos, por ejemplo el tercero, falla, entonces el bloque 1100 no estará disponible para lectura. Sin embargo, su valor se puede restaurar fácilmente usando la suma de verificación y los valores de los bloques restantes, usando la misma operación “OR exclusiva”:

Bloque 3=Bloque 1Bloque 2Bloque 4

Suma de comprobación.

En nuestro ejemplo obtenemos:

Bloque 3=1101001110111001= 1100.

RAID Nivel 3 tiene mucha menos redundancia que RAID 2. Al dividir los datos en bloques, RAID 3 tiene un alto rendimiento. Al leer información, no se accede al disco con sumas de verificación (a menos que haya una falla), lo que sucede cada vez que ocurre una operación de escritura. Dado que cada operación de E/S accede prácticamente a todos los discos de la matriz, no es posible procesar varias solicitudes simultáneamente. Este nivel es adecuado para aplicaciones con archivos grandes y baja frecuencia de acceso. Además, las ventajas de RAID 3 incluyen una ligera disminución del rendimiento en caso de fallo y una rápida recuperación de la información.

RAID 4

RAID Nivel 4 es una matriz tolerante a fallas de discos independientes con una unidad para almacenar sumas de verificación (Figura 8). RAID 4 es similar en muchos aspectos a RAID 3, pero se diferencia de este último principalmente en el tamaño de bloque significativamente mayor de los datos que se escriben (más grande que el tamaño de los datos que se escriben).

Ésta es la principal diferencia entre RAID 3 y RAID 4. Después de escribir un grupo de bloques, se calcula una suma de comprobación (de la misma forma que en el caso de RAID 3), que se escribe en el disco asignado para este fin. Con un tamaño de bloque mayor que RAID 3, se pueden realizar múltiples operaciones de lectura simultáneamente (diseño de acceso independiente).

RAID 4 mejora el rendimiento de las transferencias de archivos pequeños (al paralelizar la operación de lectura). Pero como la grabación debe calcular la suma de comprobación en el disco asignado, aquí las operaciones simultáneas son imposibles (hay una asimetría entre las operaciones de entrada y salida). El nivel considerado no ofrece ventajas de velocidad al transferir grandes cantidades de datos. Este esquema de almacenamiento fue diseñado para aplicaciones en las que los datos se dividen inicialmente en pequeños bloques, por lo que no es necesario dividirlos más. RAID 4 es una buena solución para servidores de archivos donde la información se lee principalmente y rara vez se escribe. Este esquema de almacenamiento de datos tiene un bajo costo, pero su implementación es bastante compleja, al igual que la recuperación de datos en caso de falla.

El nivel RAID 5 es una matriz tolerante a fallas de discos independientes con almacenamiento de suma de verificación distribuido (Fig. 9). Los bloques de datos y las sumas de verificación, que se calculan de la misma manera que en RAID 3, se escriben cíclicamente en todos los discos de la matriz, es decir, no hay un disco dedicado para almacenar información de la suma de verificación.

En el caso de RAID 5, todos los discos de la matriz tienen el mismo tamaño, pero la capacidad total del subsistema de discos disponible para escritura se reduce exactamente en un disco.

Por ejemplo, si cinco discos tienen un tamaño de 10 GB, entonces el tamaño real de la matriz es de 40 GB, ya que se asignan 10 GB para información de control.

RAID 5, como RAID 4, tiene una arquitectura de acceso independiente, es decir, a diferencia de RAID 3, proporciona un gran tamaño de bloques lógicos para almacenar información. Por lo tanto, como en el caso de RAID 4, dicha matriz proporciona el principal beneficio al procesar varias solicitudes simultáneamente.

La principal diferencia entre RAID 5 y RAID 4 es la forma en que se colocan las sumas de verificación.

La presencia de un disco separado (físico) que almacena información sobre las sumas de verificación, aquí, como en los tres niveles anteriores, lleva al hecho de que las operaciones de lectura que no requieren acceso a este disco se realizan a alta velocidad. Sin embargo, cada operación de escritura cambia la información en el disco de control, por lo que RAID 2, RAID 3 y RAID 4 no permiten escrituras paralelas.

RAID 5 no tiene esta desventaja porque las sumas de comprobación se escriben en todos los discos de la matriz, lo que permite realizar múltiples lecturas o escrituras simultáneamente.

Implementación práctica

Una característica distintiva de los controladores RAID es la cantidad de canales admitidos para conectar discos duros. Aunque se pueden conectar varias unidades SCSI a un canal del controlador, el rendimiento total de la matriz RAID estará limitado por el rendimiento de un canal, que corresponde al rendimiento de la interfaz SCSI. Por tanto, el uso de múltiples canales puede mejorar significativamente el rendimiento del subsistema de disco.

Cuando se utilizan controladores IDE RAID, el problema multicanal se vuelve aún más grave, ya que dos discos duros conectados a un canal (la interfaz en sí no admite más unidades) no pueden proporcionar un funcionamiento en paralelo: la interfaz IDE le permite acceder solo a una unidad a la vez. tiempo . Por lo tanto, los controladores IDE RAID deben ser al menos de doble canal.

También hay controladores de cuatro e incluso ocho canales.

La función principal de una matriz RAID no es aumentar la capacidad del subsistema de disco (como puede verse por su diseño, se puede obtener la misma capacidad por menos dinero), sino garantizar un almacenamiento de datos confiable y aumentar el rendimiento.

Para los servidores, además, existe el requisito de un funcionamiento ininterrumpido, incluso si falla una de las unidades. El funcionamiento ininterrumpido se garantiza mediante el intercambio en caliente, es decir, retirando un disco SCSI defectuoso e instalando uno nuevo sin apagar la alimentación. Debido a que el subsistema de disco permanece operativo (excepto en el nivel 0) cuando falla una unidad, el intercambio en caliente proporciona una recuperación transparente para los usuarios. Sin embargo, la velocidad de transferencia y la velocidad de acceso con un disco que no funciona se reducen notablemente debido a que el controlador debe recuperar datos de información redundante. Es cierto que hay una excepción a esta regla: los sistemas RAID de niveles 2, 3, 4, cuando falla una unidad con información redundante, ¡comienzan a funcionar más rápido! Esto es natural, ya que en este caso el nivel "sobre la marcha" cambia a cero, lo que tiene excelentes características de velocidad.


Hasta ahora, este artículo ha tratado sobre soluciones de hardware. Pero Microsoft también ofrece software, por ejemplo, para Windows 2000 Server. Sin embargo, en este caso, algunos ahorros iniciales quedan completamente neutralizados por la carga adicional en el procesador central, que, además de su trabajo principal, se ve obligado a distribuir datos entre discos y calcular sumas de verificación. Esta solución sólo puede considerarse aceptable en el caso de un exceso significativo de potencia informática y una baja carga del servidor.

Serguéi Pajomov

ComputadoraPrensa 3"2002

Y así sucesivamente, así sucesivamente, así sucesivamente. Entonces, hoy hablaremos de matrices RAID basadas en ellos.

Como sabes, estos mismos discos duros también tienen un cierto margen de seguridad a partir del cual fallan, así como características que afectan el rendimiento.

Seguro que también sabes (y si no lo sabes, no importa) que estos arrays tienen diferentes números de serie (0, 1, 2, 3, 4, etc.), y además realizan funciones completamente distintas. Este fenómeno realmente ocurre en la naturaleza y, como ya habrás adivinado, son estas mismas matrices RAID de las que quiero hablarte en este artículo. Más precisamente ya os lo digo ;)

Vamos.

¿Qué es RAID y por qué es necesario?

RAID es una matriz de discos (es decir, un complejo o, si se prefiere, un paquete) de varios dispositivos: discos duros. Como dije anteriormente, esta matriz sirve para aumentar la confiabilidad del almacenamiento de datos y/o para aumentar la velocidad de lectura/escritura de información (o ambas).

En realidad, lo que hace exactamente este grupo de discos, es decir, acelerar el trabajo o aumentar la seguridad de los datos, depende de usted, o más precisamente, de la elección de la configuración actual de las incursiones. Los diferentes tipos de estas configuraciones están marcados con diferentes números: 1, 2, 3, 4 y, en consecuencia, realizan diferentes funciones.

Es solo que, por ejemplo, si construye la versión 0 (descripción de las variaciones 0, 1, 2, 3, etc., lea a continuación), obtendrá un aumento notable en la productividad. Y, en general, el disco duro hoy en día es solo un canal estrecho en el rendimiento del sistema.

¿Por qué sucedió esto en general?

Los discos duros solo están creciendo en volumen, porque la velocidad de rotación del cabezal de ellos (con la excepción de modelos raros como Raptor) se ha congelado durante bastante tiempo en alrededor de 7200, el caché tampoco está creciendo exactamente, la arquitectura sigue siendo casi la misma. .

En general, en términos de rendimiento, los discos están estancados (la situación solo se puede salvar mediante el desarrollo), pero juegan un papel importante en el funcionamiento del sistema y, en algunos lugares, en las aplicaciones completas.

En el caso de crear un solo raid (en el sentido del número 1), perderá un poco de rendimiento, pero recibirá una garantía tangible de la seguridad de sus datos, porque estarán completamente duplicados y, de hecho, Incluso si falla un disco, todo estará completamente en el segundo sin pérdidas.

En general, repito, las incursiones serán de utilidad para todos. Incluso diría que son obligatorios :)

¿Qué es RAID en el sentido físico?

Físicamente, una matriz RAID consta de dos a n números de discos duros conectados que admiten la capacidad de crear RAID (o a un controlador apropiado, que es menos común porque son costosos para el usuario promedio (los controladores generalmente se usan en servidores debido a su mayor confiabilidad y rendimiento)), es decir, .e. A simple vista, nada cambia dentro de la unidad del sistema; simplemente no hay conexiones innecesarias ni conexiones de discos entre sí ni con ninguna otra cosa.

En general, todo en el hardware es casi igual que siempre, y solo cambia el enfoque del software, que, de hecho, establece, al seleccionar el tipo de raid, exactamente cómo deben funcionar los discos conectados.

Programáticamente, en el sistema, después de crear una incursión, tampoco aparecen peculiaridades especiales. De hecho, toda la diferencia entre trabajar con un raid radica únicamente en el pequeño entorno que realmente organiza el raid (ver más abajo) y en el uso del conductor. De lo contrario, TODO es absolutamente igual: en "Mi PC" hay las mismas unidades C, D y otras, todas las mismas carpetas, archivos... En general y en software, a simple vista, son completamente idénticos.

Instalar la matriz no es difícil: simplemente tomamos una placa base que admita la tecnología RAID, tomamos dos completamente idénticas, ¡esto es importante! , - tanto según las características (tamaño, caché, interfaz, etc.) como según el fabricante y modelo del disco y conéctelos a esta placa base. A continuación, simplemente encienda la computadora, vaya al BIOS y configure el parámetro Configuración SATA: RAID.

Después de eso, durante el proceso de inicio de la computadora (generalmente antes del inicio de Windows), aparece un panel que muestra información sobre los discos en el raid y fuera de él, donde, de hecho, debe presionar CTR-I para configurar el raid (agregar discos a eliminarlo, eliminarlo, etc., etc.). En realidad, eso es todo. Luego hay otras alegrías de la vida, es decir, nuevamente, todo es como siempre.

Nota importante para recordar

Al crear o eliminar una incursión (esto no se aplica a la primera incursión, pero esto no es un hecho), toda la información de los discos se elimina inevitablemente y, por lo tanto, claramente no vale la pena simplemente realizar un experimento, crear y eliminar. varias configuraciones. Por lo tanto, antes de crear una incursión, primero guarde toda la información necesaria (si la tiene) y luego experimente.

En cuanto a las configuraciones... Como ya dije, existen varios tipos de matrices RAID (al menos desde la base principal, esta es RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6). Para empezar, hablaré de dos de los más comprensibles y populares entre los usuarios habituales:

  • RAID 0: matriz de discos para aumentar la velocidad de escritura.
  • RAID 1: matriz de discos reflejados.

Y al final del artículo repasaré rápidamente los demás.

RAID 0: ¿qué es y para qué sirve?

Y así... RAID 0 (también conocido como Striping): utiliza de dos a cuatro (más, menos a menudo) discos duros que procesan información de forma conjunta, lo que aumenta el rendimiento. Para que quede claro, llevar bolsas para una persona lleva más tiempo y es más difícil que para cuatro personas (aunque las bolsas siguen siendo las mismas en sus propiedades físicas, sólo cambian los poderes que interactúan con ellas). Mediante programación, la información sobre una incursión de este tipo se divide en bloques de datos y se escribe en ambos o varios discos por turno.

Un bloque de datos en un disco, otro bloque de datos en otro, y así sucesivamente. Esto aumenta significativamente el rendimiento (la cantidad de discos determina el aumento del rendimiento, es decir, 4 discos funcionarán más rápido que dos), pero la seguridad de los datos en toda la matriz se ve afectada. Si alguno de los discos duros incluidos en dicho RAID falla, toda la información se pierde casi por completo e irremediablemente.

¿Por qué? El hecho es que cada archivo consta de un cierto número de bytes... cada uno de los cuales contiene información. Pero en una matriz RAID 0, los bytes de un archivo se pueden ubicar en varios discos. En consecuencia, si uno de los discos "muere", se perderá una cantidad arbitraria de bytes del archivo y será simplemente imposible recuperarlo. Pero hay más de un archivo.

En general, cuando se utiliza una matriz raid de este tipo, se recomienda almacenar permanentemente información valiosa en medios externos. El raid realmente proporciona una velocidad notable; te lo digo por experiencia propia, porque tengo tanta felicidad instalada en casa durante años.

RAID 1: ¿qué es y para qué se utiliza?

En cuanto a RAID 1 (Duplicación - “espejo”)... En realidad, comenzaré con el inconveniente. A diferencia de RAID 0, resulta que "pierde" el espacio del segundo disco duro (se usa para escribir una copia completa (byte por byte) del primer disco duro, mientras que RAID 0 este espacio es completamente disponible).

La ventaja, como ya entendiste, es que tiene una alta confiabilidad, es decir, todo funciona (y todos los datos existen en la naturaleza y no desaparecen cuando falla uno de los dispositivos) siempre que al menos un disco esté funcionando, es decir. Incluso si destruyes aproximadamente un disco, no perderás ni un solo byte de información, porque el segundo es una copia pura del primero y lo reemplaza cuando falla. Este tipo de raid se utiliza a menudo en servidores debido a la increíble viabilidad de los datos, lo cual es importante.

Con este enfoque, se sacrifica el rendimiento y, según mi opinión personal, es incluso menor que cuando se utiliza un disco sin raids. Sin embargo, para algunos, la confiabilidad es mucho más importante que el rendimiento.

RAID 2, 3, 4, 5, 6: ¿qué son y para qué se utilizan?

La descripción de estas matrices está aquí tanto como sea posible, es decir. puramente como referencia, e incluso entonces en forma comprimida (de hecho, solo se describe el segundo). ¿Por qué es así? Al menos por la baja popularidad de estos arrays entre el usuario medio (y, en general, entre cualquier otro) y, como consecuencia, mi poca experiencia en su uso.

RAID 2 está reservado para matrices que utilizan algún tipo de código Hamming (no estaba interesado en qué era, así que no te lo diré). El principio de funcionamiento es aproximadamente el siguiente: los datos se escriben en los dispositivos correspondientes de la misma manera que en RAID 0, es decir, se dividen en pequeños bloques en todos los discos que participan en el almacenamiento de información.

Los discos restantes (especialmente asignados para este propósito) almacenan códigos de corrección de errores, que pueden usarse para restaurar información si falla algún disco duro. Entonces, en matrices de este tipo, los discos se dividen en dos grupos: para datos y para códigos de corrección de errores.

Por ejemplo, tiene dos discos que proporcionan espacio para el sistema y los archivos, y dos más estarán completamente dedicados a corregir datos en caso de que los dos primeros discos fallen. En esencia, esto es algo así como una incursión cero, solo que con la capacidad de, al menos de alguna manera, guardar información en caso de falla de uno de los discos duros. Rara vez es caro: cuatro discos en lugar de dos con un aumento de seguridad muy controvertido.

RAID 3, 4, 5, 6... Acerca de ellos, por extraño que pueda parecer en las páginas de este sitio, intente leer sobre ellos en Wikipedia. El hecho es que en mi vida me he encontrado con estas matrices muy raramente (excepto que la quinta llegó a mis manos con más frecuencia que otras) y no puedo describir con palabras accesibles los principios de su funcionamiento, y no quiero reimprimir en absoluto artículo del recurso propuesto anteriormente, al menos debido a la presencia de formulaciones exasperantes en estos, que incluso yo apenas puedo entender.

¿Qué RAID debería elegir?

Si juegas, copias música y películas con frecuencia o instalas programas que consumen muchos recursos, entonces RAID 0 te resultará útil. Pero tenga cuidado al elegir los discos duros (en este caso su calidad es especialmente importante) o asegúrese de realizar copias de seguridad en medios externos.

Si trabaja con información valiosa, cuya pérdida equivale a la muerte, entonces definitivamente necesita RAID 1; es extremadamente difícil perder información con él.

Repito que es muy deseable que los discos instalados en la matriz RAID sean idénticos. Tamaño, marca, serie, tamaño de caché: preferiblemente todo debería ser igual.

Epílogo

Así son las cosas.

Por cierto, escribí cómo montar este milagro en el artículo: " Cómo crear una matriz RAID usando métodos estándar", y sobre un par de parámetros en el material " RAID 0 de dos SSD: pruebas prácticas con Read Ahead y Read Cache". Utilice la búsqueda.

Espero sinceramente que este artículo te sea de utilidad y que definitivamente te hagas una incursión de un tipo u otro. Créame, vale la pena.

Si tiene preguntas sobre cómo crearlos y configurarlos, en general, puede comunicarse conmigo en los comentarios; intentaré ayudarlo (si hay instrucciones para su placa base en línea). También estaré encantado de recibir adiciones, deseos, pensamientos y todo eso.

hacer una solicitud

Descripción de matrices RAID (,)

Descripción de RAID 0


Matriz de discos de alto rendimiento sin tolerancia a fallos
Matriz de discos seccionados sin tolerancia a fallos

RAID 0 es el más potente y menos seguro de todos los RAID. Los datos se dividen en bloques proporcionales a la cantidad de discos, lo que genera un mayor rendimiento. El alto rendimiento de esta estructura está garantizado por la grabación paralela y la ausencia de copias redundantes. La falla de cualquier unidad de la matriz resulta en la pérdida de todos los datos. Este nivel se llama franjas.

Ventajas:
- · mayor rendimiento para aplicaciones que requieren un procesamiento intensivo de solicitudes de E/S y grandes volúmenes de datos;
- · facilidad de implementación;
- · bajo coste por unidad de volumen.
Defectos:
- · no es una solución tolerante a fallos;
- · el fallo de un disco conlleva la pérdida de todos los datos de la matriz.

Descripción de RAID 1


Matriz de discos redundantes o reflejados
Duplicación y duplicación
RAID 1 - duplicación - duplicación de dos discos. La redundancia de la estructura de esta matriz garantiza su alta tolerancia a fallos. La matriz se caracteriza por su alto costo y baja productividad.

Ventajas:
- · facilidad de implementación;
- · facilidad de recuperación de la matriz en caso de fallo (copia);
- · rendimiento suficientemente alto para aplicaciones con alta intensidad de demanda.
Defectos:
- · alto costo por unidad de volumen - 100% de redundancia;
- · baja velocidad de transferencia de datos.

Descripción de RAID 2


Matriz de discos tolerante a fallos mediante código Hamming
Código Hamming ECC
RAID 2: utiliza el código Hamming ECC. Los códigos le permiten corregir fallas simples y detectar fallas dobles.

Ventajas:
- · corrección rápida de errores (“sobre la marcha”);
- muy alta velocidad de transferencia de grandes cantidades de datos;
- · a medida que aumenta el número de discos, disminuyen los gastos generales;
- · implementación bastante simple.
Defectos:
- · alto costo con una pequeña cantidad de discos;
- · baja velocidad de procesamiento de solicitudes (no adecuado para sistemas orientados a transacciones).

Descripción de RAID 3


Matriz tolerante a fallas con transferencia de datos en paralelo y paridad
Discos de transferencia paralela con paridad

RAID 3: los datos se almacenan utilizando el principio de división a nivel de bytes con una suma de verificación (CS) en uno de los discos. La matriz no tiene el problema de cierta redundancia como en el nivel RAID 2. Los discos de suma de comprobación utilizados en RAID 2 son necesarios para detectar cargos erróneos. Sin embargo, la mayoría de los controladores modernos pueden determinar cuándo un disco ha fallado mediante señales especiales o codificación adicional de información escrita en el disco y utilizada para corregir fallas aleatorias.

Ventajas:
- velocidad de transferencia de datos muy alta;
- · la falla del disco tiene poco efecto en la velocidad de la matriz;
- · bajos gastos generales para implementar la redundancia.
Defectos:
- · difícil implementación;
- · bajo rendimiento con solicitudes de alta intensidad para datos pequeños.

Los entusiastas tienen una regla no escrita: el disco duro Western Digital WD1500 Raptor Es el modelo de escritorio ideal si necesitas el máximo rendimiento. Pero no todos los usuarios pueden seguir este camino, ya que gastar 240 dólares en un disco duro con una capacidad de sólo 150 GB no es una solución muy atractiva. ¿Sigue siendo el Raptor la mejor opción? El precio no ha cambiado durante muchos meses y hoy por esa cantidad de dinero puedes comprar fácilmente un par de unidades de 400 GB. ¿No es hora de comparar el rendimiento de las matrices RAID modernas con Raptor?

Los entusiastas conocen los discos duros Raptor porque es el único disco duro de escritorio de 3,5" que gira a 10.000 rpm. La mayoría de los discos duros de este sector del mercado giran a 7.200 rpm. Sólo los discos duros de alta gama para servidores giran más rápido. Discos duros WD Raptor de 36 y 74 GB fueron introducidos hace tres años. Hace aproximadamente un año entró en el mercado. Western Digital Raptor-X, que proporciona un mayor rendimiento, los modelos también están disponibles con una cubierta transparente que permite ver el interior del disco duro.

Después de su lanzamiento, los discos duros Western Digital Raptor superaron a todos los demás discos duros Serial ATA de 3,5" para PC de escritorio, aunque inicialmente estaban posicionados para servidores de bajo costo.

Una velocidad de husillo de 10.000 rpm ofrece dos ventajas importantes. En primer lugar, la velocidad de transferencia de datos aumenta notablemente. Sí, la velocidad máxima de lectura secuencial no es particularmente impresionante, pero la velocidad mínima es muy superior a la de cualquier disco duro de 7200 RPM. Además, un disco duro de 10.000 RPM tiene menos latencia de giro, lo que significa que el disco tarda menos en adquirir datos una vez que se colocan los cabezales de lectura/escritura.

La principal desventaja del WD Raptor es el precio: unos 240 dólares para el modelo de 150 GB. Entre otras desventajas, destacamos un mayor nivel de ruido (aunque no crítico) y una mayor generación de calor. Sin embargo, los entusiastas tolerarán fácilmente tales deficiencias si este disco duro proporciona un mayor rendimiento del subsistema de almacenamiento.

Si calcula el costo de almacenar un gigabyte de datos, Raptor ya no será tan atractivo. Por $240 puedes conseguir un par de discos duros de 400 GB, y el nivel de $300 por un Seagate Barracuda 7200.10 de 750 GB no está muy lejos. Si nos fijamos en el segmento de gama baja, puedes conseguir un par de discos duros de 160 GB a 7200 RPM por 50 dólares cada uno, que proporcionarán la misma capacidad que el Raptor, pero a más de la mitad del precio. Por eso, hoy en día incluso los entusiastas se preguntan a menudo: ¿vale la pena llevarse el WD Raptor, no es mejor elegir una configuración RAID 0 en dos discos duros de 7.200 rpm?

RAID 0 no reduce el tiempo de acceso, pero casi duplica la velocidad de lectura secuencial porque los datos se distribuyen en dos discos duros. La desventaja es el mayor riesgo de pérdida de datos, ya que si falla un disco duro, se perderá toda la matriz (sin embargo, hoy en día también existen opciones Recuperación de información RAID). Muchos controladores integrados en placas base de alta gama admiten modos RAID, que son fáciles de configurar e instalar.

¿Disco duro rápido o inteligente?

Actuación Capacidad Seguridad del almacenamiento de datos Precio
Un disco duro (7200 rpm) bien Regular a excelente Suficiente * De menor a mayor, de $50 a $300
WD Raptor de 150 GB (10.000 rpm) Excelente Suficiente Suficiente * Alto: $240+
2x 160 GB (7200 rpm) Muy bueno a excelente Bueno a excelente Insuficiente * De menor a mayor: $50 por HDD
2x WD Raptor de 150 GB (10.000 rpm) Excelente bien Insuficiente * De mayor a muy alto: $240 por unidad

* Cabe recordar que cualquier disco duro tarde o temprano fallará. La tecnología se basa en componentes mecánicos y su vida útil es limitada. Los fabricantes indican el tiempo entre fallos (MTBF, tiempo medio entre fallos) para los discos duros. Si instaló una matriz RAID 0 en dos discos duros de 7200 rpm, entonces el riesgo de pérdida de datos se duplica porque si falla un disco duro, perderá toda la matriz RAID 0. Por lo tanto, haga copias de seguridad de los datos importantes con regularidad y cree una imagen de la matriz. Sistema operativo.

Hoy en día, puede comprar discos duros de 40 a 80 GB por casi unos centavos y, si no tiene requisitos especiales de capacidad, este volumen será suficiente incluso hoy. Sin embargo, recomendamos comprar discos duros con precios entre 50 y 70 dólares, ya que puedes conseguir fácilmente modelos con capacidades que oscilan entre 120 y 200 GB. Ya han comenzado a aparecer en las tiendas online modelos de 250 y 320 GB a un precio inferior a los 100 dólares. Por el dinero que gasta en un WD Raptor de 10,000 RPM, puede obtener fácilmente de 800 GB a 1 TB de capacidad en discos duros de 7200 RPM.

Si no necesita una capacidad tan alta, puede conformarse con discos duros básicos de 7200 RPM. Dos unidades WD1600AAJS de Western Digital cuestan $55 cada una y puede obtener fácilmente 320 GB de capacidad en una matriz RAID 0. Gastará la mitad del dinero y obtendrá el doble de capacidad. ¿Qué tan justificados están tales ahorros? Vamos a resolverlo.

¿7.200 o 10.000 rpm? ¿RAID 0 o Raptor?

Decidimos probar diferentes configuraciones de disco duro. Nuestras pruebas involucran un solo WD Raptor WD1500ADFD, un solo WD4000KD, un Raptor en RAID 0 y un WD4000 en RAID 0. Decidimos usar discos duros WD de 400 GB a 7200 RPM, ya que dos de estos discos tienen aproximadamente el mismo precio que un Raptor. Veamos qué tan bien se desempeña una matriz RAID "económica" en comparación con un solo Raptor.

El WD4000KD está equipado con 16 MB de caché y tiene una interfaz Serial ATA/150. La principal diferencia con el WD Raptor de 10.000 rpm es el rendimiento y la capacidad. El Raptor tiene un costo significativo por gigabyte de almacenamiento, que es al menos seis veces mayor que el WD4000KD de 400 GB. Las pruebas mostrarán cuán grandes son las diferencias de rendimiento. En el momento de esta publicación, el precio del WD4000KD Caviar era de 130 dólares.

El Raptor es el campeón indiscutible en rendimiento en el mercado de las computadoras de escritorio, pero también es el disco duro más caro. El WD1500 Raptor utiliza una interfaz Serial ATA/150, que sigue siendo suficiente. Si nos fijamos en los resultados de las pruebas, ningún otro disco duro puede superar al Raptor, ni siquiera con una interfaz SATA de 300 MB/s. En general, la velocidad de la interfaz SATA no debe influir en su decisión de compra. En el momento de esta publicación, el precio del WD1500ADFD Raptor era de 240 dólares.

Esta configuración debería ser compatible con el WD1500 Raptor. ¿Pueden dos discos duros WD4000KD en una matriz RAID 0 vencer al Raptor?

Este escenario es el más caro de nuestras pruebas porque requiere dos discos duros WD Raptor, pero sigue siendo muy interesante. Dos discos duros Raptor de 10.000 rpm en una matriz RAID 0 literalmente deberían destruir a todos.

RAID 0

Actuación

En teoría, RAID 0 es ideal para aumentar el rendimiento porque la velocidad de transferencia de datos secuencial aumenta casi linealmente con la cantidad de discos duros en la matriz. Los archivos se distribuyen bloque por bloque en todos los discos duros, es decir, el controlador RAID escribe datos casi simultáneamente en varios discos duros. Las velocidades de transferencia de datos RAID 0 aumentan notablemente en casi todos los escenarios, aunque los tiempos de acceso no disminuyen. En pruebas del mundo real, los tiempos de acceso en matrices RAID 0 incluso aumentan, aunque muy ligeramente, aproximadamente medio milisegundo.

Si crea una configuración RAID en varios discos duros, el controlador de la unidad puede convertirse en el cuello de botella. Un bus PCI normal puede transferir un máximo de 133 MB/s, que es fácilmente absorbido por dos discos duros modernos. Los controladores Serial ATA que se incluyen en el chipset generalmente proporcionan un mayor rendimiento, por lo que no limitan el rendimiento de las matrices RAID.

tenemos hasta 350 MB/s en cuatro discos duros WD Raptor con 10.000 rpm en conjuntos de chips con puentes sur Intel ICH7 e ICH8. Un resultado excelente que se acerca mucho al rendimiento total de cuatro discos duros independientes. Al mismo tiempo, el chipset nVidia nForce 680 mostró un máximo de 110 MB/s, por desgracia. Parece que no todos los controladores RAID integrados son capaces de proporcionar matrices RAID de alto rendimiento, aunque técnicamente sea posible.

Comparación de modos RAID

Cabe señalar que RAID 0 realmente no cubre la idea de matrices RAID, que significan matrices redundantes de unidades independientes/económicas. Redundancia significa almacenar datos en al menos dos lugares para que sobrevivan incluso si falla un disco duro. Esto es lo que ocurre, por ejemplo, en el caso de una matriz RAID 1, en la que todos los datos se reflejan en un segundo disco duro. Si uno de los discos duros "muera", sólo lo sabrá por los mensajes del controlador RAID. RAID 5 es mucho más complejo y está dirigido al sector profesional. Funciona como una matriz RAID 0, distribuyendo datos entre todos los discos duros, pero con información de redundancia agregada a los datos. Por lo tanto, la capacidad neta de una matriz RAID 5 es igual a la capacidad total de todos los discos duros excepto uno. La información de redundancia no se escribe en un disco duro (como en el caso de RAID 3), sino que se distribuye entre todas las unidades para no crear un cuello de botella al leer o escribir información de redundancia en un disco duro. Una matriz RAID 5, como es comprensible, requiere al menos tres discos duros.

Riesgos y efectos secundarios.

El principal peligro de una matriz RAID 0 es el fallo de cualquier disco duro, ya que se pierde toda la matriz. Es por eso que cuantos más discos haya en una matriz RAID 0, mayor será el riesgo de perder información. Si se utilizan tres discos duros, la probabilidad de perder información es tres veces mayor que con un solo disco. Es por eso que RAID 0 no es una buena opción para los usuarios que necesitan un sistema confiable y no pueden permitirse ni un minuto de inactividad.

Incluso si compra un controlador RAID independiente, potente y costoso, seguirá dependiendo del hardware. Dos controladores diferentes pueden admitir RAID 5, pero la implementación específica puede ser muy diferente.



Intel Matrix RAID: puede crear diferentes matrices RAID en el mismo conjunto de discos duros.

Si el controlador RAID es lo suficientemente inteligente, puede permitir que se instalen dos o más matrices RAID en un conjunto de discos duros. Aunque cada controlador RAID puede admitir múltiples matrices RAID, esto generalmente requiere diferentes conjuntos de discos duros. Por lo tanto, los puentes sur Intel ICH7-R e ICH8-R resultaron ser muy interesantes: admiten la función Intel Matrix RAID.

Una implementación típica sería dos matrices RAID en dos discos duros. El primer tercio de la capacidad de los dos discos duros se puede asignar a una matriz RAID 0 rápida para el sistema operativo y el resto a una matriz RAID 1 para almacenar datos importantes. Si uno de los discos duros falla, el sistema operativo se perderá, pero los datos importantes que se reflejan en el segundo disco duro se conservarán gracias a RAID 1. Por cierto, después de instalar Windows, puede crear una imagen del sistema operativo. sistema y guárdelo en una matriz RAID 1 confiable. Luego, si el disco duro falla, el sistema operativo se puede restaurar rápidamente.

Tenga en cuenta que muchas matrices RAID requieren la instalación de un controlador RAID (como Intel Matrix Storage Manager), lo que puede crear problemas durante el inicio y la recuperación del sistema. Cualquier disco de arranque que utilice para la recuperación necesitará controladores RAID. Por lo tanto, guarde el disquete del controlador para tal caso.

Configuración de prueba

Configuración para pruebas de bajo nivel

Procesadores 2x Intel Xeon (núcleo Nocona), 3,6 GHz, FSB800, 1 MB de caché L2
Plataforma Asus NCL-DS (Socket 604), chipset Intel E7520, BIOS 1005
Memoria Corsair CM72DD512AR-400 (DDR2-400 ECC, reg.), 2x 512 MB, latencias CL3-3-3-10
disco duro del sistema Western Digital Caviar WD1200JB, 120 GB, 7200 rpm, 8 MB de caché, UltraATA/100
Controladores de accionamiento Controlador Intel 82801EB UltraATA/100 (ICH5)
Imagen de silicio Sil3124, PCI-X
Neto Controlador Gigabit Ethernet Broadcom BCM5721 integrado
tarjeta de video ATi RageXL incorporado, 8 MB
Pruebas y configuraciones
Pruebas de rendimiento c"t h2benchw 3.6
PCMark05 V1.01
pruebas de E/S IOMeter 2003.05.10
Servidor de archivos-Benchmark
Servidor web-Benchmark
Punto de referencia de base de datos
Estación de trabajo-Benchmark
software del sistema
SO Microsoft Windows Server 2003 Edición Empresarial, Service Pack 1
Controlador de plataforma Utilidad de instalación del chipset Intel 7.0.0.1025
Controlador de gráficos Controlador de gráficos predeterminado de Windows

Configuración para SYSmark2004 SE

hardware del sistema
UPC Intel Core 2 Extreme X6800 (Conroe 65 nm, 2,93 GHz, 4 MB de caché L2)
Placa madre Gigabyte GA-965P-DQ6 2.0, conjunto de chips: Intel 965P, BIOS: F9
Hardware general
Memoria 2x 1024 MB DDR2-1111 (CL 4.0-4-4-12), Corsair CM2X1024-8888C4D XMS6403v1.1
tarjeta de video SU X1900XTX IceQ3, GPU: ATi Radeon X1900 XTX (650 MHz), memoria: 512 MB GDDR3 (1550 MHz)
disco duro yo 150 GB, 10 000 rpm, 8 MB de caché, SATA/150, Western Digital WD1500ADFD
disco duro II 400 GB, 7200 rpm, 16 MB de caché, SATA/300, Western Digital WD4000KD
DVD-ROM Gigabyte GO-D1600C (16x)
Software
Controladores ATi Suite catalizadora 7.1
Controladores de conjuntos de chips Intel Utilidad de instalación de software 8.1.1.1010
Controladores RAID Intel Administrador de almacenamiento matricial 6.2.1.1002
DirectX 9.0c (4.09.0000.0904)
SO Windows XP, compilación 2600 SP2
Pruebas y configuraciones
marca SYS Versión 2004 Segunda Edición, Ejecución Oficial

Bueno, tendremos que pasar a los resultados de la batalla entre los discos duros WD Raptor actuales de 150 GB y los discos duros WD4000KD de 400 GB en una matriz RAID 0. El resultado fue sorprendente. Si bien el WD Raptor sigue siendo, con diferencia, el disco duro Serial ATA de escritorio más rápido, RAID 0 ocupa el primer lugar en la mayoría de los puntos de referencia fuera del tiempo de acceso y el rendimiento de E/S. El costo de almacenar un gigabyte de datos en el Raptor es muy cuestionable, ya que se puede comprar un disco duro de 7.200 rpm con tres veces la capacidad por la mitad de precio. Es decir, al precio de un gigabyte, Raptor hoy pierde seis veces. Sin embargo, si le preocupa la seguridad de los datos, piénselo dos veces antes de elegir una matriz RAID 0 de dos discos duros económicos de 7200 RPM en lugar del WD Raptor.

En los próximos meses, el precio de los discos duros de 500 GB caerá por debajo de los 100 dólares. Pero aumentarán las necesidades de espacio disponible para almacenar vídeos, música y fotografías de alta definición. Por último, la densidad de grabación de los discos duros sigue aumentando, por lo que pronto estarán disponibles modelos de 7.200 rpm de mayor rendimiento. A largo plazo, el atractivo del Raptor disminuirá.

Nos parece que Western Digital debería cambiar la política de precios de la línea Raptor, ya que las mejoras en el rendimiento se obtienen a expensas de grandes compromisos en la capacidad del disco duro. Y debo decir que tales compromisos no les parecerán justificados a todos. Nos gustaría ver un disco duro Raptor de 300 GB actualizado, que también podría funcionar como un disco duro híbrido con memoria flash incorporada para Windows Vista.




Arriba