Tamaño de raya cuál elegir. Más no significa mejor. Colocación de la base, sombra y respaldo.

Hay muchos artículos en Internet que describen RAID. Por ejemplo, éste describe todo con gran detalle. Pero, como de costumbre, no hay suficiente tiempo para leerlo todo, por lo que necesita algo breve para comprender: si es necesario o no, y qué es mejor usar en relación con el trabajo con DBMS (InterBase, Firebird o algo más). realmente no importa). Ante tus ojos hay exactamente ese material.

En una primera aproximación, RAID es una combinación de discos en una matriz. SATA, SAS, SCSI, SSD: no importa. Además, casi todas las placas base normales ahora admiten SATA RAID. Repasemos la lista de qué son los RAID y por qué lo son. (Me gustaría señalar de inmediato que en RAID es necesario combinar discos idénticos. Consolidar discos de diferentes fabricantes, del mismo pero de diferentes tipos, o de diferentes tamaños (esto es un mimo para una persona sentada frente a una computadora en casa).

RAID 0 (banda)

En términos generales, se trata de una combinación secuencial de dos (o más) discos fisicos en un disco "físico". Solo es adecuado para organizar grandes espacios en disco, por ejemplo, para quienes trabajan con edición de vídeo. de hecho, incluso si su base de datos tiene un tamaño de 50 gigabytes, ¿por qué compró dos discos de 40 gigabytes cada uno y no uno de 80 gigabytes? Lo peor es que en RAID 0, cualquier falla de uno de los discos conduce a la inoperancia total de dicho RAID, porque los datos se escriben alternativamente en ambos discos y, en consecuencia, RAID 0 no tiene medios de recuperación en caso de fallas.

Por supuesto, RAID 0 proporciona un rendimiento más rápido debido a la división de lectura/escritura.

RAID 0 se utiliza a menudo para alojar archivos temporales.

RAID 1 (espejo)

Duplicación de disco. Si Shadow en IB/FB es una duplicación de software (consulte Operations Guide.pdf), entonces RAID 1 es una duplicación de hardware y nada más. Le prohibimos utilizar software de duplicación utilizando herramientas del sistema operativo o software de terceros. Necesita un RAID 1 "de hierro" o una sombra.

Si se produce una falla, verifique cuidadosamente qué disco falló. El caso más común de pérdida de datos en RAID 1 son las acciones incorrectas durante la recuperación (el disco incorrecto se especifica como "completo").

En cuanto al rendimiento, la ganancia para escritura es 0, para lectura, quizás hasta 1,5 veces, ya que la lectura se puede realizar "en paralelo" (alternativamente desde diferentes discos). Para las bases de datos, la aceleración es pequeña, mientras que al acceder a diferentes (!) partes (archivos) del disco en paralelo, la aceleración será absolutamente precisa.

RAID 1+0

Por RAID 1+0 se refieren a la opción RAID 10, cuando dos RAID 1 se combinan en RAID 0. La opción cuando dos RAID 0 se combinan en RAID 1 se llama RAID 0+1, y "afuera" es el mismo RAID 10. .

RAID 2-3-4

Estos RAID son raros porque utilizan códigos Hamming o partición de bytes en bloques. sumas de control etc., pero el resumen general es el siguiente: estos RAID solo brindan confiabilidad, con un aumento de 0 en el rendimiento y, a veces, incluso un deterioro.

RAID 5

Requiere un mínimo de 3 discos. Los datos de paridad se distribuyen en todos los discos de la matriz.

Generalmente se dice que "RAID5 utiliza acceso independiente al disco, por lo que las solicitudes de diferentes discos se puede ejecutar en paralelo". Debe tenerse en cuenta que, por supuesto, estamos hablando de solicitudes de E/S paralelas. Si dichas solicitudes se realizan de forma secuencial (en SuperServer), entonces, por supuesto, no obtendrá el efecto del acceso paralelo. en RAID 5. Por supuesto, RAID5 aumentará el rendimiento si la matriz funciona con Sistema operativo y otras aplicaciones (por ejemplo, contendrá memoria virtual, TEMPERATURA, etc.).

En general, RAID 5 solía ser la matriz de discos más utilizada para trabajar con DBMS. Ahora tal matriz se puede organizar en unidad SATA x, y será significativamente más barato que SCSI. Puedes ver precios y controladores en los artículos.
Además, debe prestar atención al volumen de los discos comprados; por ejemplo, en uno de los artículos mencionados, RAID5 se ensambla a partir de 4 discos con una capacidad de 34 gigabytes, mientras que el volumen del "disco" es de 103 gigabytes.

Probando cinco Controladores SATA RAID: http://www.thg.ru/storage/20051102/index.html.

Adaptec SATA RAID 21610SA en matrices RAID 5: http://www.ixbt.com/storage/adaptec21610raid5.shtml.

Por qué RAID 5 es malo: https://geektimes.ru/post/78311/

¡Atención! Al comprar discos para RAID5, normalmente se llevan 3 discos, como mínimo (probablemente por el precio). Si de repente, con el tiempo, uno de los discos falla, puede surgir una situación en la que no sea posible comprar un disco similar a los utilizados (ya no se produce, está temporalmente agotado, etc.). Por lo tanto más idea interesante Parece comprar 4 discos, organizar un RAID5 de tres y conectar el cuarto disco como copia de seguridad (para copias de seguridad, otros archivos y otras necesidades).

Volumen matriz de discos RAID5 se calcula utilizando la fórmula (n-1)*hddsize, donde n es el número de discos en la matriz y hddsize es el tamaño de un disco. Por ejemplo, para una matriz de 4 discos de 80 gigabytes, el volumen total será de 240 gigabytes.

Hay una pregunta sobre la “inadecuación” de RAID5 para bases de datos. Como mínimo, esto se puede ver desde el punto de vista de que para obtener un buen rendimiento de RAID5, es necesario utilizar un controlador especializado, y no el que viene incluido de forma predeterminada en la placa base.

Artículo RAID-5 debe morir. Y más sobre la pérdida de datos en RAID5.

Nota. A partir del 5 de septiembre de 2005, el coste de una unidad SATA Hitachi de 80 Gb es de 60 dólares.

RAID 10, 50

Luego vienen las combinaciones de las opciones enumeradas. Por ejemplo, RAID 10 es RAID 0 + RAID 1. RAID 50 es RAID 5 + RAID 0.

Curiosamente, la combinación RAID 0+1 resulta ser peor en términos de confiabilidad que RAID5. El servicio de reparación de bases de datos tiene un caso de falla de un disco en el sistema RAID0 (3 discos) + RAID1 (3 más de los mismos discos). Al mismo tiempo, RAID1 no pudo "levantar" disco de respaldo. La base resultó dañada sin posibilidad de reparación.

RAID 0+1 requiere 4 unidades y RAID 5 requiere 3. Piénselo.

RAID 6

A diferencia de RAID 5, que usa paridad para proteger los datos contra fallas únicas, RAID 6 usa la misma paridad para proteger contra fallas dobles. En consecuencia, el procesador es más potente que en RAID 5, y no 3, sino al menos 5 discos (tres discos de datos y 2 discos de paridad). Además, el número de discos en raid6 no tiene la misma flexibilidad que en raid 5, y debe ser igual a un número simple (5, 7, 11, 13, etc.)

Digamos que dos discos fallan al mismo tiempo, pero ese caso es muy raro.

No he visto ningún dato sobre el rendimiento de RAID 6 (no lo he buscado), pero es muy posible que debido al control redundante, el rendimiento pueda estar al nivel de RAID 5.

tiempo de reconstrucción

Cualquier matriz RAID que permanezca operativa si falla una unidad tiene un concepto llamado tiempo de reconstrucción. Por supuesto, cuando reemplaza un disco muerto por uno nuevo, el controlador debe organizar el funcionamiento del nuevo disco en la matriz, y esto llevará algún tiempo.

Al "conectar" un disco nuevo, por ejemplo, para RAID 5, el controlador puede permitir el funcionamiento de la matriz. Pero la velocidad de la matriz en este caso será muy baja, al menos porque incluso si el nuevo disco está lleno "linealmente" de información, escribir en él "distraerá" al controlador y a los cabezales del disco de las operaciones de sincronización con el resto del disco. discos de la matriz.

Tiempo de restauración para que la matriz funcione modo normal Depende directamente del tamaño de los discos. Por ejemplo, Sun StorEdge 3510 FC Array con un tamaño de matriz de 2 terabytes en modo exclusivo se reconstruye en 4,5 horas (a un precio de hardware de aproximadamente 40.000 dólares). Por lo tanto, al organizar una matriz y planificar la recuperación ante desastres, primero debe pensar en el tiempo de reconstrucción. Si su base de datos y sus copias de seguridad no ocupan más de 50 gigabytes y el crecimiento anual es de 1 a 2 gigabytes, entonces no tiene sentido ensamblar una matriz de discos de 500 gigabytes. 250 GB serán suficientes, e incluso para raid5 serán al menos 500 GB de espacio para acomodar no solo la base de datos, sino también las películas. Pero el tiempo de reconstrucción para discos de 250 GB será aproximadamente 2 veces menor que para discos de 500 GB.

Reanudar

Resulta que lo más sensato es utilizar RAID 1 o RAID 5. Sin embargo, el error más común que casi todo el mundo comete es utilizar RAID “talla única”. Es decir, instalan un RAID, acumulan todo lo que tienen y... obtienen confiabilidad en el mejor de los casos, pero ninguna mejora en el rendimiento.

La caché de escritura a menudo tampoco está habilitada, como resultado de lo cual escribir en un raid es más lento que escribir en un solo disco normal. El hecho es que para la mayoría de los controladores esta opción está desactivada por defecto, porque... Se cree que para habilitarlo es deseable tener al menos una batería en el controlador raid, así como la presencia de un UPS.

Texto
El antiguo artículo hddspeed.htmLINK (y doc_calford_1.htmLINK) muestra cómo se pueden obtener mejoras significativas en el rendimiento mediante el uso de varios discos físicos, incluso para un IDE. En consecuencia, si organiza un RAID, coloque la base sobre él y haga el resto (temperatura, sistema operativo, disco virtual) en otros discos duros. De todos modos, el RAID en sí es un "disco", aunque sea más fiable y rápido.
declarado obsoleto. Todo lo anterior tiene derecho a existir en RAID 5. Sin embargo, antes de dicha colocación, debe averiguar cómo puede hacer una copia de seguridad/restaurar el sistema operativo y cuánto tiempo llevará restaurar un " "muerto", si hay (habrá) un disco disponible para reemplazar el "muerto", etc., es decir, necesitará saber de antemano las respuestas a las preguntas más básicas en caso de una falla del sistema. .

Aún así, recomiendo mantener el sistema operativo en una unidad SATA separada o, si lo prefiere, en dos unidades SATA conectadas en RAID 1. En cualquier caso, al colocar el sistema operativo en un RAID, debe planificar sus acciones si la placa base se detiene repentinamente. placa de trabajo: a veces es imposible transferir discos de matriz raid a otra placa base (chipset, controlador raid) debido a la incompatibilidad de los parámetros raid predeterminados.

Colocación de la base, sombra y respaldo.

A pesar de todas las ventajas de RAID, no se recomienda estrictamente, por ejemplo, realizar una copia de seguridad en la misma unidad lógica. Esto no sólo es malo para el rendimiento, sino que también puede provocar problemas de falta espacio libre(en bases de datos grandes): después de todo, dependiendo de los datos, el archivo de copia de seguridad puede ser equivalente al tamaño de la base de datos e incluso mayor. Hacer una copia de seguridad en el mismo disco físico es una obviedad, aunque la mejor opción es realizar una copia de seguridad en un disco duro separado.

La explicación es muy sencilla. La copia de seguridad consiste en leer datos de un archivo de base de datos y escribirlos en un archivo de copia de seguridad. Si todo esto sucede físicamente en una unidad (incluso RAID 0 o RAID 1), entonces el rendimiento será peor que si se lee desde una unidad y se escribe en otra. El beneficio de esta separación es aún mayor cuando la copia de seguridad se realiza mientras los usuarios trabajan con la base de datos.

Lo mismo se aplica a la sombra: no tiene sentido colocar la sombra, por ejemplo, en RAID 1, en el mismo lugar que la base, incluso en diferentes unidades lógicas. Si hay una sombra presente, el servidor escribe páginas de datos tanto en el archivo de base de datos como en el archivo de sombra. Es decir, en lugar de una operación de escritura, se realizan dos. Al dividir la base y la sombra en diferentes discos fisicos El rendimiento de escritura estará determinado por la unidad más lenta.

Nos enfrentamos al problema de que la mayoría de los servidores adquiridos por los usuarios de nuestros programas vienen con una matriz de discos configurada en RAID 5. Posteriormente, los administradores del sistema no quieren perder tiempo reconfigurando, o simplemente tienen miedo de cambiar algo en un sistema ya configurado y computadora en funcionamiento. Como resultado, el rendimiento de trabajar con una base de datos instalada en dicho servidor resulta ser menor que en el anterior, que funcionó en la empresa durante 3 a 4 años. Probablemente, el deseo de los proveedores de configurar la matriz de discos en el nivel RAID 5 pueda explicarse por el deseo de sorprender al cliente. tamaño enorme espacio en disco. Los administradores de sistemas, a su vez, a menudo simplemente no tienen conocimientos suficientes sobre cómo funciona una matriz RAID de un nivel u otro. El propósito de este artículo es responder dos preguntas:

¿Por qué no puedo usar RAID 5 para un servidor de base de datos?

Cómo configurar de forma óptima Controlador RAID alojar una base de datos del servidor Firebird?

Inmediatamente hagamos una reserva de que las conclusiones extraídas en este artículo no se aplican a aquellos raros casos en los que la base de datos se utiliza exclusivamente (o principalmente) con fines de solo lectura.

¿Cómo funciona RAID 5?

Veamos un diagrama simplificado de cómo funciona una matriz de cuatro discos. Uno de los discos está asignado para almacenar la suma de comprobación. Hay tres disponibles para la colocación de datos. En la imagen siguiente, discos con información útil denominados A, B y C. La unidad D almacena las sumas de verificación.

La cantidad mínima de información que el controlador lee o escribe en un disco se llama banda(banda). Los parámetros de la mayoría de controladores que hemos encontrado no indican el tamaño de la tira, sino el tamaño. raya(franja): un bloque de información que se distribuye en todos los discos de la matriz. En la siguiente figura, una franja está resaltada en un color más oscuro:


El tamaño de la franja es igual al tamaño de la franja multiplicado por la cantidad de discos en la matriz. Aquellos. en el caso de cuatro discos y un tamaño de banda de 64K, la cantidad mínima de información que el controlador es capaz de escribir o leer del disco es 64/4 = 16K.

La suma de comprobación que va al disco D se calcula mediante la siguiente fórmula:

D = A x o B x o C

Debido a la transitividad de la operación xor, si uno de los discos con información útil falla, se puede restaurar xorando los datos de los discos restantes, incluido el disco con la suma de comprobación. Por ejemplo, la unidad B ha fallado.


Al solicitar un bloque de información del disco B, el controlador lo restaurará mediante la fórmula:

B = A x o C x o D

El servidor Firebird intercambia páginas de datos con el subsistema de disco. El tamaño de página óptimo en la mayoría de los casos es 8K, que es mucho más pequeño que el tamaño de la franja y, en la mayoría de los casos, incluso más pequeño que el tamaño de la franja. Las situaciones en las que se escriben páginas secuenciales en el disco también son bastante raras. Por lo tanto, si en nuestro ejemplo se escribe información en el disco A, entonces el controlador deberá realizar las siguientes operaciones:

  1. Lea los datos de la tira de las unidades B y C. Dos operaciones de lectura.
  2. Calcule una nueva suma de comprobación. Dos operaciones xor.
  3. Escriba información en el disco A y suma de comprobación en el disco D. Dos operaciones de escritura.

En total, dos lecturas, dos escrituras y dos operaciones xor. Sería sorprendente que, con tal volumen de trabajo, la productividad general no cayera. Ahora resulta obvio por qué RAID 5 no es adecuado para alojar un archivo de base de datos.

Una característica importante de RAID 5 es caída significativa en el rendimiento cuando falla uno de los discos de la matriz. Después de todo, ahora para recuperar información de este disco, es necesario leer y reordenar los datos de todos los demás discos.

Sin embargo, como toda regla, la nuestra también tiene su excepción. El rendimiento de una matriz de discos RAID 5 no se degradará si el tamaño de la caché no volátil del controlador es comparable al tamaño del archivo de base de datos. Por ejemplo, con un tamaño de memoria caché de 512 MB, es muy posible utilizar una matriz RAID de quinto nivel para bases de datos de hasta 1-1,5 GB. Siempre que el servidor se dedique únicamente a trabajar con la base de datos y no realice otras tareas.

Vale la pena señalar que el diagrama anterior Operación RAID 5 por razones metodológicas seriamente simplificado. En realidad, el controlador distribuye franjas cíclicamente entre todos los discos de la matriz, por lo que no hay un disco dedicado para almacenar sumas de comprobación. Todos los discos almacenan tanto datos como sumas de verificación de diferentes franjas, lo que le permite ecualizar la carga en ellos.

¿Qué nivel de RAID debo elegir?

Si RAID 5 no es adecuado, ¿qué nivel debo elegir para alojar el archivo de base de datos? Si la cantidad de discos es inferior a cuatro, la única opción es un espejo (RAID 1). Si la matriz tiene cuatro o más discos, entonces RAID 10 es óptimo en términos de rendimiento y confiabilidad: combina (RAID 0) varios espejos (). RAID 1). A veces puedes verlo escrito como RAID 1+0. La siguiente figura muestra una matriz RAID 10 de cuatro unidades. Los datos de una franja están resaltados en tono oscuro. El sombreado muestra un duplicado de esa franja.

Tenga en cuenta también que si una matriz RAID 5 puede sobrevivir a la pérdida de un solo disco, entonces una RAID 10 de m espejos con dos discos sobrevivirá a la pérdida de uno a m discos, siempre que no falle más de un disco en cada espejo.

Intentemos comparar cuantitativamente las matrices RAID 5 y RAID 10, cada una de las cuales tiene n discos. n es múltiplo de dos. Tomemos el tamaño del bloque de datos de lectura/escritura. igual tamaño banda. La siguiente tabla muestra el número requerido de operaciones de lectura/escritura de datos y xoring.


Se ve claramente que la matriz RAID 10 no sólo tiene más rendimiento alto al grabar, pero tampoco permite una disminución general del rendimiento cuando falla un disco.

¿Cómo configurar un controlador RAID?

Tamaño de caché

Cuanto más, mejor. Lo principal es que el controlador tiene una batería (acumulador) para guardar el contenido de la memoria cuando parada de emergencia nutrición. Para muchos controladores, la batería no está incluida de serie y debe pedirse por separado. Sin batería, la caché de escritura se desactivará.

Nivel de RAID

RAID 10. Si la cantidad de discos es inferior a cuatro, entonces RAID 1 (espejo). ¿Por qué? Lea el artículo desde el principio.

Tamaño de la raya

El tamaño de la página de la base de datos multiplicado por el número de espejos en la matriz. Por ejemplo, si la matriz tiene 8 discos, combinados en cuatro espejos de dos discos cada uno, y el tamaño de la página de la base de datos es 8K, entonces el tamaño de la franja debe establecerse en 8 * 4 = 32K.

Leer con anticipación

Dado que el acceso secuencial a las páginas de la base de datos es muy raro y ellas mismas, como resultado de la fragmentación, pueden ubicarse en diferentes lugares del disco, la lectura anticipada debe estar deshabilitada o se debe usar el modo adaptativo (lectura anticipada en el caso de acceso secuencial a dos páginas consecutivas).

Escribir política de caché

Seleccione el modo de reescritura. Los datos se almacenarán en caché y luego se escribirán en el disco. La operación de escritura se considerará completa tan pronto como los datos se coloquen en la memoria caché.

Disco de repuesto

Si las capacidades del controlador lo permiten, se recomienda incluir un disco de respaldo en la matriz. tal disco modo normal El trabajo está en estado de espera. Si uno de los discos duros en funcionamiento falla, se agrega automáticamente un disco de respaldo a la matriz.

IntroducciónLa duplicación de dispositivos y la paralelización de cargas es una idea bastante popular en el mercado moderno. computadoras personales. Los entusiastas suelen recurrir a la creación de subsistemas de vídeo que utilizan dos o más tarjetas gráficas, y aquellos usuarios que necesitan un rendimiento informático inigualable suelen confiar en estaciones de trabajo multiprocesador. Se puede aplicar un enfoque similar al subsistema de disco: una forma bastante sencilla de aumentar su velocidad es formar una matriz RAID a partir de un par (o más) discos duros. Las matrices de nivel 0 (bandas) implican dividir toda la información almacenada en partes iguales, que se distribuyen uniformemente en varias unidades físicas. Como resultado, debido a la lectura y escritura de datos en paralelo en varias unidades a la vez, la velocidad de funcionamiento de dicho sistema en comparación con una sola unidad se puede aumentar varias veces.

En realidad, en los albores de la difusión SSD de consumo En clase, las discusiones fueron bastante populares sobre cuántas matrices RAID de discos duros podrían proporcionar un rendimiento comparable a la velocidad de una unidad flash. Por supuesto, ahora estos tiempos han pasado irrevocablemente. La introducción del estándar SATA 6 Gbit/s y la aparición de una nueva generación de controladores para unidades de estado sólido llevó al hecho de que la velocidad SSD modernos se han alejado demasiado del nivel de rendimiento que pueden proporcionar los discos magnéticos tradicionales. Sin embargo, surgió otra pregunta igualmente interesante: ¿es posible aumentar aún más el rendimiento del subsistema de disco si se ensamblan varios SSD en una matriz RAID 0?

De hecho, existen razones por las que la tecnología RAID no debería efecto positivo En el caso de un SSD, no se ve a primera vista. Las unidades de estado sólido funcionan bien cuando se trabaja con pequeños bloques de datos y los controladores RAID del chipset ofrecen comunicación directa con el procesador con un ancho de banda suficiente para alcanzar velocidades varias veces más rápidas que SATA de 6 Gbps. Por lo tanto, puede esperar un aumento significativo en el rendimiento del RAID 0 basado en un SSD. La idea parece especialmente atractiva porque no implica costes adicionales. La capacidad total de una matriz RAID 0 es la suma de las capacidades de las unidades incluidas en ella y el costo de las SSD es directamente proporcional a su capacidad. Es decir, si utilizamos un controlador RAID "gratuito" integrado en el chipset de la placa base para crear una matriz, al final obtendremos aproximadamente el mismo costo de almacenar un gigabyte de información que en el caso de un solo disco más grande.

Teniendo en cuenta el aparente atractivo creando un RAID 0 matrices de unidades de estado sólido, decidimos probar su funcionamiento en la práctica. Kingston tuvo la amabilidad de proporcionarnos dos SSD de 120 GB y uno de 240 GB de su serie HyperX superior para realizar pruebas, lo que lo hizo posible. comparación directa RAID 0 es una matriz de dos discos con una sola unidad de la misma capacidad.

Más sobre Kingston HyperX SSD

Unidades en serie Kingston HyperX SSD es soluciones típicas Basado en los controladores SandForce de segunda generación, dirigido a entusiastas. Se basan en el conocido chip SF-2281 y están equipados con una memoria NAND síncrona de 25 nm fabricada por Intel o Micron. En pocas palabras, las unidades HyperX utilizan una versión de alto rendimiento de la plataforma SandForce actual y sus componentes internos son similares a los modelos populares como Corsair Force Series GT o Vértice OCZ 3.

Lo que hace que el SSD Kingston HyperX se destaque de unidades SandForce similares es el diseño más llamativo de la carcasa y el programa patentado Toolbox que le permite ver información diversa sobre el disco, incluido el significado de los atributos S.M.A.R.T.

Esta utilidad es sorprendentemente similar a OCZ Toolbox sin la función de actualización de firmware (Kingston ofrece un programa especializado para esto) y sin la función de borrado seguro.



Como todas las demás unidades con controladores SandForce, las unidades SSD Kingston HyperX con capacidades de 120 y 240 GB difieren en rendimiento. Las especificaciones oficiales reflejan esto de la siguiente manera:



La razón de las diferencias es el número de dispositivos finales NAND utilizados en el SSD. Dado que los chips de memoria flash MLC de 25 nm tienen una capacidad de 8 GB, el disco de 120 GB contiene 16 dispositivos flash, mientras que la versión más grande tiene 32 dispositivos. Teniendo en cuenta que el controlador SandForce SF-2281 tiene una arquitectura de ocho canales, las unidades con diferentes capacidades se ven obligadas a utilizar la técnica de llamadas alternas a dispositivos flash con diferentes multiplicidades para cada canal. Entonces, en el caso de un SSD de 120 GB, el entrelazado es doble, y en el caso de un disco de 240 GB, es cuatro. gran aumento el entrelazado garantiza un mayor rendimiento porque en lugar de esperar a que el dispositivo NAND esté listo después de la siguiente operación, el controlador puede pasar a reparar el siguiente dispositivo. En esencia, esto es similar a la implementación del enfoque RAID 0, pero dentro de la unidad, en el nivel del controlador SandForce.

sistema de prueba

Para probar las unidades SSD, montamos un sistema especial integrado en una placa base con un chipset Intel H67, que, como saben, tiene un par de puertos SATA de 6 Gbit/s. Es en estos puertos donde probamos las unidades de estado sólido.

Generalmente, configuración de prueba Incluye el siguiente conjunto de equipos:

Procesador: Intel Core i5-2400 ( Puente de arena, 4 núcleos, 3,1 GHz, tecnologías EIST y Turbo Boost - deshabilitadas);
Placa madre- Foxconn H67S ( Versión de BIOS A41F1P01);
Memoria: 2 x 2 GB DDR3-1333 SDRAM DIMM 9-9-9-24-1T;
Unidad del sistema: Crucial m4 256 GB (CT256M4SSD2);
Pruebas de manejo:

Kingston HyperX 120 GB (SH100S3/120G, firmware 332);
Kingston HyperX 240 GB (SH100S3/240G, firmware 332);

Sistema operativo - Windows 7 SP1 último x64;
Conductores:

Controlador de chipset Intel 9.2.0.1030;
Controlador de gráficos Intel HD 15.22.1.2361;
Controlador del motor de administración Intel 7.1.10.1065;
Tecnología Intel de almacenamiento rápido 10.8.0.1003.

Problemas al configurar RAID 0 desde SSD

Para crear una variedad de unidades SSD, decidimos utilizar un controlador RAID estándar integrado en kits modernos. lógica del sistema. Los controladores SATA con chipset funcionan bien cuando se trabaja con SSD individuales y son bastante adecuados para nuestros propósitos, especialmente porque el soporte RAID nativo ya está disponible en la mayoría de los sistemas modernos, es decir, no requieren costos financieros adicionales.

Nuestro estándar plataforma de prueba basado en el procesador LGA1155 y placa base con el chipset H67, cuyo controlador SATA tiene soporte integrado para matrices RAID. Para activarlo, debe cambiar el modo de funcionamiento del controlador SATA de AHCI a RAID en el BIOS. Sin embargo, simplemente cambiando la opción correspondiente en Configuración del BIOS Lo más probable es que conduzca a la inoperancia del sistema operativo, expresada en la aparición de una "pantalla azul" en la etapa de arranque. La razón es que controlador RAID En Windows está deshabilitado de forma predeterminada. Hay dos formas de solucionar este problema. O reinstale Windows nuevamente, en modo RAID, y luego el controlador necesario se encenderá automáticamente durante la instalación. O, inmediatamente antes de cambiar la configuración del controlador SATA en el BIOS, establezca el valor de la variable Inicio ubicada en el BIOS en 0 registro del sistema en la rama HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Iastorv y luego reinstale el controlador del controlador SATA de Intel Rapid Storage Technology (RST) en modo RAID.

Después de encender modo RAID e implementación en el sistema conductores necesarios, puede proceder directamente a formar la matriz. Se crea por medio Controladores Intel PRIMERO. En el proceso, solo necesita especificar los discos que se incluirán en la matriz y su modo de funcionamiento: RAID 0.



Todas las demás configuraciones se realizan automáticamente, pero si lo desea, puede cambiar el tamaño del bloque de banda (predeterminado: 128 KB) y habilitar el almacenamiento en caché de escritura integrado en el controlador (puede provocar pérdida de información durante apagados repentinos del sistema).



Por razones obvias, no recomendamos habilitar el almacenamiento en caché, especialmente porque el propio sistema operativo ofrece una funcionalidad similar. En cuanto al tamaño de la franja, los bloques en los que se dividen. operaciones de disco para la distribución entre las unidades que componen la matriz, confiar ciegamente en los 128 KB que ofrece el controlador no es el enfoque más razonable. Un tamaño de banda grande tiene sentido para unidades con discos magnéticos, ya que realizan operaciones lectura lineal y escribir bloques grandes es mucho más rápido que las operaciones con bloques pequeños, que requieren un reposicionamiento intensivo del cabezal. Los SSD, por otro lado, tienen tiempos de acceso muy cortos, por lo que elegir bloques pequeños puede proporcionar mejor rendimiento en operaciones con archivos pequeños.

Y aunque la velocidad de un solo Kingston HyperX SSD de 120 GB cuando se trabaja con bloques de datos aumenta al aumentar el tamaño del bloque, esto no significa nada.


El controlador Intel Rapid Storage Technology (RST) es capaz de manejar de forma inteligente la cola de solicitudes, proporcionando matrices RAID 0 de alta velocidad desde SSD y cuando se utilizan pequeños bloques de bandas. Para comprobarlo, evaluamos características básicas rendimiento de una matriz RAID 0 que consta de un par de SSD Kingston HyperX de 120 GB con diferentes tamaños de banda.

Datos tamaño de la raya= 4 KB:



Tamaño de la franja de datos = 8 KB:



Tamaño de la franja de datos = 16 KB:



Tamaño de la franja de datos = 32 KB:



Tamaño de la franja de datos = 64 KB:



Tamaño de la franja de datos = 128 KB:



Como muestran los resultados Punto de referencia SSD, el rendimiento de velocidad de una matriz con bloques de franjas de diferentes tamaños es bastante cercano. Sin embargo, se puede rastrear la dependencia de la velocidad de las operaciones secuenciales, así como la velocidad de trabajar con bloques pequeños con una gran profundidad de cola, del tamaño de la franja. La mejor combinación de rendimiento de la matriz se logra utilizando bloques de 32K, por lo que obviamente la configuración predeterminada no es óptima. Dado que un tamaño de banda más pequeño es más beneficioso cuando se trabaja con archivos pequeños, cuando se utilizan unidades basadas en la plataforma SandForce de segunda generación, recomendamos utilizar un tamaño de bloque de 32 KB. Fue con esta configuración que creamos la matriz utilizada en la parte principal de la prueba.



Al crear matrices RAID, es importante tener en cuenta un detalle más importante. Tan pronto como se forma la matriz, el sistema comienza a considerarla como un todo y el acceso directo a las unidades que la componen se vuelve imposible. Este es un momento bastante desagradable que promete serios inconvenientes prácticos. Tener una matriz RAID de unidades SSD, no podrá actualizar su firmware, ni ver los parámetros S.M.A.R.T, ni realizar la operación de borrado seguro. Pero lo más desagradable, dadas las características específicas de dicha matriz, es que el sistema operativo no podrá transferir comando RECORTAR, a través del cual es posible contrarrestar eficazmente la degradación Rendimiento SSD.

Actuación

Velocidad de lectura/escritura aleatoria y secuencial de una unidad "nueva"

Usamos la prueba CrystalDiskMark 3.0.1 para medir velocidades de lectura y escritura aleatorias y secuenciales. Este punto de referencia es conveniente porque le permite medir características de velocidad Unidades SSD tanto con datos aleatorios incompresibles como cuando se utilizan datos de plantilla totalmente comprimibles. Por lo tanto, los siguientes diagramas muestran dos números cada uno: la velocidad máxima y mínima del variador. Por lo tanto, los indicadores reales estarán dentro de los rangos mostrados, dependiendo de cómo el controlador SF-2281 pueda comprimirlos.

Tenga en cuenta que los resultados de las pruebas de rendimiento presentados en esta sección se refieren al estado "nuevo" (FOB - recién salido de la caja) no degradado de la unidad.


















En términos de indicadores prácticos de rendimiento, un SSD de 120 GB es significativamente más lento que su homólogo de 240 GB. Sin embargo, una matriz RAID 0 de un par de unidades de 120 GB aún supera a una sola unidad de 240 GB. Como puede ver, la tecnología RAID 0 le permite ganar velocidad en operaciones lineales y cuando se trabaja con bloques pequeños cuando se utiliza una cola de solicitudes profunda. Las operaciones aleatorias ordinarias con bloques de 4 KB no se aceleran, e incluso se produce cierta desaceleración debido a retrasos debido a la necesidad de arbitraje adicional;

Degradación y rendimiento en estado estable.

Desafortunadamente, las unidades SSD no demuestran la característica de alta velocidad de un estado "nuevo" todo el tiempo. En la mayoría de los casos, el rendimiento se degrada con el tiempo y en la vida real no estamos ante las mismas velocidades de escritura que se muestran en los diagramas de la sección anterior. La razón de este efecto es que a medida que se agotan las páginas libres en la memoria flash, Controlador SSD surge la necesidad de realizar operaciones de limpieza de bloques de página antes de guardar los datos, lo que añade retrasos importantes.

Por ejemplo, si escribimos datos continuamente en una unidad flash, la dependencia de la velocidad de escritura con el tiempo tomará aproximadamente la siguiente forma.



En algún momento, hay una fuerte disminución en la velocidad de escritura, y esto sucede justo cuando se compara el volumen total de información grabada con la capacidad del SSD. Obviamente, el usuario está más interesado en la velocidad que tendrá durante el funcionamiento prolongado de la unidad, y no en ese corto período de tiempo después de instalar un nuevo SSD, durante el cual la unidad flash muestra los máximos resultados. Los propios fabricantes de SSD, por el contrario, informan sobre los parámetros de velocidad sólo de unidades "nuevas", ya que presentan sus productos de la manera más favorable. Teniendo esto en cuenta, decidimos investigar la caída en el rendimiento cuando una unidad pasa de un estado "nuevo" a un estado "usado" en estado estable.

Sin embargo, la imagen de una caída catastrófica de la velocidad que se muestra en el gráfico anterior es algo artificial y es típica sólo en el caso de grabación continua y sin parar. En realidad, cuando están en reposo, los controladores de los discos SSD modernos restauran parcialmente el rendimiento liberando primero las páginas de memoria flash no utilizadas. A esto apuntan dos algoritmos clave: Idle-Time Garbadge Collection (recolección de basura) y TRIM. Sin embargo, en el caso de una matriz RAID 0, la situación se complica por el hecho de que el sistema operativo no tiene acceso directo al SSD, por lo que la tecnología TRIM no funciona. En este sentido, es muy probable que después de un tiempo de funcionamiento, un solo disco resulte significativamente mejor que una matriz RAID.

Nadie se molesta en comprobar esta suposición. Para obtener una imagen de la degradación de los discos y matrices RAID 0, realizamos pruebas especiales basadas en la metodología SNIA SSSI TWG PTS. Su esencia es que medimos secuencialmente la velocidad de las operaciones de escritura en cuatro casos. Primero, para el estado "nuevo" de la matriz y las unidades. Luego, después de que las unidades y la matriz RAID estén completamente llenas dos veces con información. Luego, después de una pausa de media hora, lo que le da al controlador la oportunidad de restaurar parcialmente el rendimiento de la unidad mediante una operación de recolección de basura. Y finalmente, después de ejecutar el comando TRIM.

Las mediciones se realizaron utilizando el banco de pruebas sintético IOMeter 1.1.0 RC1, en el que monitoreamos la velocidad de escritura aleatoria cuando se trabaja con bloques alineados en páginas de memoria flash de 4 KB con una profundidad de cola de solicitudes de 32 comandos. Durante las pruebas, se utilizó el llenado con datos pseudoaleatorios.



La degradación de la productividad no es una frase vacía, sino real problema existente. Como puede ver, la velocidad de los discos realmente disminuye significativamente. Además, por triste que parezca, la recolección de basura para unidades basadas en el controlador SF-2281 prácticamente no funciona. A pesar de que las unidades con esta arquitectura tienen un área de reserva de aproximadamente el 7% de la capacidad total, esto no les ayuda en absoluto. Sólo el comando TRIM devuelve el rendimiento a un nivel más o menos normal. Sin embargo, dado que no funciona con matrices RAID, en última instancia, las unidades individuales pueden ofrecer un rendimiento de escritura mucho mejor que una matriz compuesta por ellas.

Todo esto significa que las velocidades de escritura que se muestran en los diagramas de la sección anterior reflejan sólo una pequeña parte del panorama general. De hecho, una vez que los SSD pasen de ser nuevos a usados, los resultados cambiarán radicalmente. La velocidad de grabación en este caso será completamente diferente: los resultados de su medición utilizando el punto de referencia CrystalDiskMark 3.0.1 se muestran en los siguientes diagramas.









Como puede ver, durante el uso, la velocidad de la matriz RAID 0 de SSD disminuye hasta tal punto que en operaciones con bloques de 4 KB se vuelve incluso más lenta que una sola unidad de 120 GB, cuyo rendimiento se mantiene en buen nivel Comando RECORTAR. Entonces, en la vida real, la creación de una matriz RAID 0 a partir de un SSD se justifica principalmente por las altas velocidades de lectura, que no están sujetas a reducción a medida que el disco se llena de datos.

Pruebas en Futuremark PCMark 7

La conocida prueba PCMark 7 incluye un punto de referencia independiente para medir el rendimiento del subsistema de disco. Además, no es de carácter sintético, sino que, por el contrario, se basa en cómo funcionan con el disco. aplicaciones reales. Este punto de referencia reproduce escenarios reales: rastros de uso del disco en tareas comunes y mide la velocidad de su ejecución. Además, la reproducción del flujo de comandos no se realiza de forma completa, sino como sucede en la realidad, con ciertas pausas debido a la necesidad de procesar los datos entrantes. El resultado de la prueba es el índice de rendimiento general del subsistema de disco y los indicadores de velocidad en escenarios individuales en megabytes por segundo. Tenga en cuenta que el rendimiento en escenarios en términos absolutos es relativamente bajo, ya que lo contribuyen esas pausas muy simuladas entre operaciones de E/S individuales. En otras palabras, lo que informa PCMark 7 es la velocidad del subsistema de disco en el lado de la aplicación. Estos valores nos brindan información no tanto sobre el rendimiento puro de las unidades, sino sobre los beneficios prácticos que un SSD en particular puede aportar en el trabajo real.

Realizamos pruebas de PCMark 7 con unidades en estado "usado", en el que funcionan en sistemas reales la mayor parte del tiempo. Los resultados en este caso están influenciados no solo por la velocidad del controlador y la memoria flash instalada en la unidad, sino también por la eficiencia del sistema interno. Algoritmos SSD destinado a restablecer la productividad.



La puntuación integral de PCMark 7 es una guía excelente para aquellos consumidores que no quieren entrar en detalles y se contentan con una simple ilustración del rendimiento relativo de las unidades. Y, si cree en las calificaciones recibidas, la matriz RAID 0 tiene en general mejor rendimiento que un solo disco de capacidad similar. Si tenemos en cuenta que la mayoría de los escenarios de uso del subsistema de disco en la vida real implican un predominio de operaciones de lectura, los resultados obtenidos parecen bastante lógicos y confiables.

Para completar la imagen, también debe familiarizarse con los resultados intermedios de los discos mostrados y la matriz RAID al pasar los rastros de prueba individuales. Además, en algunas situaciones las diferencias de rendimiento alcanzan dimensiones aún más impresionantes.





















Como puede ver, existen escenarios en los que las matrices RAID de SSD en la plataforma SandForce de segunda generación están contraindicadas. Obviamente, esta imagen se observa en los casos en que se requiere el subsistema de disco. trabajo activo con pequeños datos. EN en este caso Estos son los escenarios de Gaming y Windows Defender.

Pruebas en Intel NAS Performance Toolkit

Intel NASPT es otra prueba de subsistema de disco del mundo real. Al igual que PCMark 7, reproduce patrones típicos de actividad del disco preparados previamente y mide simultáneamente la velocidad de su paso. Este punto de referencia, junto con PCMark 7, le permite obtener una excelente ilustración del rendimiento del subsistema de disco en tareas reales. Al igual que en el caso anterior, realizamos pruebas con unidades en un estado estable "usado".



Intel NASPT claramente coloca la matriz RAID 0 que consta de un par de unidades de 120 GB en primer lugar en términos de rendimiento. Además, según los datos de las pruebas, la velocidad de una matriz de dos discos de este tipo es casi el doble que el rendimiento de un solo SSD. Sin embargo, un éxito tan notable de la tecnología RAID puede verse eclipsado por algunos de los resultados obtenidos en las subpruebas individuales.




































Todo está bien siempre que se trate de leer información. Cuando los escenarios de prueba incluyen grabación, el SSD único de 240 GB demuestra velocidades más altas.

Conclusiones

Desafortunadamente, según los resultados de nuestras pruebas, no podremos dar una respuesta definitiva a la pregunta sobre la conveniencia de construir una matriz RAID 0 a partir de unidades de estado sólido modernas. Este enfoque tiene sus ventajas, pero también graves desventajas, y al concluir el material sólo podemos colocarlas en la balanza, dejando que el lector llegue a su propia conclusión final.

Crear una matriz RAID 0 es una de las formas tradicionales de mejorar el rendimiento del subsistema de disco. Esta técnica funciona bastante bien para SSD; combinar un par de discos en una matriz realmente permite aumentar la cantidad. velocidades lineales y la velocidad de las operaciones en bloques pequeños con una cola de solicitudes profunda. Por lo tanto, durante las pruebas pudimos obtener velocidades de lectura y escritura secuenciales realmente impresionantes para la matriz, superando significativamente el rendimiento. interfaz sata 6 Gbps

Pero no debemos olvidar que la velocidad de las unidades de estado sólido modernas aumenta con su capacidad, incluso dentro de un línea de productos, por lo que una matriz de nivel 0 de dos discos a veces puede tener un rendimiento inferior a un modelo de unidad de mayor capacidad. Aún más problema grave El problema con una matriz RAID desde un SSD es que la mayoría de los controladores SATA, incluidos los integrados en los conjuntos de chips modernos, no admiten el comando TRIM. Como resultado, en el proceso uso práctico la matriz se degrada significativamente en la velocidad de escritura, mientras que los discos individuales están sujetos a este efecto en mucha menor medida.

Como resultado, RAID 0 supera claramente a un solo disco sólo en operaciones lineales, mientras que las solicitudes aleatorias exponen puntos débiles este enfoque. En otras palabras, considerar que una matriz RAID 0 es una solución más productiva que una sola unidad flash sólo se puede hacer con serias reservas. Sin embargo, en la mayoría de las pruebas basadas en escenarios uso real subsistema de disco, la matriz aún mostró un mayor rendimiento. Es decir, en promedio, RAID 0 se justifica, especialmente porque no requiere ningún costo financiero adicional: el costo por gigabyte en la configuración final es el mismo tanto para la matriz como para un solo disco.

Sin embargo usando SSD como parte de una matriz causa algunos inconvenientes adicionales. Para las unidades ensambladas en una matriz, es imposible rastrear su "estado de salud" y actualizar su firmware. Además, un sistema que consta de un par de SSD tiene menor confiabilidad que un solo disco y la falla de al menos una unidad provocará la pérdida de todos los datos almacenados en la matriz.

Este artículo fue preparado por Nikolai Vedyashkin, experto del Centro de servicio Jet Infosystems.

Imaginemos una situación: agregamos una nueva instancia de base de datos o una nueva tarea de respaldo (BK) al servidor de la base de datos, conectamos un servidor adicional a la matriz de discos y en todos estos casos encontramos una disminución en su rendimiento. Entonces puedes ir de diferentes maneras.

Por ejemplo, agregue un servidor de base de datos y transfiérale una instancia de base de datos, agregue unidades de respaldo para acelerar el almacenamiento de datos, actualice los procesadores, etc. Sin embargo, vale la pena recordar que simplemente aumentar la capacidad del hardware es lo menos rentable en términos de costos de material y tiempo. Es mucho más eficaz resolver estos problemas a nivel de la lógica de funcionamiento de las soluciones de TI.

Causas del deslizamiento

Los problemas de rendimiento de la matriz a menudo se deben al hecho de que la configuración inicial no tiene en cuenta su arquitectura, principios operativos y limitaciones existentes. Por ejemplo, el talón de Aquiles de las matrices de la vieja generación es el nivel relativamente bajo rendimiento neumáticos internos– alrededor de 200 Mb/seg. No hace mucho, uno de los clientes nos pidió que analizáramos el rendimiento de su matriz de discos y le brindáramos recomendaciones para su optimización. De hecho, la matriz no se cargó y su velocidad periódicamente dejaba mucho que desear. El análisis reveló una configuración incorrecta: en general, durante el día unidades internas se cargaron aproximadamente por igual, pero los picos de carga se distribuyeron de manera desigual entre ellos. Como resultado, uno de los autobuses internos quedó sobrecargado. Es decir, la matriz "resbaló" debido a que se excedió el umbral máximo permitido para un componente. Nuestra recomendación (reparticionarlo para cargar los neumáticos interiores de manera uniforme) ayudó a aumentar la productividad en un 30 %.

El error también puede aparecer al conectar servidores a sistemas de almacenamiento. Ejemplo - configuración incorrecta Capacidad del disco que se presenta a los hosts. El hecho es que algunas de las matrices modernas tienen restricciones en un parámetro como la cola de comandos (Queue Depth, QD). Vale la pena profundizar un poco más en la historia aquí. En el estándar SCSI-I, el controlador del servidor SCSI tenía que esperar a que se completara un comando antes de enviar el siguiente. Desde el estándar SCSI-II y superior, el controlador SCSI puede enviar varios comandos (QD) al disco SCSI al mismo tiempo. Cantidad máxima Los comandos SCSI con servicio paralelo son una de las características más importantes del disco. Parámetro IOPS ( Entrada Salida Operación por segundo) muestra cuántas solicitudes (comandos SCSI) por segundo es capaz de ejecutar el LUN SCSI. Resulta que QD e IOPS pueden entrar en conflicto irreconciliable entre sí.

Es muy posible que las características de E/S en el lado del servidor sean inaceptables, el tiempo de respuesta a las solicitudes sea muy largo y la matriz no esté cargada. La razón radica en - configuración incorrecta colas de comandos (más altas de lo permitido): los comandos se cuelgan en el búfer de matriz hasta que llega su turno de ejecución. En el servidor se registran grandes tiempos de servicio.

Si QD es significativamente menor que el valor óptimo, el rendimiento también se verá afectado. Con un tiempo de respuesta excelente y una matriz descargada, la cantidad de solicitudes que procesa será muy pequeña. La razón de esto es la larga espera en la cola antes de enviar solicitudes al sistema de almacenamiento.

Atrapando IOPS por la cola

¿Qué hacer si el tiempo de respuesta está fuera de serie y la matriz no está cargada? ¿O si simplemente desea “exprimir” un poco más la matriz?
Poder:
  • Mire la configuración de Profundidad de la cola en el servidor y compare la cola de comandos máxima permitida con el LUN de la matriz. Ajustar la configuración;
  • Mire las estadísticas de la matriz. Quizás se esté acumulando una cola de comandos al LUN;
  • divida un LUN en varios y conéctelo en el host en banda o al menos en concatenación, según la configuración. La concatenación es útil si la carga se distribuye entre todos los LUN.
  • elija un tamaño de unidad de banda en el arreglo y el host para que una operación de aplicación típica cargue la menor cantidad posible de discos físicos en el arreglo.

Arroz. 1. Tamaño de la unidad de franjas

Un ejemplo de nuestra experiencia: la combinación servidor-matriz del cliente no mostró el nivel de rendimiento declarado. Como resultado del análisis, resultó que al servidor se le asignó un LUN muy grande (varios terabytes): el rendimiento de las aplicaciones no fue satisfactorio y el LUN en sí estaba sobrecargado con una cola de comandos. Recomendamos dividir este LUN en varios y distribuir los tipos de carga entre diferentes volúmenes. Había 4 instancias de bases de datos girando en el servidor, como resultado, una de ellas comenzó a funcionar 6 veces más rápido, la otra, 2 veces.

Más no es mejor

Los profesionales de TI del cliente no siempre entienden qué tipo de RAID es el más adecuado para un perfil de carga de aplicación determinado. Todo el mundo sabe que RAID 10 es fiable, resistente a múltiples pérdidas de unidades y demuestra buena velocidad en operaciones aleatorias. No es de extrañar que la mayoría de las veces se elija esta opción tan cara. Sin embargo, si el perfil de carga de la aplicación implica pocas operaciones de escritura aleatoria y muchas operaciones de lectura o escritura secuencial, lo óptimo es utilizar RAID 5. En la misma cantidad de discos, puede funcionar 1,5 o incluso 2 veces más rápido. Una empresa se acercó a nosotros para mejorar el rendimiento de E/S del disco de una de sus aplicaciones. La aplicación generaba muchas lecturas y pocas escrituras. Se configuró RAID 10 en la matriz y, según las estadísticas, quedó claro que casi la mitad de los discos del grupo RAID estaban inactivos. Con la transición a RAID 5 desde exactamente la misma cantidad de discos físicos, el rendimiento de la aplicación mejoró más de 1,5 veces.

Agradecemos sus comentarios constructivos.

Los problemas de rendimiento afectan a casi todas las empresas que operan un sistema informático. Los ejemplos dados aquí no son los únicos. Muchos problemas asociados con el bajo rendimiento de los arreglos se pueden evitar si se tienen en cuenta la arquitectura y el perfil de carga de la aplicación al configurar el equipo. Al mismo tiempo, la mejora del rendimiento de un sistema informático no debe limitarse a ninguno de sus componentes: un servidor, una matriz, un software o una red de datos. Los mejores resultados se pueden lograr después de analizar todo el complejo en su conjunto y cambiar la configuración no solo de la matriz, sino también del servidor y las aplicaciones.

Unidad Intel DC S3700 de 100 GB, además de probar una matriz RAID-0 basada en dos unidades similares, donde se seleccionó el tamaño de la tira de forma predeterminada, es decir, 128 KB, pero el chipset C226 le permite cambiar tamaño dado. En teoría, el tamaño de la franja debería tener un impacto en el rendimiento de la matriz (una franja grande es beneficiosa para operaciones secuenciales, una pequeña) cuando se trabaja con archivos pequeños. Pero esto es en teoría, comprobémoslo en la práctica.

El controlador Intel RAID en el chipset C226 le permite seleccionar los siguientes tamaños de banda: 4, 8, 16, 32, 64 y 128 KB. Probemos todos los modos posibles.

Banco de pruebas: Intel Xeon E3-1276v3, Supermicro X10SAE, Kingston DDR3-1600 ECC 8GB, Intel DC S3700

Detallando

Procesador: (HT activado; TB activado);
- Placa base: ;
- RAM: 4x (KVR16LE11/8);
- Almacenamientos: 2x;
- SO: .

Metodología de prueba

CrystalDiskMark v5.1 x64;
- Prueba de referencia del disco ATTO v3.05;
- PCMark 7 v1.4;
- PCMark 8 v2.3.

CrystalDiskMark (500MB)

En grabación secuencial sin una cola profunda, el tamaño de la tira no tiene mucho impacto: los resultados están dentro del error, pero con la lectura secuencial la imagen es algo diferente: las matrices con tamaños de tira de 128 y 32 KB son las más productivas, y las menos productivas son 64 KB Es decir, para operaciones de lectura secuencial. Aún así, lo más preferible es un tamaño de banda grande.

Las operaciones con bloques de 4 KB sin una cola profunda no permiten aprovechar todo el potencial tanto de una unidad separada como de una matriz RAID. Pero lo principal aquí es que el tamaño de la franja tiene un impacto en la velocidad de escritura: las franjas de 16 y 64 kilobytes muestran los peores resultados al leer, y al escribir, el peor resultado es la franja de 8 kilobytes. Veamos cómo cambia la situación usando una cola.

El uso de la cola fue igual para todos: no hay una diferencia notable entre los modos: la diferencia entre los modos más rápidos (128 KB) y más lentos (8 KB) fue de aproximadamente el 3,5% (lo cual es digno de mención, el rendimiento más alto para secuencial Las operaciones se muestran en el modo con un ancho de banda grande, y el menos, con uno pequeño).

Pero las operaciones con bloques de 4 kilobytes muestran una imagen diferente: el rendimiento más alto lo muestra una matriz con una franja de 8 kilobytes y el más bajo, 128 (la diferencia es del 5%), pero... esto solo se aplica a la lectura, las operaciones de escritura resultaron ser indiferentes al tamaño de la franja. Es decir, en operaciones de lectura secuencial, un tamaño de tira grande parece ventajoso, y en operaciones con bloques de 4 KB, un tamaño de tira pequeño parece ventajoso.

Punto de referencia del disco ATTO

El punto de referencia ATTO es más informativo: muestra el rendimiento en diferentes bloques. Y aquí se pueden observar fuertes caídas en el rendimiento: las curvas más estables sin caídas pronunciadas muestran modos con franjas de 4 y 64 KB. Es de destacar que en el área de 16 a 128 KB, la franja de 64 KB muestra un rendimiento inferior que la franja de 4 KB, pero se recupera después de 256 KB.

El gráfico de grabación tiene una dependencia ligeramente diferente: el modo más estable es el que tiene un ancho de banda de 128 kilobytes, que muestra sólo una ligera caída y sólo en el área por encima de los 32 MB.

PCMark 7

El benchmark PCMark 7 da preferencia al carril de 4 KB. Además, este benchmark emula ciertos escenarios operativos... es decir, es menos sintético que ATTO.

La principal contribución a la victoria de la pequeña racha la hicieron las solicitudes iniciales y Windows Media Centro. Pero este es un resultado CRUDO...

Aquí la situación en su conjunto no cambia, salvo que los resultados mismos se han vuelto un orden de magnitud menores.

PCMark 8

PCMark 8 no notó ningún cambio en los parámetros de la matriz, al igual que todos en la clasificación general. Pero el rendimiento medido es diferente: el más alto corresponde a la banda de 4 kilobytes.

Conclusión

Para resumir... podemos decir que en la mayoría de las aplicaciones, aunque parezca extraño, una matriz con un tamaño de banda de 4 KB mostró un mejor rendimiento. Pero en general la diferencia no superó el 10%, es decir, el tamaño de la banda no es un valor tan crítico. Al menos esto se puede decir de la combinación del chipset C226 y una matriz RAID de dos discos Intel DC S3700 de 100 GB en los puntos de referencia seleccionados.
Continuará...
Otros materiales sobre matrices RAID basadas en SSD -.




Arriba