Hogar › Servicios › Tamaño de raya raid cuál elegir. Pruebas en puntos de referencia clásicos

Tamaño de raya raid cuál elegir. Pruebas en puntos de referencia clásicos

Hay muchos artículos en Internet que describen RAID. Por ejemplo, éste describe todo con gran detalle. Pero, como de costumbre, no hay suficiente tiempo para leerlo todo, por lo que necesita algo breve para comprender: si es necesario o no, y qué es mejor usar en relación con el trabajo con DBMS (InterBase, Firebird o algo más). realmente no importa). Ante tus ojos hay exactamente ese material.

En una primera aproximación, RAID es una combinación de discos en una matriz. SATA, SAS, SCSI, SSD: no importa. Además, casi todas las placas base normales ahora admiten SATA RAID. Repasemos la lista de qué son los RAID y por qué lo son. (Me gustaría señalar de inmediato que en RAID es necesario combinar discos idénticos. Consolidar discos de diferentes fabricantes, del mismo pero de diferentes tipos, o de diferentes tamaños: esto es un mimo para una persona sentada frente a una computadora en casa).

RAID 0 (banda)

En términos generales, se trata de una combinación secuencial de dos (o más) discos fisicos en un disco "físico". Solo es adecuado para organizar grandes espacios en disco, por ejemplo, para quienes trabajan con edición de vídeo. de hecho, incluso si su base de datos tiene un tamaño de 50 gigabytes, ¿por qué compró dos discos de 40 gigabytes cada uno y no uno de 80 gigabytes? Lo peor es que en RAID 0, cualquier falla de uno de los discos conduce a la inoperancia total de dicho RAID, porque los datos se escriben alternativamente en ambos discos y, en consecuencia, RAID 0 no tiene medios de recuperación en caso de fallas.

Por supuesto, RAID 0 proporciona un rendimiento más rápido debido a la división de lectura/escritura.

RAID 0 se utiliza a menudo para alojar archivos temporales.

RAID 1 (espejo)

Duplicación de disco. Si Shadow en IB/FB es una duplicación de software (consulte Operations Guide.pdf), entonces RAID 1 es una duplicación de hardware y nada más. Le prohibimos utilizar software de duplicación utilizando herramientas del sistema operativo o software de terceros. Necesita un RAID 1 "de hierro" o una sombra.

Si se produce una falla, verifique cuidadosamente qué disco falló. El caso más común de pérdida de datos en RAID 1 son las acciones incorrectas durante la recuperación (el disco incorrecto se especifica como "completo").

En cuanto al rendimiento, la ganancia para escritura es 0, para lectura, quizás hasta 1,5 veces, ya que la lectura se puede realizar "en paralelo" (alternativamente desde diferentes discos). Para las bases de datos, la aceleración es pequeña, mientras que al acceder a diferentes (!) partes (archivos) del disco en paralelo, la aceleración será absolutamente precisa.

RAID 1+0

Por RAID 1+0 se refieren a la opción RAID 10, cuando dos RAID 1 se combinan en RAID 0. La opción cuando dos RAID 0 se combinan en RAID 1 se llama RAID 0+1, y "afuera" es el mismo RAID 10. .

RAID 2-3-4

Estos RAID son raros porque utilizan códigos Hamming o partición de bytes en bloques. sumas de control etc., pero el resumen general es el siguiente: estos RAID solo brindan confiabilidad, con un aumento de 0 en el rendimiento y, a veces, incluso un deterioro.

RAID 5

Requiere un mínimo de 3 discos. Los datos de paridad se distribuyen en todos los discos de la matriz.

Generalmente se dice que "RAID5 utiliza acceso independiente al disco, por lo que las solicitudes de diferentes discos se puede ejecutar en paralelo". Debe tenerse en cuenta que, por supuesto, estamos hablando de solicitudes de E/S paralelas. Si dichas solicitudes se realizan de forma secuencial (en SuperServer), entonces, por supuesto, no obtendrá el efecto del acceso paralelo. en RAID 5. Por supuesto, RAID5 aumentará el rendimiento si la matriz funciona con Sistema operativo y otras aplicaciones (por ejemplo, contendrá memoria virtual, TEMPERATURA, etc.).

En general, RAID 5 solía ser la matriz de discos más utilizada para trabajar con DBMS. Ahora tal matriz se puede organizar en unidad SATA x, y será significativamente más barato que SCSI. Puedes ver precios y controladores en los artículos.
Además, debe prestar atención al volumen de los discos comprados; por ejemplo, en uno de los artículos mencionados, RAID5 se ensambla a partir de 4 discos con una capacidad de 34 gigabytes, mientras que el volumen del "disco" es de 103 gigabytes.

Prueba de cinco controladores SATA RAID: http://www.thg.ru/storage/20051102/index.html.

Adaptec SATA RAID 21610SA en matrices RAID 5: http://www.ixbt.com/storage/adaptec21610raid5.shtml.

Por qué RAID 5 es malo: https://geektimes.ru/post/78311/

¡Atención! Al comprar discos para RAID5, suelen llevar 3 discos, como mínimo (probablemente por el precio). Si de repente, con el tiempo, uno de los discos falla, puede surgir una situación en la que no sea posible comprar un disco similar a los utilizados (ya no se produce, está temporalmente agotado, etc.). Por lo tanto, una idea más interesante parece ser comprar 4 discos, organizar un RAID5 de tres y conectar el cuarto disco como copia de seguridad (para copias de seguridad, otros archivos y otras necesidades).

Volumen matriz de discos RAID5 se calcula utilizando la fórmula (n-1)*hddsize, donde n es el número de discos en la matriz y hddsize es el tamaño de un disco. Por ejemplo, para una matriz de 4 discos de 80 gigabytes, el volumen total será de 240 gigabytes.

Hay una pregunta sobre la “inadecuación” de RAID5 para bases de datos. Como mínimo, se puede considerar desde el punto de vista de que para obtener una buena Rendimiento RAID 5, necesitas usar un controlador especializado y no el predeterminado en la placa base.

Artículo RAID-5 debe morir. Y más sobre la pérdida de datos en RAID5.

Nota. A partir del 05/09/2005, el costo de SATA disco hitachi 80Gb son 60 dólares.

RAID 10, 50

Luego vienen las combinaciones de las opciones enumeradas. Por ejemplo, RAID 10 es RAID 0 + RAID 1. RAID 50 es RAID 5 + RAID 0.

Curiosamente, la combinación RAID 0+1 resulta ser peor en términos de confiabilidad que RAID5. El servicio de reparación de bases de datos tiene un caso de falla de un disco en el sistema RAID0 (3 discos) + RAID1 (3 más de los mismos discos). Al mismo tiempo, RAID1 no pudo "levantar" el disco de respaldo. La base resultó dañada sin posibilidad de reparación.

RAID 0+1 requiere 4 unidades y RAID 5 requiere 3. Piénselo.

RAID 6

A diferencia de RAID 5, que usa paridad para proteger los datos contra fallas únicas, RAID 6 usa la misma paridad para proteger contra fallas dobles. En consecuencia, el procesador es más potente que en RAID 5, y no 3, sino al menos 5 discos (tres discos de datos y 2 discos de paridad). Además, el número de discos en raid6 no tiene la misma flexibilidad que en raid 5, y debe ser igual a un número simple (5, 7, 11, 13, etc.)

Digamos que dos discos fallan al mismo tiempo, pero ese caso es muy raro.

No he visto ningún dato sobre el rendimiento de RAID 6 (no lo he buscado), pero es muy posible que debido al control redundante, el rendimiento pueda estar al nivel de RAID 5.

tiempo de reconstrucción

Cualquier matriz RAID que permanezca operativa si falla una unidad tiene un concepto llamado tiempo de reconstrucción. Por supuesto, cuando reemplaza un disco muerto por uno nuevo, el controlador debe organizar el funcionamiento del nuevo disco en la matriz, y esto llevará algún tiempo.

Al "conectar" un disco nuevo, por ejemplo, para RAID 5, el controlador puede permitir el funcionamiento de la matriz. Pero la velocidad de la matriz en este caso será muy baja, al menos porque incluso si el nuevo disco está lleno "linealmente" de información, escribir en él "distraerá" al controlador y a los cabezales del disco de las operaciones de sincronización con el resto del disco. discos de la matriz.

El tiempo que lleva restaurar la matriz a su funcionamiento normal depende directamente de la capacidad del disco. Por ejemplo, Sun StorEdge 3510 FC Array con un tamaño de matriz de 2 terabytes en modo exclusivo se reconstruye en 4,5 horas (a un precio de hardware de aproximadamente 40.000 dólares). Por lo tanto, al organizar una matriz y planificar la recuperación ante desastres, primero debe pensar en el tiempo de reconstrucción. Si su base de datos y sus copias de seguridad no ocupan más de 50 gigabytes y el crecimiento anual es de 1 a 2 gigabytes, entonces no tiene sentido ensamblar una matriz de discos de 500 gigabytes. 250 GB serán suficientes, e incluso para raid5 serán al menos 500 GB de espacio para acomodar no solo la base de datos, sino también las películas. Pero el tiempo de reconstrucción para discos de 250 GB será aproximadamente 2 veces menor que para discos de 500 GB.

Reanudar

Resulta que lo más significativo es utilizar RAID 1 o RAID 5. Sin embargo, lo más error común, lo que casi todo el mundo hace es utilizar RAID “para todo”. Es decir, instalan un RAID, acumulan todo lo que tienen y... obtienen confiabilidad en el mejor de los casos, pero ninguna mejora en el rendimiento.

La caché de escritura a menudo tampoco está habilitada, como resultado de lo cual escribir en un raid es más lento que escribir en un solo disco normal. El hecho es que para la mayoría de los controladores esta opción está desactivada por defecto, porque... Se cree que para habilitarlo es deseable tener al menos una batería en el controlador raid, así como la presencia de un UPS.

Texto
El antiguo artículo hddspeed.htmLINK (y doc_calford_1.htmLINK) muestra cómo se pueden obtener mejoras significativas en el rendimiento mediante el uso de varios discos físicos, incluso para un IDE. En consecuencia, si organiza un RAID, coloque la base sobre él y haga el resto (temperatura, sistema operativo, disco virtual) en otros discos duros. De todos modos, el RAID en sí es un "disco", aunque sea más fiable y rápido.
declarado obsoleto. Todo lo anterior tiene derecho a existir en RAID 5. Sin embargo, antes de dicha colocación, debe averiguar cómo puede hacer una copia de seguridad/restaurar el sistema operativo y cuánto tiempo llevará restaurar un " "muerto", si hay (habrá) un disco disponible para reemplazar el "muerto", etc., es decir, necesitará saber de antemano las respuestas a las preguntas más básicas en caso de una falla del sistema. .

Aún así, recomiendo mantener el sistema operativo en una unidad SATA separada o, si lo prefiere, en dos unidades SATA conectadas en RAID 1. En cualquier caso, al colocar el sistema operativo en un RAID, debe planificar sus acciones si la placa base se detiene repentinamente. placa de trabajo: a veces es imposible transferir discos de matriz raid a otra placa base (chipset, controlador raid) debido a la incompatibilidad de los parámetros raid predeterminados.

Colocación de la base, sombra y respaldo.

A pesar de todas las ventajas de RAID, no se recomienda estrictamente, por ejemplo, realizar una copia de seguridad en la misma unidad lógica. Esto no sólo tiene un efecto negativo en el rendimiento, sino que también puede provocar problemas de falta de espacio libre (en bases de datos grandes); después de todo, dependiendo de los datos, el archivo de copia de seguridad puede ser equivalente al tamaño de la base de datos. , y aún más grande. Hacer una copia de seguridad en el mismo disco físico todavía está bien, aunque la mayoría mejor opción- copia de seguridad en un disco duro independiente.

La explicación es muy sencilla. La copia de seguridad consiste en leer datos de un archivo de base de datos y escribirlos en un archivo de copia de seguridad. Si todo esto sucede físicamente en una unidad (incluso RAID 0 o RAID 1), entonces el rendimiento será peor que si se lee desde una unidad y se escribe en otra. El beneficio de esta separación es aún mayor cuando la copia de seguridad se realiza mientras los usuarios trabajan con la base de datos.

Lo mismo se aplica a la sombra: no tiene sentido colocar la sombra, por ejemplo, en RAID 1, en el mismo lugar que la base, incluso en diferentes unidades lógicas. Si hay sombra, el servidor escribe páginas de datos tanto en el archivo de base de datos como en archivo de sombra. Es decir, en lugar de una operación de escritura, se realizan dos. Al dividir la base y la sombra en diferentes discos fisicos El rendimiento de escritura estará determinado por la unidad más lenta.

Este artículo fue preparado por Nikolai Vedyashkin, experto del Centro de servicio Jet Infosystems.

Imaginemos una situación: agregamos una nueva instancia de base de datos o una nueva tarea de respaldo (BK) al servidor de la base de datos, conectamos un servidor adicional a la matriz de discos y en todos estos casos encontramos una disminución en su rendimiento. Entonces puedes ir de diferentes maneras.

Por ejemplo, agregue un servidor de base de datos y transfiérale una instancia de base de datos, agregue unidades de respaldo para acelerar el almacenamiento de datos, actualice los procesadores, etc. Sin embargo, vale la pena recordar que simplemente aumentar la capacidad del hardware es lo menos rentable en términos de costos de material y tiempo. Es mucho más eficaz resolver estos problemas al nivel de la lógica de las soluciones de TI.

Causas del deslizamiento

Los problemas de rendimiento de la matriz a menudo se deben al hecho de que la configuración inicial no tiene en cuenta su arquitectura, principios operativos y limitaciones existentes. Por ejemplo, el talón de Aquiles de las matrices de generaciones anteriores es el rendimiento relativamente bajo de los buses internos: alrededor de 200 Mb/s. No hace mucho, uno de los clientes nos pidió que analizáramos el rendimiento de su matriz de discos y le brindáramos recomendaciones para su optimización. De hecho, la matriz no se cargó y su velocidad periódicamente dejaba mucho que desear. El análisis reveló una configuración incorrecta: en general, durante el día, los discos internos se cargaban aproximadamente por igual, pero los picos de carga se distribuían de manera desigual entre ellos. Como resultado, uno de los autobuses internos quedó sobrecargado. Es decir, la matriz "resbaló" debido a que se excedió el umbral máximo permitido para un componente. Nuestra recomendación (reparticionarlo para cargar los neumáticos interiores de manera uniforme) ayudó a aumentar la productividad en un 30 %.

El error también puede aparecer al conectar servidores a sistemas de almacenamiento. Un ejemplo es una configuración incorrecta de la capacidad del disco que se presenta a los hosts. El hecho es que algunas de las matrices modernas tienen restricciones en un parámetro como la cola de comandos (Queue Depth, QD). Vale la pena profundizar un poco más en la historia aquí. En el estándar SCSI-I, el controlador del servidor SCSI tenía que esperar a que se completara un comando antes de enviar el siguiente. Desde el estándar SCSI-II y superior, el controlador SCSI puede enviar varios comandos (QD) al disco SCSI al mismo tiempo. Cantidad máxima Los comandos SCSI con servicio paralelo son una de las características más importantes del disco. El parámetro IOPS (operación de entrada y salida por segundo) muestra cuántas solicitudes (comandos SCSI) por segundo es capaz de ejecutar el LUN SCSI. Resulta que QD e IOPS pueden entrar en conflicto irreconciliable entre sí.

Es muy posible que las características de E/S en el lado del servidor sean inaceptables, el tiempo de respuesta a las solicitudes sea muy largo y la matriz no esté cargada. La razón radica en: configuración incorrecta de la cola de comandos (más alta de lo permitido): los comandos se cuelgan en el búfer de matriz hasta que llega su turno de ejecución. En el servidor se registran grandes tiempos de servicio.

Si QD es significativamente menor que el valor óptimo, el rendimiento también se verá afectado. Con un tiempo de respuesta excelente y una matriz descargada, la cantidad de solicitudes que procesa será muy pequeña. La razón de esto es la larga espera en la cola antes de enviar solicitudes al sistema de almacenamiento.

Atrapando IOPS por la cola

¿Qué hacer si el tiempo de respuesta está fuera de serie y la matriz no está cargada? ¿O si simplemente desea “exprimir” un poco más la matriz?
Poder:

Mire la configuración de Profundidad de la cola en el servidor y compare la cola de comandos máxima permitida con el LUN de la matriz. Ajustar la configuración;
Mire las estadísticas de la matriz. Quizás se esté acumulando una cola de comandos al LUN;
divida un LUN en varios y conéctelo en el host en banda o al menos en concatenación, según la configuración. La concatenación es útil si la carga se distribuye entre todos los LUN.
Elija un tamaño de unidad de banda en el arreglo y el host para que una operación de aplicación típica cargue la menor cantidad posible de discos físicos en el arreglo.

Arroz. 1. Tamaño de la unidad de franjas

Un ejemplo de nuestra experiencia: la combinación servidor-matriz del cliente no mostró el nivel de rendimiento declarado. Como resultado del análisis, resultó que al servidor se le asignó un LUN muy grande (varios terabytes): el rendimiento de las aplicaciones no fue satisfactorio y el LUN en sí estaba sobrecargado con una cola de comandos. Recomendamos dividir este LUN en varios y distribuir los tipos de carga entre diferentes volúmenes. Había 4 instancias de bases de datos girando en el servidor, como resultado, una de ellas comenzó a funcionar 6 veces más rápido y la otra, 2 veces más rápido.

Más no es mejor

Los profesionales de TI del cliente no siempre entienden qué tipo de RAID es el más adecuado para un perfil de carga de aplicación determinado. Todo el mundo sabe que RAID 10 es fiable, resistente a múltiples pérdidas de unidades y demuestra buena velocidad en operaciones aleatorias. No es de extrañar que la mayoría de las veces se elija esta opción tan cara. Sin embargo, si el perfil de carga de la aplicación implica pocas operaciones grabación aleatoria y muchas operaciones de lectura o escritura secuencial, lo óptimo es utilizar RAID 5. En la misma cantidad de discos puede funcionar 1,5 o incluso 2 veces más rápido. Una empresa se acercó a nosotros para mejorar el rendimiento de E/S del disco de una de sus aplicaciones. La aplicación generaba muchas lecturas y pocas escrituras. Se configuró RAID 10 en la matriz y, según las estadísticas, quedó claro que casi la mitad de los discos del grupo RAID estaban inactivos. Con la transición a RAID 5 desde exactamente la misma cantidad de discos físicos, el rendimiento de la aplicación mejoró más de 1,5 veces.

Agradecemos sus comentarios constructivos.

Los problemas de rendimiento afectan a casi todas las empresas que operan un sistema informático. Los ejemplos dados aquí no son los únicos. Muchos problemas asociados con el bajo rendimiento de los arreglos se pueden evitar si se tienen en cuenta la arquitectura y el perfil de carga de la aplicación al configurar el equipo. Al mismo tiempo, la mejora del rendimiento de un sistema informático no debe limitarse a ninguno de sus componentes: un servidor, una matriz, un software o una red de datos. Mejores resultados se puede lograr después de analizar todo el complejo en su conjunto y cambiar la configuración no solo de la matriz, sino también del servidor y las aplicaciones.

Los entusiastas probablemente sabrán cómo realizar estos pasos, pero para aquellos que recién están a punto de familiarizarse con las matrices, dicho material puede resultar útil. Que los seguidores de AMD me perdonen, lo explicaré usando el ejemplo del stand de Wintelidia mencionado anteriormente.

En primer lugar, debe cambiar el modo operativo del controlador del chipset al modo RAID en el BIOS.

Si el cambio se realiza después de instalar el sistema operativo, esto conlleva la pérdida de su funcionalidad y una caída interminable en una pantalla azul. Para resolver este problema, debe utilizar las instrucciones de Microsoft.

Supongamos que todo está bien con esto. Si el sistema operativo aún no se ha instalado, puede ingresar al menú del controlador y crear una matriz en su utilidad. Para hacer esto, necesita tener tiempo para presionar CTRL+I durante la carga.

Si es posible arrancar desde un disco separado, la forma más sencilla es instalar controladores Intel propietarios y utilizar la consola de Rapid Storage Technology. Sujeto a disponibilidad discos adecuados El botón “Crear” estará disponible.

El primer paso es seleccionar el tipo de matriz.

Luego realice la configuración directamente. Es posible no crear un RAID desde cero, sino utilizar un solo disco con datos como base. Además, para todas las matrices (excepto el “espejo”) puede seleccionar el tamaño de la franja de datos, también conocido como tamaño de franja. Esto determina el tamaño de los bloques en los que se dividen los datos. Los valores grandes son útiles para trabajar con archivos grandes, los pequeños, principalmente para pequeñas transacciones estilo DBMS (aunque todo depende en gran medida del DBMS, el tipo de matriz, el tipo de carga, el estado de ánimo de los desarrolladores del firmware del controlador y otros características). Generalmente es mejor dejar la configuración predeterminada.

También puedes habilitar el caché contestar volumen, que está deshabilitado de forma predeterminada. En este caso, los datos escritos en la matriz no se envían inmediatamente a los discos, sino que se almacenan temporalmente en la caché (para un controlador de chipset esto es RAM computadora).

Esto aumenta la velocidad de las operaciones de escritura, pero al mismo tiempo aumenta el riesgo de pérdida de datos en caso de fallas. Todos hacemos “copias de seguridad” (¿¿en serio???) y esperamos RAID-0 máximo rendimiento, por lo que en todas las pruebas de estos arreglos el caché estará habilitado.

También puede administrar el caché de los propios discos en la matriz. Está habilitado de forma predeterminada. Para RAID-1, las mediciones de rendimiento se realizarán sin cachés, ya que en términos de confiabilidad, ya no llega a altas velocidades.

Por cierto, el escenario no es tan exótico. Servidor Windows, al ser un controlador de dominio, siempre desactiva la caché del disco del sistema. Si no hay discreto Controlador RAID y, que obedece únicamente a su controlador, la velocidad de los discos duros disminuirá varias veces. Veamos cómo se comportan los SSD.

En mi caso, deshabilitar el caché a través de Intel RST por alguna razón no funcionó; después de reiniciar, se volvió a encender. Tuve que usar el "Administrador de dispositivos", es decir, desmarcar la casilla de verificación "Permitir el almacenamiento en caché de entradas para este dispositivo" en las propiedades de la matriz RAID.

Esta configuración e Intel RST están interconectados; después de desmarcar la opción "Caché de datos de disco" también pasa al estado "Apagado" y permanece así después de reiniciar.

Como resultado, se probarán las siguientes configuraciones:

Vertex 3 RAID-0, tamaño de banda 32 KB;
Vertex 3 RAID-0, tamaño de banda 128 KB;
Vertex 3 RAID-0, conexión mediante puertos SATA-II;
Vertex 3 RAID-0, CPU lenta (dos núcleos activos, HT deshabilitado, 2400 MHz, 1066 MHz de memoria CL7);
Vertex 3 RAID-1, caché de disco y matriz habilitado;
Vertex 3 RAID-1, caché de disco y matriz deshabilitados;
Crucial M4 RAID-0, tamaño de banda de 32 KB;
Crucial M4 RAID-1, caché de disco y matriz habilitado;
Crucial M4 RAID-1, caché de disco y matriz deshabilitados;
Vértice único 3;
M4 crucial único;
Disco duro WD5000AAKX.

Pruebas en puntos de referencia clásicos

Marca de disco de cristal

Velocidad de lectura lineal, MB/s

Se espera que la velocidad en RAID-0 casi se duplique. El tamaño de la banda prácticamente no tiene ningún efecto en archivos grandes y el punto de referencia no depende del procesador. Pero la conexión SATA-II limita drásticamente las capacidades del sistema al nivel de un solo dispositivo conectado a través de SATA-III.

RAID-1 funciona sorprendentemente rápido; lee desde dos unidades simultáneamente. Anteriormente en pruebas duras Esto no se observó en los discos, pero se trataba de una plataforma y controladores más antiguos. Si es necesario, deberás comprobar un par de discos duros. Velocidad de grabación lineal, MB/s