Sistemas RAID

Un RAID (grupo / matriz redundante de discos independientes, Redundant Array of Independent / Inexpensive Disks en inglés) es un sistema que consta de un número de discos combinados en una unidad lógica. Todos los discos se administran por uno o varios controladores. Por regla general, los RAID se constan de discos duros, aunque hoy en día es probable que estén compuestos por SSD (discos de estado sólido). El objetivo de dicho sistema es aumentar la velocidad de lectura y escritura de datos y mejorar la seguridad del almacenamiento de los últimos.

Las matrices difieren tanto en el número de discos, como en los métodos de distribución de datos entre los discos. El método de distribución de datos se denomina el tipo o nivel de RAID. Aparte de características técnicas, el nivel también determina las propiedades de la matriz, la velocidad de operación y su capacidad para resistir fallos de hardware.

Hay varios niveles, cada uno con sus propias características y usos específicos. Además, casi todos los controladores de matriz están provistos del modo JBOD (en inglés, just a bunch of disks, "solo un grupo de discos/unidades"), es decir, un modo en el que funcionan como un conjunto convencional de discos, no como un sola unidad.

La mayoría de los niveles de RAID (excepto RAID 0) pueden seguir funcionando en caso de que uno o más discos fallen, al cambiar al llamado modo degradado o al modo de funcionalidad limitada, en el que la protección de datos está restringida (o ausente) y la velocidad está limitada.

RAID 0

Estructura de datos de RAID 0 RAID0 se basa en la tecnología de división de datos en bloques (striping en inglés) y su distribución equitativa entre todos los discos de la matriz (stripe o banda). Dicha distribución aumenta sensiblemente la velocidad de operación de todo el sistema, debido a que la lectura/escritura puede realizarse por múltiples discos a la vez.

Desafortunadamente, la tecnología no se fija mucho en la fiabilidad. Si uno de los discos falla, los datos de toda la matriz serán prácticamente irrecuperables.

RAID 0 es una opción de almacenamiento de datos perfecta en los casos cuando la velocidad es más importante que la fiabilidad, por ejemplo, sirve bien para los servidores que se utilizan para la transmisión de vídeo o edición de fotos.

Ventajas:

La mayor productividad entre todos los tipos de RAID.
Alta velocidad de escritura/lectura de datos.
El usuario puede utilizar toda la capacidad de la matriz para escribir datos.
La opción más barata con respecto a los gastos por 1GB de almacenamiento de datos.

Desventajas:

Fiabilidad relativamente baja. Cualquier fallo puede provocar la pérdida de datos.

RAID 1

Estructura de datos de RAID 1 En este tipo de matriz se utiliza la tecnología de duplicación (mirroring en inglés), es decir, cada disco de datos tiene su gemelo idéntico que lo reproduce completamente. Por lo tanto, RAID 1 se consta de dos o más unidades: gemelos exactos.

Esto significa que en el caso de la duplicación simple (en dos componentes), sólo la mitad de la capacidad total de la matriz está disponible para el usuario, lo que aumenta dos veces el precio del almacenamiento de datos, es decir, para una matriz RAID1 de 500GB se debe comprar 2 discos de 500GB cada uno. Por otro lado, si falla un disco, puede reemplazarlo rápidamente por uno nuevo. El sistema al instante copia los datos del disco restante y los guarda en el nuevo. Para montar un RAID 1, debe tener a mano al menos dos discos.

RAID 1 se destaca por la fiabilidad alta que a menudo se logra a costa de la reducción de la velocidad de escritura de datos. La información primero se escribe en un disco y luego en el otro. Sin embargo, la velocidad de lectura puede ser alta debido a que los datos se pueden leer en paralelo. Estas características dependen por completo de la configuración del hardware (o software) de RAID.

RAID 1 sirve bien para almacenar datos críticos y es una solución ideal, por ejemplo, para sistemas de contabilidad, así como para pequeños servidores de datos.

Ventajas:

Alta tolerancia a fallos.
La matriz seguirá funcionando incluso después del fallo de uno de los discos de datos (si su copia duplicada está presente).
Alta velocidad de lectura (dependiendo del controlador).
La configuración más extendida con el mayor soporte entre todos los tipos de RAID.

Desventajas:

Baja velocidad de escritura (sin controladores independientes).
Sólo la mitad del espacio en disco está disponible para el usuario.
Alto precio por gigabyte.

RAID 2 y RAID 3

Estructura de datos de RAID 2 y RAID 3

RAID 2 también utiliza la tecnología de división de datos (el mencionado striping), pero los divide en bytes en lugar de bloques. Para asegurar la tolerancia a fallos, RAID 2 reserva cierto espacio para el código de Hamming, es decir, para ensamblar este tipo de matriz, se necesitan al menos tres discos.

RAID 3 divide los datos en bytes y luego los distribuye entre los discos. Además, cuenta con un disco separado dedicado a la corrección de fallos en la matriz.

Debido a la distribución de datos byte a byte, todos los componentes de la matriz funcionan como una sola unidad. Esto implica que sólo se puede realizar una operación a la vez. Este tipo de matrices se utilizan raramente.

RAID 4

Estructura de datos de RAID 4

RAID 4 también aplica el método de división de datos (striping) y utiliza un disco separado para la corrección de errores. Sin embargo, a diferencia de los niveles 2 y 3, en este caso, los datos se dividen en bloques. De esta manera, los discos pueden funcionar de forma independiente y realizar varias operaciones de lectura a la vez. Así que, la matriz se caracteriza por la lectura de alta velocidad, al igual que RAID 0. Y la velocidad de escritura es baja, debido a la necesidad de mantener la información de paridad en un disco adicional dedicado a la corrección de errores, cuyos datos se deben actualizar cada vez que se escribe una nueva información.

Para ensamblar un RAID 4, se necesitan como mínimo tres discos. Por otro lado, este tipo de RAID es ampliamente utilizado debido a la relación adecuada entre la velocidad y la fiabilidad. Si uno de los bloques se pierde, el sistema puede recuperarlo por sí mismo, utilizando los bloques adyacentes y la información de paridad.

Ventajas:

Tolerancia a fallos bastante alta, capacidad de auto-recuperación.
Puede funcionar en el modo de funcionalidad limitada.
Alta velocidad de lectura de datos.

Desventajas:

Escritura de datos de baja velocidad, ya que uno de los discos está dedicado a la corrección de errores.
Velocidad de lectura sensiblemente reducida en el modo de funcionalidad limitada.
Si se pierde uno de los discos, en la recuperación de datos se puede tardar mucho tiempo. Y si durante este proceso falla un disco más, los datos se pueden perder de forma irreversible.

RAID 5

Estructura de datos de RAID 5

RAID 5 es probablemente la configuración RAID más extendida entre los almacenamientos NAS. En la actualidad, RAID 5 se considera una opción con la mejor relación entre el precio, la velocidad y la calidad.

RAID 5 es casi idéntico a RAID 4, sin embargo, no escribe la información de paridad en un disco separado, sino la distribuye equitativamente entre todos los discos. Esto significa que RAID 5 puede sobrevivir el fallo de uno de los discos sin perder los datos ni el acceso a él, porque los datos y la información de paridad ubicados en los discos sirven para recuperar los bloques perdidos.

Dependiendo del proveedor, así como de la capacidad de producción y del objetivo, los sistemas RAID del nivel 5 pueden diferir en los métodos de distribución de datos y la información de paridad.

Para construir una matriz del nivel 5, se necesitan al menos tres discos.

Ventajas:

Alta velocidad de lectura y escritura.
Si uno de los discos falla, el usuario todavía tiene acceso a los datos (en el modo de funcionalidad limitada).
Tolerancia a fallos y errores.

Desventajas:

El fallo de uno de los discos reduce la productividad.
Si se pierde uno de los discos, la recuperación de datos en un disco nuevo puede requerir mucho tiempo. Y si durante este proceso falla un disco más, los datos se pueden perder de forma irreversible.

RAID 6

Estructura de datos de RAID 6

RAID 6 es similar a RAID 5, pero hay una diferencia: en lugar de la información de paridad se utiliza el código Reed-Solomon doble que se escribe en dos discos. Por lo tanto, el número mínimo de discos aumenta a cuatro y el sistema puede seguir funcionando incluso en el caso de la pérdida de dos discos.

RAID híbrido

Hay unos niveles populares de matrices complejas, por ejemplo, RAID10 (1+0), RAID01(0+1), RAID50(5+0), etc.

RAID10 es una matriz RAID 0 que consta de matrices RAID 1, mientras que RAID 01 es una matriz RAID 1 compuesta por matrices RAID 0. De manera similar, RAID 50 es una matriz RAID 0 que abarca matrices RAID 5.

Estas combinaciones sirven para mejorar la productividad y la tolerancia a fallos, pero esto se logra a costa de un aumento significativo del precio. Por ejemplo, para construir un medio RAID 10, uno necesita al menos cuatro discos duros.

La combinación de dos o más matrices RAID 5 en RAID 0 acelera notablemente el rendimiento, gracias al uso de datos en paralelo.

RAID 10 y RAID 50 se han vuelto muy populares, debido a la simplicidad de implementación y a la combinación de una velocidad suficientemente alta con opciones de copia de seguridad, aunque el precio alto no permite emplearlos en sistemas pequeños. RAID 01 no goza de gran popularidad, ya que en cuanto a las características es prácticamente idéntico a RAID 10.

Recuperación de datos

Los datos perdidos debido a un fallo de RAID sí se pueden recuperar.

Los síntomas posibles del sistema RAID dañado:

La matriz está en el modo limitado, pero aún se puede acceder a todos los archivos.
Un RAID fue recuperado incorrectamente después de la pérdida de datos, se cambiaron los ajustes o los números ordinales de discos; el acceso a los archivos está limitado o es ausente en absoluto.
El estado del almacenamiento RAID es "no activo", "no encontrado", "apagado", al mismo tiempo que el sistema no lo detecta y el acceso a los archivos está bloqueado.

Los RAID se enfrentan con los problemas de pérdida de datos típicos de los discos duros regulares: eliminación accidental, fallos de software, sobrescritura, daños del sistema de archivos, etc. Por lo tanto, si RAID funciona como siempre, pero no se puede acceder a los datos, la pérdida puede ser causada por otro problema, como un error del operador o virus informáticos.

Además, los fallos de RAID pueden deberse al fallo del controlador o al daño del disco. Dependiendo del nivel de RAID, esto puede conducir a algunas dificultades y restricciones en referencia al proceso de recuperación de datos.

NIVEL DE RAID	FALLO DEL CONTROLADOR	FALLO DEL DISCO
RAID 0	Es posible recuperar los datos, si dispone de la información sobre el orden de los discos.	Si la recuperación de algún disco es imposible, la recuperación de datos tampoco es posible.
RAID 1	Los datos son fáciles de recuperar desde cualquier componente.
RAID4, RAID5	Los datos se pueden recuperar con facilidad. Para recuperar los datos, se requiere la información sobre el número ordinal del disco, sobre el tamaño del bloque y sobre el método de distribución de la información de paridad.	Es posible recuperar los datos, en el caso de que sólo uno de los discos esté dañado. Si se dañan más discos, la recuperación es imposible.
RAID 6	Los datos se pueden recuperar con facilidad. Para recuperar los datos, se requiere la información sobre el número ordinal del disco, así como sobre el tamaño del bloque y sobre el método de distribución Reed-Solomon.	Los datos se pueden recuperar con facilidad, en el caso de que uno o dos discos estén dañados. Si se dañan más discos, la recuperación es imposible.
Matrices complejas	Hay que realizar la reconstrucción de cada componente de la matriz compleja y luego ensamblar una matriz de componentes (de un nivel superior).	Los datos se pueden recuperar en el caso de que un número suficiente de componentes aún no esté dañado. Por ejemplo, en el caso de RAID 50, es necesario que cada uno de los componentes de RAID 5 funcione, al menos en el modo de funcionalidad limitada.

Unidad de almacenamiento como parte de RAID

Se sabe que cada unidad de almacenamiento de datos tiene sus propias características, como tipo, tamaño, modelo, fabricante, etc. Esta información se encuentra en el disco y generalmente es programada por su fabricante, dejándole al usuario una pequeña posibilidad de modificación.

Si un disco forma parte de un RAID, obtiene una etiqueta correspondiente del controlador de RAID, ya sea de un NAS o de la placa base. Esta etiqueta contiene la información sobre la cantidad de discos en el grupo, la configuración de RAID, el tamaño de la banda, etc. Si un usuario decide utilizar un disco de un sistema RAID, debe tener en cuenta que esta etiqueta puede permanecer en la unidad incluso después de que se haya extraído del sistema y formateado. A pesar de esto, el disco aún se puede sacar del sistema y utilizar con éxito para otros fines: como disco duro básico de una computadora, como parte de otro medio de almacenamiento de datos, como almacenamiento extraíble, etc.

Cuando se necesita recuperar los datos y el disco se abre por medio de Recovery Explorer, el programa escanea sus propiedades para detectar el tipo de dispositivo. Si los discos son o solían ser partes de un RAID, Recovery Explorer encontrará sus etiquetas y solicitará que se ensamblen en un solo sistema. Al mismo tiempo, el programa puede realizar el ensamblaje automático una vez reciba el permiso del usuario.

Si está seguro de que el disco que se va a recuperar solía ser parte de un RAID, pero ya no lo es, rechace el ensamblaje automático que ofrece el programa e ignore las advertencias. En caso contrario, si el disco todavía forma parte de un RAID, debe asegurarse de que todos los demás discos (los componentes del mismo RAID) también estén conectados y luego realizar al ensamblaje de RAID. Puede hacerlo manualmente o dejar que el programa lo haga automáticamente.

¿Cómo puedo recuperar los datos de un RAID?

En vista de que un RAID es un medio de almacenamiento complejo que consta de múltiples discos organizados en un sistema lógico, generalmente se debe reensamblarlo antes de realizar la recuperación de datos. Recovery Explorer automáticamente detecta los metadatos de RAID en los discos y ensambla los últimos en un almacenamiento de datos virtual. Aún así, si se ha perdido alguno de los metadatos del RAID, le recomendamos utilizar herramientas de recuperación de datos diseñadas especialmente para la recuperación y reconstrucción de sistemas RAID complejos.

El proceso de recuperación de datos de un sistema RAID incluye los siguientes pasos:

Apague el RAID;
Saque todos los discos del RAID;
Conéctelos a una computadora;
Cambie a la pestaña Almacenamientos complejos (RAID) en Recovery Explorer (modo Asistente) e inicie la recuperación de datos;
Una vez finalizado el escaneo, revise y guarde los datos recuperados en un lugar seguro.

Manipulaciones con RAID

Los sistemas RAID se suelen utilizar para almacenar una información importante, cuya pérdida no es deseable. Así que, los usuarios que utilizan los sistemas RAID deben conocer todas las medidas que se deben tomar para evitar que esto suceda.

Configuración de RAID

¿Hay suficientes refrigeradores para enfriar el almacenamiento?

Cualquier disco duro se calienta al funcionar, y cuando hay muchos de ellos, la negligencia en referencia a las regulaciones y los requisitos de refrigeración puede provocar los fallos. Cuando la matriz se sobrecalienta, puede fallar, por lo que se debe equipar con una refrigeración adecuada. Antes de configurar un almacenamiento, debe asegurarse de que esté provisto de un enfriador que funcione y de que haya suficiente espacio alrededor de la matriz para evitar que se sobrecaliente.

Utilice una fuente de alimentación interrumpida UPS

Si un corte de energía ocurre durante el proceso de escritura de datos, no se escribirán. Aún más, esto aumenta las posibilidades de fallos de discos lógicos y físicos. Para prevenirlos, use una fuente de alimentación ininterrumpida (UPS).

En primer lugar, protege el equipo de los efectos negativos de la fluctuación de voltaje. En segundo lugar, en el caso de un corte de electricidad, el usuario tendrá tiempo para guardar los archivos y apagar el equipo de manera correcta.

Utilice discos de diferentes grupos de producción

La mayoría de los RAID, excepto RAID 0, están optimizados para funcionar en el modo de funcionalidad limitada. Si un disco (o hasta dos en el caso de RAID 6) falla, el sistema seguirá funcionando, pero la velocidad de lectura/escritura se reducirá.

Si fallan más discos (dos), cuando la matriz está funcionando en el modo degradado, los datos se perderán. Por este motivo, se recomienda crear una matriz de discos de diferentes grupos de producción. De esta forma, puede minimizar la probabilidad de que se fallen varios discos simultáneamente.

Mantenimiento de RAID

El orden de los discos puede ser importante

Cada disco de un RAID tiene su número ordinal, y los datos se escriben y se leen en un orden determinado. Algunos controladores establecen el orden de los discos según el orden en el que están conectados. Cuando se cambia el orden de los discos, en algunos casos esto puede provocar problemas, como:

RAID 0: el sistema no puede inicializar los datos del disco correctamente, porque la secuencia de los bloques ha sido cambiada;
cualquier RAID con la información de paridad: es posible que el sistema no comprenda los datos. Es muy probable que cualquier manipulación adicional (por ejemplo, escritura de datos) conduzca a la pérdida de algunos bloques en los discos colocados en el orden incorrecto. La recuperación de dichos datos requiere el uso del software adicional y conocimientos especiales.

La mayoría de los sistemas RAID avanzados pueden detectar el orden de manera automática, si los discos están conectados en el orden correcto. Esto puede resultar útil para el diagnóstico.

¿Formatear o no formatear?

Supongamos que por algún motivo (por ejemplo, para el diagnóstico) un usuario necesita sacar una unidad de un sistema RAID y conectarla a una PC. En este caso, debe leer atentamente los mensajes del sistema operativo.

El sistema puede ofrecer formatear el dispositivo. No se recomienda hacerlo. El formateo puede provocar la pérdida de una información valiosa ubicada en el disco y en consecuencia conducir a un proceso de recuperación de datos largo y lento.

Conectar y desconectar discos

Si el sistema de almacenamiento de datos no dispone de un disco de repuesto, es necesario desconectarlo de una fuente de alimentación antes de realizar cualquier manipulación física con el sistema RAID. Si no lo hace, sus acciones imprudentes pueden causar daños mecánicos en el disco o daños lógicos en los datos.

Y al utilizar el disco de repuesto en caliente, tenga en cuenta las siguientes precauciones:

No se puede utilizar esta función en los discos partes de un RAID en el modo degradado;
No se puede desconectar más de un disco a la vez. Después de desconectar un disco y reemplazarlo, asegúrese de que la reconstrucción de RAID se haya terminado. Sólo después de esto puede desconectar otros discos.

Transporte de RAID

Al transportar un RAID, uno debe tener mucho cuidado para evitar que los discos sufran daños mecánicos. No arroje ni sacuda la matriz. Empaquételo en plástico antiestático y papel de aluminio y protéjalo de las vibraciones con un paquete especial.

Lo que no se permite hacer con RAID: lista de verificación

Antes de realizar cualquier manipulación con un RAID, por favor, consulte la siguiente lista de precauciones:

1. No conecte un RAID a un dispositivo que no disponga de una cantidad suficiente de refrigeradores.
2. No cambie el orden de los discos.
3. Durante el diagnóstico de los discos, lea todos los mensajes del sistema operativo.
4. Antes de realizar cualquier manipulación física, apague los discos.
5. Elimine los daños mecánicos del disco.
6. No exponga la matriz a vibraciones ni otras cargas durante el transporte.