Portada » Informática » Raid de discos con fallos
Raid es un método de combinación de varios discos duros para formar una única unidad lógica en la que se almacenan los datos de forma redundante. En este método la información se reparte entre varios discos, usando técnicas como el entrelazado o la duplicación de discos para proporcionar redundancia, reducir el tiempo de acceso, y/o obtener mayor ancho de banda para leer y/o escribir.
La tecnología RAID protege los datos, si se produce un fallo, mantiene el servidor activo. También los sistemas RAID suponen la perdida de parte de la capacidad de almacenamiento, para conseguir redundancia o almacenar los datos de paridad.
—Tolerancia a fallos: RAID protege contra la pérdida de datos o
—Mejora del Rendimiento/ Velocidad: RAID permite a varias unidades trabajar en paralelo, lo que aumenta el rendimiento del sistema.
—Mayor Fiabilidad: RAID emplea dos técnicas para aumentar la fiabilidad:
—La redundancia de los datos implica el almacenamiento de los mismos datos en más de una unidad. Es muy eficaz pero también es muy costoso.
—La paridad de datos se realiza mediante un algoritmo matemático. Es menos costoso que la redundancia, ya que no requiere el uso de un conjunto redundante de unidades de disco.
—Alta Disponibilidad: Se divide en dos aspectos:
—La integridad de los datos, capacidad de obtener los datos adecuados en cualquier momento. Reparación dinámica de sectores.
—La tolerancia a fallos capacidad para mantener los datos disponibles en caso de que se produzcan uno o varios fallos en el sistema
la elección de los diferentes niveles de RAID depende de las necesidades del usuario como el factor de seguridad, velocidad, capacidad, coste, etc.
cada nivel de RAID ofrece una combinación especifica de tolerancia a fallos (redundancia), rendimiento y coste. Diseñados para satisfacer necesidades de almacenamiento. No hay un nivel de RAID mejor que otro, cada uno es apropiado para determinadas aplicaciones y entornos informáticos. Lo más frecuente es el uso de varios RAID para distintas aplicaciones del mismo servidor. Existen 6 niveles diferentes de RAID (0 al 6 + las posibles combinaciones 10, 50…)
RAID 0 disk Striping “la más alta transferencia, pero sin tolerancia a fallos.”
conocido como separación o fraccionamiento.
los datos se desglosan en pequeños segmentos y se distribuyen entre varias unidades. Este nivel de “array” o matriz no ofrece tolerancia al fallo.
el fallo de cualquier disco de la matriz es igual a la perdida de los datos y sería necesario restaurarlos con copia seguridad.
consiste en una serie de unidades de disco conectadas en paralelo que permiten una transferencia simultanea de datos a todos ellos, con lo que se obtiene una gran velocidad en las operaciones de lectura y escritura. – La velocidad de transferencia de datos aumenta en relación al número de – discos que forman el conjunto.
este array es aconsejable en app de tratamiento de imágenes, video, audio. Se necesita un mínimo de dos unidades de disco para implementar RAID 0.
RAID 1 mirroring “redundancia. Igual de rápido, pero más seguro”
llamado duplicación (discos en espejo)
–Utiliza discos adicionales sobre los que se realiza una copia en todo momento de los datos que se están modificando.
–ofrece disponibilidad de los datos mediante la redundancia total (se duplican todos los datos de una unidad en otra). Con esto se asegura la integridad de los datos y la tolerancia al fallo, en caso de avería se seguirá trabajando con los discos no dañados.
–se pueden leer los datos desde una unidad duplicada sin que se produzcan interrupciones. (es costoso para los grandes sistemas).
–soluciona las apps que requieren redundancia cuando hay solo dos unidades disponibles. Los servidores de archivos pequeños son un buen ejemplo.
–Se necesita un mínimo de dos unidades de disco para implementar RAID 1
RAID 0+1 es una excelente solución para cualquier uso que requiera gran rendimiento y tolerancia a fallos, pero no una gran capacidad.
—se utiliza en entornos como server de app que permiten a los usuarios acceder a una app en el server y almacenar datos en sus discos duros locales, o como los servers web.
Comprobación y rapidez.
Seguridad y velocidad. Acceso independiente con paridad distribuida.
ofrece tolerancia al fallo, pero además, optimiza la capacidad del sistema permitiendo una utilización de hasta el 80% de la capacidad del conjunto de discos.
(se consigue mediante el cálculo de información de paridad y su almacenamiento alternativo por bloques).
si falla un disco se puede recuperar la información en tiempo real, mediante operaciones de lógica, sin que el server deje de funcionar.
para evitar el problema de cuello de botella no asigna un disco especifico a esta misión, sino que asigna un bloque alternativo de cada disco a esta misión de escritura.
al distribuir la función de comprobación entre los discos, se disminuye el cuello de botella, proporcionando una velocidad equivalente a RAID 0.
RAID 5 es el nivel de RAID más eficaz y el de uso preferente para las apps de server básicas para la empresa.
Comparado con otros niveles RAID con tolerancia a fallos, RAID 5 ofrece la mejor relación rendimiento-coste en un entorno con varias unidades.
Es el indicado para trabajar con sistemas operativos MULTIUSUARIOS!!. – Se necesita un mínimo de tres unidades para implementar una solución – RAID 5.
El resultado óptimo de capacidad se obtiene con 7 o más unidades.
es la solución más económica por megabyte, que ofrece la mejor relación de precio, rendimiento y disponibilidad para la mayoría de los servers.
Acceso paralelo con discos especializados. Redundancia a través del código Hamming” adapta la técnica usada para detectar y corregir errores en memorias de estado sólido.
Acceso síncrono con un disco dedicado a paridad” Dedica un único disco al almacenamiento de información de paridad. Se necesita un mínimo de tres unidades para implementar RAID 3.
Comprobación. Acceso Independiente con un disco dedicado a paridad.
Dedica un disco para guardar la información de paridad de los otros discos Se necesita un mínimo de tres unidades para implementar RAID 4.
Acceso independiente con doble paridad.
Similar al 5, pero incluye un segundo esquema de paridad distribuido por los distintos discos.
Tolerancia extremadamente alta a los fallos y a las caídas de disco, ofreciendo dos niveles de redundancia.
Coste de implementación es mayor al de otros niveles.
La gestión de volúMenes lógicos proporciona una vista de alto nivel sobre el almacenamiento en un ordenador, en vez de la tradicional vista de discos y particiones.
Los volúMenes de almacenamiento bajo el control de LVM pueden ser redimensionados y movidos a voluntad.
Permite la administración en grupos definidos por el usuario, permitiendo al admin del sistema tratar con volúMenes llamados “ventas” en vez de nombres de dispositivos físicos como “sda”.
—La necesidad de estimar cuanto espacio será necesario para el sistema, para los temporales o para los datos personales, puede ser un problema porque usuarios optan por crear una partición que ocupe todo el disco.
—Aun habiendo estimado cuanto espacio se necesita para cada directorio, es bastante común que nos quedemos sin especio en estas particiones.
cuando un nuevo disco se añade al sistema, no es necesario mover los datos de los usuarios. (se añade un nuevo disco al grupo lógico).
—También se pueden migrar los datos de discos antiguos a otros nuevos.
Un NAS es un equipo de almacenamiento que no está conectado directamente a un computador, sino que se accede a ellos a través de la red LAN. Su propósito es el servicio especializado ficheros.
El uso de dispositivos NAS permite separar en máquinas diferentes el servicio de gestión de los datos, del servicio de almacenamiento de los mismos, y aprovechar las ventajas de este hecho.
Se compone de un sistema de almacenamiento al que cualquier equipo con los permisos adecuados puede acceder. El cliente se descargará los archivos del servidor y trabajará de manera local en su sistema de archivos.
El servidor NAS sólo presta el servicio de acceso a ficheros, no realiza ninguna otra labor, por lo que tiene un hardware simple. Suelen tener una gran memoria RAM, para proporcionar caché de disco. Utilizan SO especializados, como freeNAS.
—Permite compartir datos entre sistemas heterogéneos: Cualquier cliente conectado a la Red que utilice los protocolos estándares puede acceder a los ficheros almacenados en la NAS.
—Es un sistema de almacenamiento compartido de bajo precio, comparado con la alternativa SAN.
—Son dispositivos especializados, sólo proporcionan el servicio de almacenamiento. Por lo que tienen un gran rendimiento, disponibilidad y fiabilidad.
—Son muy escalables, basta con ir conectando más dispositivos a la red.
—Son muy fáciles de usar y mantener gracias a su simplicidad.
—Facilitan la implantación de proyectos de gestión de copias de seguridad y de tolerancia a errores.
—Su rendimiento está directamente relacionado con el rendimiento de la red LAN.
—El rendimiento de las operaciones de E/S es menor, especialmente al trabajar con fichero de gran tamaño.
—No es un medio de almacenamiento válido para tipo de aplicaciones, debido al uso de un protocolo de transferencia de ficheros.
—La capacidad de ampliación de los NAS es menor que los SAN
SAS es una tecnología de transferencia de datos desde y hacia discos duros. En una red SAN se utiliza la virtualización del espacio de almacenamiento, es decir se abstrae la organización lógica del espacio de almacenamiento de su organización física. Todos los dispositivos de almacenamiento masivo de la organización organizan como un solo bloque de espacio de almacenamiento. Este bloque se divide en particiones que se utilizan para diferentes usos.
—Rapidez: permite acceder a la información de forma rápida. Las conexiones a la red SAN son de alta velocidad gracias a la fibra óptica pudiendo alcanzar los 4GBps.
—Alcance: aprovecha las capacidades de la fibra óptica para poder tener conexiones de hasta 10km sin routers.
—Control: se consigue una administración centralizada y homogénea. Se reasigna espacio de almacenamiento sin hacer modificaciones en las conexiones físicas. Permite modificad la ubicación física de los datos de forma transparente a los servidores.
—Libra a la red LAN de sobrecargas por tráfico de datos
—Son escalables y muy flexibles
—Utilización de los recursos poco eficaz: un servidor puede necesitar espacio libre de almacenamiento mientras que a otro le puede sobrar.
-Se genera redundancia de datos: se puede producir la copia innecesaria de un mismo archivo en varios servidores, por lo que se estaría ocupando espacio de forma innecesaria.
—Colapsos en la red LAN: durante los procesos de tratamiento masivo de datos, la red puede colapsarse.
—Dificultad de administración: los servidores deben saber en qué equipo NAS está el fichero que necesita.