Tolerancia a fallos

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En informática, el concepto de tolerancia a fallos (en inglés: failover) hace referencia a la capacidad de un sistema de acceder a la información, aun en caso de producirse algún fallo o anomalía en el sistema.

Una posibilidad es que el fallo se deba a daños físicos en uno o más componentes de hardware, con la consiguiente pérdida de la información almacenada. La implementación de la tolerancia a fallos requiere que el sistema de almacenamiento guarde la misma información en más de un soporte físico (redundancia), o en un equipo o dispositivo externo a modo de respaldo. De esta forma, si se produce alguna falla que pueda ocasionar pérdida de datos, el sistema debe ser capaz de restablecer toda la información, recuperando los datos necesarios a partir de algún medio de respaldo disponible.

Por lo general, el concepto de tolerancia a fallos se identifica con el sistema de almacenamiento en RAID (Redundant Array of Independent Disks). Los sistemas RAID (a excepción de RAID 0) se basan en la técnica mirroring («en espejo»), que permite la escritura simultánea de los datos en más de un disco del array.

Los sistemas de almacenamiento con tolerancia a fallos son vitales en ambientes donde se trabaje con información crítica, como en el caso de las entidades financieras, gobiernos, corporaciones, etc. El nivel de tolerancia a fallos dependerá de la técnica de almacenamiento utilizada y de la cantidad de veces que la información se encuentre replicada. No obstante, la tolerancia frente a errores nunca es absoluta, puesto que si fallasen todas las réplicas (mirrors) disponibles, incluyendo la copia original, la información quedaría incompleta y corrupta, y lo que es peor: irrecuperable.

Enlaces externos[editar]

Véase también[editar]