Es importante comprender el alcance de la implementación de agrupaciones en clusters de los dispositivos Sun ZFS Storage Appliance. El término "cluster" se usa en la industria para hacer referencia a numerosas tecnologías diferentes que tienen una variedad de propósitos. Aquí se utiliza para hacer referencia a un metasistema compuesto por dos controladores de dispositivos y almacenamiento compartido, que se emplea para proporcionar una mejor disponibilidad en caso de que uno de los controladores presente ciertos fallos de hardware o software. Un cluster contiene exactamente dos controladores de almacenamiento o dispositivos, a los que en este documento se hace referencia como controladores. Cada controlador puede tener asignada una recopilación de recursos de almacenamiento, red y otros recursos del juego disponible para el cluster, lo que permite la construcción de una de dos topologías principales. Muchas personas usan el término activo-activo para describir un cluster en el que hay dos (o más) agrupaciones de almacenamiento, una asignada a cada controlador, junto con recursos de red utilizados por los clientes para alcanzar los datos almacenados en esa agrupación, y el término activo-pasivo para hacer referencia a un cluster en el que un único grupo de almacenamiento se asigna al controlador designado como activo junto con sus interfaces de red asociadas. Ambas topologías son compatibles con Oracle ZFS Storage Appliance. La distinción entre ellas es artificial; no hay ninguna diferencia de software ni hardware entre ellas y se puede alternar libremente entre las dos con la simple agregación o destrucción de una agrupación de almacenamiento. En ambos casos, si uno de los controladores falla, el otro (el par) toma el control de todos los recursos conocidos y proporciona los servicios asociados con esos recursos.
Como alternativa a tener que incurrir en horas o días de tiempo de inactividad mientras se repara el controlador, la agrupación en clusters le permite al dispositivo par proporcionar los servicios mientras se realiza la reparación o sustitución. Asimismo, los clusters admiten la actualización gradual del software, lo que puede reducir las interrupciones comerciales asociadas con la migración a software más reciente. Algunas tecnologías de agrupación en clusters tienen ciertas capacidades adicionales más allá de la mejora de la disponibilidad. El subsistema de agrupación en clusters Oracle ZFS Storage Appliance no está diseñado para proporcionarlas. En particular, no proporciona equilibrio de carga entre varios controladores, no mejora la disponibilidad en caso de fallo del almacenamiento, no ofrece a los clientes un espacio de nombres de sistema de archivos unificado entre varios dispositivos ni divide la responsabilidad de servicio en un área geográfica amplia con fines de recuperación ante desastres. Estas funciones también están fuera del alcance de este documento. Sin embargo, la familia de productos Oracle ZFS Storage Appliance y los protocolos de datos que ofrece admiten numerosas funciones y estrategias que pueden mejorar la disponibilidad:
Replicación de datos, que se puede utilizar para la recuperación de desastres en uno o varios sitios geográficamente remotos.
Reflejo de datos en el cliente, que se puede llevar a cabo con LUN iSCSI redundantes proporcionados por varios servidores de almacenamiento desde ubicaciones arbitrarias.
Equilibrio de carga, que está incorporado en el protocolo NFS y se puede proporcionar para otros protocolos mediante hardware o software externos (se aplica a datos de solo lectura).
Componentes de hardware redundantes, que incluyen fuentes de alimentación, dispositivos de red y controladores de almacenamiento.
Software de gestión de fallos, que puede identificar componentes defectuosos y retirarlos de servicio, y orientar a los técnicos para reparar o reemplazar el hardware correcto.
Redundancia de tejido de red proporcionada por la funcionalidad LACP e IPMP
Dispositivos de almacenamiento redundante (RAID)
En las secciones correspondientes de este documento, se puede encontrar información adicional acerca de otras funciones de disponibilidad.
Al decidir entre una configuración en clusters o independiente para el sistema Oracle ZFS Storage Appliance, es importante considerar los costos y los beneficios de la operación en clusters. En todo el sector de tecnología de la información, es práctica común considerar la agrupación en clusters como una decisión de arquitectura automática, pero esta concepción refleja una vista idealizada de los riesgos y las recompensas de la agrupación en clusters promulgada por algunos proveedores del sector. Además del evidente mayor costo inicial y continuo de hardware y soporte asociado con el segundo controlador, el uso de la agrupación en clusters también impone riesgos técnicos y operativos adicionales. Algunos de estos riesgos se pueden mitigar asegurándose de que todo el personal esté bien capacitado en operaciones con clusters; otros son intrínsecos del concepto de la operación en clusters. Estos riesgos incluyen:
El potencial de intolerancia de las aplicaciones con respecto a los comportamientos dependientes del protocolo durante la toma de control.
La posibilidad de que el software del cluster en sí falle o induzca un fallo en otro subsistema que no habría ocurrido en la operación independiente.
Aumento de la complejidad de gestión y mayor probabilidad de error de un operador al realizar tareas de gestión.
La posibilidad de que se produzcan varios fallos o un error de operador grave que generen pérdida o daño de datos que no se habrían producido en una configuración independiente.
Mayor dificultad para recuperarse de estados de software o hardware no anticipados.
Estos costos y riesgos son fundamentales, se aplican de una u otra forma a todos los productos agrupados en clusters o con capacidad para agruparse en clusters del mercado (incluido Oracle ZFS Storage Appliance) y no se pueden mitigar ni eliminar por completo. Los arquitectos de almacenamiento deben sopesarlos contra la principal ventaja de la agrupación en clusters: la oportunidad de reducir períodos de no disponibilidad de horas o días a minutos o menos en el extraño evento de un fallo catastrófico de hardware o software. El hecho de que el análisis de la relación costo-beneficio favorezca o no el uso de la agrupación en clusters en una implementación del sistema Oracle ZFS Storage Appliance dependerá de factores locales, como condiciones de SLA, personal de asistencia técnica disponible y sus cualificaciones, limitaciones presupuestarias, la probabilidad percibida de diversos fallos posibles y la idoneidad de estrategias alternativas para mejorar la disponibilidad. Estos factores dependen mucho del sitio, la aplicación y la empresa, y se los debe evaluar caso por caso. La comprensión del material detallado en lo que resta de esta sección lo ayudará a hacer las elecciones apropiadas durante el diseño y la implementación de su infraestructura de almacenamiento unificado.
Temas relacionados