Omitir V�nculos de navegaci�n | |
Salir de la Vista de impresi�n | |
Guía de Oracle Solaris Cluster Data Service para Oracle Oracle Solaris Cluster 4.0 (Español) |
1. Instalación y configuración de HA para Oracle
Descripción general del proceso de instalación y configuración de HA para Oracle
Planificación de la instalación y la configuración de HA para Oracle
Preguntas para la planificación de la configuración
Preparación de los nodos y los discos
Cómo configurar el acceso a la base de datos Oracle con Solaris Volume Manager
Cómo configurar el acceso a la base de datos Oracle con Oracle ASM
Cómo configurar un agente de escucha de SCAN de Oracle Grid Infrastructure para clústeres
Instalación del software de Oracle ASM
Verificación de la instalación del software de Oracle ASM
Instalación del software de Oracle
Cómo instalar el software de Oracle
Cómo definir los parámetros del núcleo de Oracle
Verificación de la instalación y la configuración de Oracle
Cómo verificar la instalación de Oracle
Creación de una base de datos Oracle
Cómo crear una base de datos primaria de Oracle
Configuración de permisos de base de datos de Oracle
Cómo definir permisos de bases de datos Oracle
Instalación del paquete de HA para Oracle
Cómo instalar el paquete de HA para Oracle
Registro y configuración de HA para Oracle
Herramientas para registrar y configurar HA para Oracle
Configuración de propiedades de extensión de HA para Oracle
Cómo registrar y configurar HA para Oracle (clsetup)
Cómo registrar y configurar HA para Oracle sin Oracle ASM (CLI)
Cómo registrar y configurar HA para Oracle con la instancia de Oracle ASM en clúster (CLI)
Verificación de la instalación de HA para Oracle
Cómo verificar la instalación de HA para Oracle
Ubicación de los archivos de registro de HA para Oracle
Ajuste los supervisores de fallos de HA para Oracle
Funcionamiento del supervisor de fallos del servidor de Oracle
Funcionamiento del supervisor de fallos principal
Funcionamiento del sondeo de fallos del cliente de la base de datos
Operaciones para supervisar la partición de registros de rehacer archivados
Operaciones para determinar si la base de datos está en funcionamiento
Análisis de alertas registradas por el supervisor de fallos del servidor
Funcionamiento del supervisor de fallos del agente de escucha de Oracle
Personalización del supervisor de fallos del Servidor de HA para Oracle
Definición del comportamiento personalizado para los errores
Formato de archivo de acción personalizado
Cambio de la respuesta a un error de DBMS
Respuesta a un error con efectos importantes
Omisión de un error con efectos secundarios
Cambio de la respuesta a las alertas registradas
Cambio del número máximo de sondeos consecutivos con tiempo de espera finalizado
Propagación de un archivo de acción personalizado a todos los nodos de un clúster
Cambio del rol de una instancia de Oracle Data Guard
Cómo cambiar el rol de una instancia de Oracle Data Guard
A. Propiedades de extensión de HA para Oracle
B. Acciones preestablecidas para errores de DBMS y alertas registradas
C. Configuraciones de ejemplo de Oracle ASM con HA para Oracle
La supervisión de fallos del servicio de datos de HA para Oracle es proporcionada por los siguientes supervisores de fallos:
El supervisor de fallos del servidor de Oracle
El supervisor de fallos del agente de escucha de Oracle
Nota - Si utiliza un agente de escucha de Single Client Access Name de Oracle Grid Infrastructure para clústeres (SCAN), el software de Oracle Solaris Cluster no proporciona ninguna supervisión de fallos para el agente de escucha de SCAN.
Cada supervisor de fallos se encuentra en un recurso cuyo tipo de recurso se muestra en la siguiente tabla.
Tabla 1-3 Tipos de recursos para supervisores de fallos de HA para Oracle
|
Las propiedades del sistema y las propiedades de extensión de estos recursos controlan el comportamiento de los supervisores de fallos. Los valores predeterminados de estas propiedades determinan el comportamiento preestablecido de los supervisores de fallos. El comportamiento preestablecido debe ser adecuado para la mayoría de las instalaciones de Oracle Solaris Cluster. Por lo tanto, debe ajustar los supervisores de fallos de HA para Oracle sólo si debe modificar el comportamiento preestablecido.
El ajuste de los supervisores de fallos de HA para Oracle incluye las siguientes tareas:
Establecer el intervalo entre sondeos de supervisores de fallos.
Establecer el tiempo de espera de sondeos de supervisores de fallos.
Definir los criterios de fallos persistentes.
Especificar el comportamiento de conmutación por error de un recurso.
Para obtener más información, consulte Tuning Fault Monitors for Oracle Solaris Cluster Data Services de Oracle Solaris Cluster Data Services Planning and Administration Guide. En las siguientes subsecciones, se proporciona información sobre los supervisores de fallos de HA para Oracle que necesita para llevar a cabo estas tareas.
Ajuste los supervisores de fallos de HA para Oracle al registrar y configurar HA para Oracle. Para obtener más información, consulte Registro y configuración de HA para Oracle.
El supervisor de fallos del servidor de Oracle envía una solicitud al servidor para consultar el estado del servidor.
El supervisor de fallos del servidor se inicia con pmfadm para que tenga alta disponibilidad. Si se detiene el supervisor por algún motivo, la PMF lo reinicia de forma automática.
El supervisor de fallos del servidor consta de los siguientes procesos.
Un proceso del supervisor de fallos principal
Un sondeo de fallos del cliente de la base de datos
Esta sección incluye la siguiente información relativa al supervisor de fallos del servidor:
Funcionamiento del sondeo de fallos del cliente de la base de datos
Análisis de alertas registradas por el supervisor de fallos del servidor
El supervisor de fallos principal determina que una operación es correcta si la base de datos está en línea y no da ningún error durante la transacción.
El sondeo de fallos del cliente de la base de datos realiza las siguientes operaciones:
Supervisa la partición de registros de rehacer archivados. Consulte Operaciones para supervisar la partición de registros de rehacer archivados.
Si el estado de la partición es correcto, determina si la base de datos está en funcionamiento. Consulte Operaciones para determinar si la base de datos está en funcionamiento.
El sondeo utiliza el valor de tiempo de espera que se establece en la propiedad del recurso Probe_timeout para determinar qué tiempo asignar para sondear correctamente a Oracle.
El sondeo de fallos del cliente de la base de datos consulta la vista de rendimiento dinámica v$archive_dest a fin de determinar todos los posibles destinos para los archivos de rehacer archivados. Para cada destino activo, el sondeo determina si el estado del destino es correcto y si tiene suficiente espacio libre para almacenar los archivos de rehacer archivados.
Si el estado del destino es correcto, el sondeo determina la cantidad de espacio libre en el sistema de archivos del destino. Si la cantidad de espacio libre es inferior al 10% de la capacidad del sistema de archivos y es inferior a 20 Mbytes, el sondeo imprime un mensaje en syslog.
Si el estado del destino es ERROR, el sondeo imprime un mensaje en syslog y desactiva las operaciones para determinar si la base de datos está en funcionamiento. Las operaciones permanecen desactivadas hasta que desaparece la condición de error.
Si la partición de registros de rehacer archivados tiene un estado correcto, el sondeo de fallos del cliente de la base de datos consulta la vista de rendimiento dinámica v$sysstat para obtener estadísticas del rendimiento de la base de datos. Los cambios en estas estadísticas indican que la base de datos está en funcionamiento. Si estas estadísticas permanecen sin cambios entre las consultas consecutivas, el sondeo de fallos realiza transacciones de base de datos para determinar si la base de datos está en funcionamiento. Estas transacciones implican crear, actualizar y descartar una tabla en el espacio de tabla del usuario.
El sondeo de fallos del cliente de la base de datos realiza todas sus transacciones como usuario de Oracle. El ID de este usuario se especifica al preparar los nodos, tal como se describe en Cómo preparar los nodos.
Si una transacción de base de datos falla, el supervisor de fallos del servidor realiza una acción que depende del error que ha ocasionado el fallo. Para cambiar la acción que realiza el supervisor de fallos del servidor, personalice el supervisor de fallos del servidor, como se describe en Personalización del supervisor de fallos del Servidor de HA para Oracle.
Si la acción requiere ejecutar un programa externo, el programa se ejecuta como un proceso independiente en segundo plano.
Las acciones que puede realizar son las siguientes:
Ignorar. El supervisor de fallos del servidor ignora el error.
Detener supervisión. El supervisor de fallos del servidor se detiene sin cerrar la base de datos.
Reiniciar. El supervisor de fallos del servidor detiene y reinicia la entidad especificada por el valor de la propiedad de extensión Restart_type.
Si la propiedad de extensión Restart_type está establecida en RESOURCE_RESTART, el supervisor de fallos del servidor reinicia el recurso del servidor de la base de datos. De manera predeterminada, el supervisor de fallos del servidor reinicia el recurso del servidor de la base de datos.
Si la propiedad de extensión Restart_type está establecida en RESOURCE_GROUP_RESTART, el supervisor de fallos del servidor reinicia el grupo de recursos del servidor de la base de datos.
Nota - La cantidad de intentos de reinicio puede exceder el valor de la propiedad del recurso Retry_count en el tiempo que la propiedad del recurso Retry_interval especifica. Si esta situación ocurre, el supervisor de fallos del servidor intenta conmutar el grupo de recursos a otro nodo.
Conmutar. El supervisor de fallos del servidor conmuta el grupo de recursos del servidor de la base de datos a otro nodo. Si no hay ningún nodo disponible, el intento de conmutar el grupo de recursos falla. En tal caso, se reinicia el servidor de la base de datos.
El software de Oracle registra las alertas en un archivo de registro de alertas. La ruta absoluta de este archivo se especifica mediante la propiedad de extensión alert_log_file del recurso SUNW.oracle_server. El supervisor de fallos del servidor analiza el archivo de registro de alertas en busca de nuevas alertas en las siguientes ocasiones:
Cuando se inicia el supervisor de fallos del servidor
Cada vez que el supervisor de fallos del servidor consulta el estado del servidor
Si se define una acción para una alerta registrada detectada por el supervisor de fallos del servidor, el supervisor realiza la acción como respuesta a la alerta.
Las acciones preestablecidas para las alertas registradas aparecen enumeradas en la Tabla B-2. Para cambiar la acción que realiza el supervisor de fallos del servidor, personalice el supervisor de fallos del servidor, como se describe en Personalización del supervisor de fallos del Servidor de HA para Oracle.
El supervisor de fallos del agente de escucha de Oracle comprueba el estado de un agente de escucha de Oracle.
Si el agente de escucha se está ejecutando, el supervisor de fallos del agente de escucha de Oracle considera que el sondeo se realizó correctamente. Si el supervisor de fallos detecta un error, el agente de escucha se reinicia.
Nota - El recurso del agente de escucha no proporciona ningún mecanismo para establecer la contraseña del agente de escucha. Si la seguridad del agente de escucha de Oracle está activada, un sondeo del supervisor de fallos del agente de escucha podría generar el error TNS-01169 de Oracle. Dado que el agente de escucha puede responder, el supervisor de fallos del agente de escucha considera que el sondeo es correcto. Esta acción no impide que un error del agente de escucha sea detectado. Un error del agente de escucha devuelve un error diferente o finaliza el tiempo de espera del sondeo.
El sondeo del agente de escucha se inicia con pmfadm para que el sondeo tenga alta disponibilidad. Si se detiene el sondeo, la PMF lo reinicia automáticamente.
Si ocurre algún problema en el agente de escucha durante un sondeo, el sondeo intenta reiniciar el agente de escucha. El valor definido para la propiedad del recurso retry_count determina el número máximo de veces que el sondeo intenta el reinicio. Si, tras haber intentado el número máximo de veces, el sondeo sigue dando resultados negativos, el sondeo detiene el supervisor de fallos y no conmuta el grupo de recursos.
Para facilitar la resolución de problemas de tiempos de espera finalizados de DBMS sin explicación, puede permitir que el supervisor de fallos cree un archivo del núcleo central cuando finalice un tiempo de espera del sondeo. El contenido del archivo del núcleo central hace referencia al proceso del supervisor de fallos. El supervisor de fallos crea el archivo del núcleo central en el directorio raíz (/). Para que el supervisor de fallos pueda crear un archivo del núcleo central, utilice el comando coreadm con el fin de permitir volcados del núcleo central set-id. Para obtener más información, consulte la página del comando man coreadm(1M).