Sun Cluster 3.1 10/03: Guía de administración del sistema

Capítulo 3 Parada y arranque de un clúster

En este capítulo se indican los procedimientos para parar y arrancar un clúster y sus nodos individuales.

Para obtener una descripción detallada de los procedimientos indicados en este capítulo, consulte la Tabla 3–1 y la Tabla 3–2.

Parada y arranque de un clúster: información general

 El comando Sun Clusterscshutdown(1M) detiene ordenadamente los servicios del clúster y para todo el clúster de una forma limpia; lo puede utilizar al trasladar la ubicación de un clúster o al parar éste en caso de deterioro de los datos a causa de un error de aplicación.


Nota –

Utilice el comando scshutdown en lugar de los comandos shutdown o halt para garantizar una parada correcta de todo el clúster. El comando de Solaris shutdown se utiliza junto con scswitch(1M) para parar nodos individuales. Para obtener más información consulte Cómo parar un clúster o Parada y arranque de un único nodo del clúster .


El comando scshutdown detiene todos los nodos de un clúster, de la siguiente forma:

  1. Pone fuera de línea todos los grupos de recursos.

  2. Desmonta todos los sistemas de archivos del clúster.

  3. Apaga todos los servicios de dispositivo activos.

  4. Ejecuta init 0 y lleva todos los nodos al indicador de OBP ok.


Nota –

En caso necesario puede arrancar un nodo en modo sin de clúster, de manera que deje de ser miembro de éste. Este modo se utiliza para instalar software o efectuar determinados procedimientos de administración. Para obtener más información, consulte Cómo arrancar un nodo del clúster en modo sin clúster.


Tabla 3–1 Lista de tareas: parada y arranque de un clúster

Tarea 

Para obtener instrucciones 

Parar el clúster 

Utilice scshutdown(1M)

Cómo parar un clúster

Iniciar el clúster arrancando todos los nodos.  

Los nodos deben disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste.  

Cómo arrancar un clúster

Rearrancar el clúster 

Utilice scshutdown

En el indicador ok, arranque cada nodo de forma individual mediante el comando boot(1M).

Los nodos deben disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste.  

Cómo rearrancar un clúster

Cómo parar un clúster


Precaución – Precaución –

No utilice el comando send brk en una consola del clúster para parar un nodo de éste, ya que este comando no se admite dentro de un clúster. Si utiliza send brk con go para rearrancar en el indicador ok, el nodo emite un aviso grave.


  1. Si el clúster está ejecutando Oracle® Parallel Server o Real Application Clusters, pare todas las instancias de la base de datos.

    Para averiguar los procedimientos de parada, consulte la documentación del producto de Oracle Parallel Server/Real Application Clusters.

  2. Conviértase en usuario root en cualquiera de los nodos del clúster.

  3. Pare el clúster inmediatamente al nivel de OBP.

    Escriba el siguiente comando desde un nodo del clúster:


    # scshutdown -g0 -y
    

  4. Compruebe que todos los nodos hayan llegado al indicador ok.

    No apague ninguno de los nodos hasta que todos ellos se encuentren en el indicador ok.

  5. Si es necesario, apague los nodos.

Ejemplo: parar un clúster

En el ejemplo siguiente se muestra la salida de consola obtenida al detener el funcionamiento normal del clúster y llevar todos los nodos al indicador ok. La opción -g 0 establece el período de gracia de la parada en cero y la opción -y proporciona una respuesta afirmativa yes automática a la pregunta de confirmación. En las consolas de los otros nodos del clúster también aparecen mensajes de parada.


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
The system is down.
syncing file systems... done
Program terminated
ok

Dónde proseguir

Consulte Cómo arrancar un clúster para reiniciar un clúster detenido.

Cómo arrancar un clúster

  1. Para iniciar un clúster cuyos nodos se hayan parado y se encuentren en el indicador ok, efectúe boot(1M) en cada nodo.

    Si ha efectuado algún cambio de configuración entre paradas, inicie primero el nodo con la configuración más actual. Salvo en esta circunstancia, el orden de arranque de los nodos no es relevante.


    ok boot
    

    A medida que los componentes del clúster se activan, en las consolas de los nodos arrancados se pueden visualizar mensajes.


    Nota –

    Los nodos deben disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste.


  2. Compruebe que los nodos hayan arrancado sin errores y se encuentren en línea.

    El comando scstat(1M) informa del estado de los nodos.


    # scstat -n
    


    Nota –

    Si el sistema de archivos /var de un nodo del clúster se llena, es posible que Sun Cluster no pueda reiniciarse en ese nodo. Si surge este problema, consulteCómo reparar un sistema de archivos /var completo.


Ejemplo: arrancar un clúster

En el ejemplo siguiente se muestra la salida de la consola correspondiente a arrancar el nodo phys-schost-1 en el clúster. En las consolas de los otros nodos del clúster aparecen mensajes similares.


ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node 1 with votecount = 1 added.
NOTICE: Node 2 with votecount = 1 added.
NOTICE: Node 3 with votecount = 1 added.
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node 1 is up; new incarnation number = 937846227.
NOTICE: node 2 is up; new incarnation number = 937690106.
NOTICE: node 3 is up; new incarnation number = 937690290.
NOTICE: Cluster members:   1  2  3
...

Cómo rearrancar un clúster

 

Ejecute el comando scshutdown(1M) para parar el clúster y arránquelo a continuación con el comando boot(1M) en cada nodo.

  1. (Opcional). Si el clúster está ejecutando Oracle Parallel Server/Real Application Clusters, pare todas las instancias de la base de datos.

    Para averiguar los procedimientos de parada, consulte la documentación del producto de Oracle Parallel Server/Real Application Clusters.

  2. Conviértase en usuario root en cualquiera de los nodos del clúster.

  3. Pare el clúster al nivel de OBP.

    Escriba el siguiente comando desde un nodo del clúster:


    # scshutdown -g0 -y
    

    Cada uno de los nodos se para y muestra el indicador ok.


    Nota –

    Los nodos deben disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste.


  4. Arranque cada nodo.

    El orden de arranque de los nodos no es relevante a menos que se hayan efectuado cambios de configuración entre paradas; si así fuera se deberá iniciar primero el nodo con la configuración más actual.


    ok boot
    

    A medida que los componentes del clúster se activan, en las consolas de los nodos arrancados se pueden visualizar mensajes.

  5. Compruebe que los nodos hayan arrancado sin errores y se encuentren en línea.

    El comando scstat informa del estado de los nodos.


    # scstat -n
    


    Nota –

    Si el sistema de archivos /var de un nodo del clúster se llena, es posible que Sun Cluster no pueda reiniciarse en ese nodo. Si surge este problema, consulteCómo reparar un sistema de archivos /var completo.


Ejemplo: rearrancar un clúster

En el ejemplo siguiente se muestra la salida de consola generada al parar el funcionamiento normal del clúster, llevar todos los nodos al indicador ok y luego reiniciar el clúster. La opción -g0 establece el período de gracia en cero y la opción -y proporciona una respuesta afirmativa yes automática a la pregunta de confirmación. En las consolas de los otros nodos del clúster también aparecen mensajes de parada.


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members:   1  2  3
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:

Parada y arranque de un único nodo del clúster


Nota –

Utilice el comando scswitch(1M) junto con el comando de Solaris shutdown(1M) para detener un nodo individual. Utilice el comando scshutdown únicamente para parar todo el clúster.


Tabla 3–2 Mapa de tareas: parada y arranque de un nodo del clúster

Tarea 

Para obtener instrucciones 

Parar un nodo del clúster  

Utilice scswitch(1M) y shutdown(1M)

Cómo parar un nodo del clúster

Iniciar un nodo 

El nodo debe disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste. 

Cómo arrancar un nodo del clúster

Parar y reiniciar (rearrancar) un nodo del clúster 

 Utilice scswitch y shutdown

El nodo debe disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste.  

Cómo rearrancar un nodo del clúster

Arrancar un nodo de forma que deje de pertenecer al clúster 

Utilice scswitch, shutdown y, a continuación, boot -x

Cómo arrancar un nodo del clúster en modo sin clúster

Cómo parar un nodo del clúster


Precaución – Precaución –

No utilice el comando send brk en una consola del clúster para parar un nodo de éste. El uso de send brk y go en el indicador ok para rearrancar provoca que el nodo emita un aviso grave. Esta función no se admite dentro de un clúster.


  1. Si está ejecutando Oracle Parallel Server/Real Application Clusters, pare todas las instancias de la base de datos.

    Para averiguar los procedimientos de parada, consulte la documentación del producto de Oracle Parallel Server/Real Application Clusters.

  2. Conviértase en usuario root en el nodo del clúster que se debe parar.

  3. Pase todos los recursos y los grupos de dispositivos y de recursos del nodo que se va a parar a los otros miembros del clúster.

    Escriba el siguiente comando en el nodo que se va a parar:


    # scswitch -S -h nodo
    

    -S

    Evacúa todos los servicios de dispositivo y grupos de recursos del nodo especificado.

    -h nodo

    Especifica el nodo del que se van a retirar todos los grupos de recursos y grupos de dispositivos.

  4. Pare el nodo del clúster al nivel de OBP.

    Escriba el siguiente comando en el nodo que se va a parar:


    # shutdown -g0 -y -i0
    

  5. Compruebe que el nodo haya llegado al indicador ok.

  6. Si es necesario, apague el nodo.

Ejemplo: parar un nodo del clúster

En el ejemplo siguiente se muestra la salida de la consola correspondiente a parar el nodo phys-schost-1. La opción -g0 establece en cero el período de gracia, -y ofrece una respuesta afirmativa automática a la pregunta de confirmación e -i0 llama al nivel de ejecución 0 (cero). En las consolas de los otros nodos del clúster aparecen mensajes de parada de este nodo.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime:
 WARNING: CMM monitoring disabled.phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
Program terminated
ok

Dónde proseguir

Consulte Cómo arrancar un nodo del clúster para reiniciar un nodo del clúster detenido.

Cómo arrancar un nodo del clúster


Nota –

El inicio de un nodo del clúster puede quedar afectado por la configuración del quórum. En un clúster de dos nodos, deberá tener configurado un dispositivo del quórum de tal modo que el total de quórum del nodo sea tres. Deberá tener un quórum de uno por cada nodo y uno adicional por el dispositivo de quórum. En esta situación, si se para el primer nodo, el segundo sigue teniendo quórum y funciona como miembro único del clúster. Para que el primer nodo vuelva al clúster como miembro de éste, el segundo nodo debe estar en marcha y activo. El total del quórum requerido del clúster (dos) debe estar presente.


  1. Para iniciar un nodo del clúster que ha sido parado, arranque el nodo.


    ok boot
    

    A medida que los componentes del clúster se activan, en todas las consolas de los nodos se pueden visualizar mensajes.


    Nota –

    El nodo debe disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste.


  2. Compruebe que el nodo haya arrancado sin errores y se encuentre en línea.

    El comando scstat (1M) informa del estado de un nodo.


    # scstat -n
    


    Nota –

    Si el sistema de archivos /var de un nodo del clúster se llena, es posible que Sun Cluster no pueda reiniciarse en ese nodo. Si surge este problema, consulteCómo reparar un sistema de archivos /var completo.


Ejemplo: arrancar un nodo del clúster

En el ejemplo siguiente se muestra la salida de la consola correspondiente a arrancar el nodo phys-schost-1 en el clúster.


ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:

Cómo rearrancar un nodo del clúster

  1. Si el nodo del clúster está ejecutando Oracle Parallel Server/Real Application Clusters, pare todas las instancias de la base de datos.

    Para averiguar los procedimientos de parada, consulte la documentación del producto de Oracle Parallel Server/Real Application Clusters.

  2. Conviértase en usuario root en el nodo del clúster que se debe parar.

  3. Pare el nodo del clúster mediante los comandos scswitch y shutdown.

    Escriba estos comandos en el nodo que se debe parar. La opción -i6 del comando shutdown hace que el nodo rearranque después de pararse y llegar al indicador ok.


    # scswitch -S -h nodo
    # shutdown -g0 -y -i6
    

    Nota –

    Los nodos deben disponer de una conexión funcional con la interconexión del clúster para pertenecer a éste.


  4. Compruebe que el nodo haya arrancado sin errores y se encuentre en línea.


    # scstat -n
    

Ejemplo: rearrancar un nodo del clúster

En el ejemplo siguiente se muestra la salida de la consola correspondiente a la acción de rearrancar el nodo phys-schost-1. Los mensajes correspondientes a este nodo, como la notificación de parada y la de rearranque, aparecen en las consolas de los otros nodos del clúster.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i6
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 6
The system is coming down.  Please wait.
System services are now being stopped.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
rebooting...
Resetting ...
,,,
Sun Ultra 1 SBus (UltraSPARC 143MHz), No Keyboard
OpenBoot 3.11, 128 MB memory installed, Serial #5932401.
Ethernet address 8:8:20:99:ab:77, Host ID: 8899ab77.
...
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
The system is ready.
phys-schost-1 console login: 

Cómo arrancar un nodo del clúster en modo sin clúster

 Es posible arrancar un nodo de forma que no pertenezca al clúster; es decir, en modo sin clúster. Este modo se utiliza para instalar software o efectuar determinados procedimientos de administración, como instalar modificaciones en el nodo.

  1. Conviértase en usuario root en el nodo que se debe iniciar en el modo sin clúster.

  2. Pare el nodo mediante los comandos scswitch y shutdown.


    # scswitch -S -h nodo
    # shutdown -g0 -y -i0
    

  3. Compruebe que el nodo se encuentre en el indicador ok.

  4. Arranque el nodo en modo sin clúster mediante el comando boot(1M) con la opción -x.


    ok boot -x
    

    En la consola del nodo aparecerán mensajes que informan que el nodo no forma parte del clúster.

Ejemplo: arrancar un nodo del clúster en modo sin clúster

En el ejemplo siguiente se muestra la salida de consola obtenida al parar el nodo phys-schost-1 y reiniciarlo en modo sin clúster. La opción -g0 establece en cero el período de gracia, -y ofrece una respuesta afirmativa automática a la pregunta de confirmación e -i0 llama al nivel de ejecución 0 (cero). En las consolas de los otros nodos del clúster aparecen mensajes de parada de este nodo.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
...
rg_name = schost-sa-1 ...
offline node = phys-schost-2 ...
num of node = 0 ...
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
Print services stopped.
syslogd: going down on signal 15
...
The system is down.
syncing file systems... done
WARNING: node 1 is being shut down.
Program terminated

ok boot -x
...
Not booting as part of cluster
...
The system is ready.
phys-schost-1 console login:

Reparación de un sistema de archivos /var completo

 Tanto Solaris como el software Sun Cluster escriben los mensajes de error en el archivo /var/adm/messages, lo que con el tiempo puede llenar el sistema de archivos /var. Si esto llegara a suceder, es posible que Sun Cluster no pueda reiniciarse en ese nodo. Además, podría ser imposible iniciar una sesión en el nodo.

Cómo reparar un sistema de archivos /var completo

Si un nodo indica que el sistema de archivos /var está lleno y sigue ejecutando los servicios de Sun Cluster, utilice este procedimiento para limpiar dicho sistema de archivos. Para obtener más información consulte “Viewing System Messages” in System Administration Guide: Advanced Administration.

  1. Conviértase en usuario root en el nodo del clúster que tiene lleno el sistema de archivos /var.

  2. Limpie el sistema de archivos lleno.

    Por ejemplo, suprima los archivos que no sean esenciales.