2 Estabilización de la situación

Siempre que se enfrente a la recuperación de un error importante del sistema de archivos o a una posible pérdida de datos, el primer paso debe ser estabilizar los sistemas afectados, minimizar el riesgo de sufrir más pérdidas y preservar la información de diagnóstico, cuando sea posible. Este capítulo describe las acciones que deben realizarse:

Detención de procesos de archivado y reciclaje

Para restaurar un sistema de archivos de almacenamiento o un número significativo de archivos perdidos, primero debe detener los procesos de archivado y reciclaje del sistema de archivos. Se recomienda estabilizar y aislar el archivo hasta que haya evaluado la situación y, en condiciones ideales, restaurar todo al estado normal. De lo contrario, en algunos casos, las operaciones continuas de archivado y reciclaje pueden empeorar la situación. Los procesos de archivado y almacenamiento provisional pueden propagar los archivos dañados. Los procesos de reciclaje pueden suprimir las únicas copias restantes de datos válidos.

Por lo tanto, siempre que sea posible, tome las precauciones que aparecen a continuación:

Una vez que se terminen las operaciones de recuperación, puede revertir los cambios siguientes y restaurar el comportamiento normal del sistema de archivos.

Detención de almacenamiento

  1. Inicie sesión en el servidor de metadatos del sistema de archivos como usuario root.

    root@solaris:~# 
    
  2. Abra el archivo /etc/opt/SUNWsamfs/archiver.cmd en un editor de texto y desplácese hacia abajo hasta la primera directiva fs (sistema de archivos).

    En el ejemplo, utilizamos el editor vi:

    root@solaris:~# vi /etc/opt/SUNWsamfs/archiver.cmd
    # Configuration file for Oracle HSM archiving file systems
    #-----------------------------------------------------------------------
    # General Directives
    archivemeta = off
    examine = noscan
    #-----------------------------------------------------------------------
    # Archive Set Assignments 
    fs = hsmfs1
    logfile = /var/adm/hsmfs1.archive.log
    all .
        1 -norelease 15m
        2 -norelease 15m
    fs = hsmfs2
    logfile = /var/adm/hsmfs2.archive.log
    all .
    ...
    
  3. Si necesita detener el archivado de todos los sistemas de archivos, inserte una directiva wait justo antes de la primera directiva fs en el archiver.cmd. Guarde el archivo archiver.cmd y cierre el editor.

    En el ejemplo, se inserta la directiva wait justo antes de la directiva para el sistema de archivos hsmfs1, donde aplicará a todos los sistemas de archivos configurados para el archivado:

    root@solaris:~# vi /etc/opt/SUNWsamfs/archiver.cmd
    ...
    #-----------------------------------------------------------------------
    # Archive Set Assignments
    wait
    fs = hsmfs1
    logfile = /var/adm/hsmfs1.archive.log
    all .
        1 -norelease 15m
        2 -norelease 15m
        3 -norelease 15m
    fs = hsmfs2
    ...
    :wq
    root@solaris:~# 
    
  4. Si necesita detener el archivado en un solo sistema de archivos, inserte una directiva wait justo después de la directiva fs para ese sistema de archivos. Guarde el archivo archiver.cmd y cierre el editor.

    En el ejemplo, se detiene la actividad de archivado en el sistema de archivos hsmfs1:

    root@solaris:~# vi /etc/opt/SUNWsamfs/archiver.cmd
    ...
    #-----------------------------------------------------------------------
    # Archive Set Assignments
    fs = hsmfs1
    wait
    logfile = /var/adm/hsmfs1.archive.log
    all .
        1 -norelease 15m
        2 -norelease 15m
        3 -norelease 15m
    fs = hsmfs2
    ...
    :wq
    root@solaris:~# 
    
  5. Luego, detenga el reciclaje.

Detención de reciclaje

  1. Inicie sesión en el servidor de metadatos del sistema de archivos como usuario root.

    root@solaris:~# 
    
  2. Abra el archivo /etc/opt/SUNWsamfs/recycler.cmd en un editor de texto.

    En el ejemplo, utilizamos el editor vi:

    root@solaris:~# vi /etc/opt/SUNWsamfs/recycler.cmd
    # Configuration file for Oracle HSM archiving file systems
    #-----------------------------------------------------------------------
    logfile = /var/adm/recycler.log
    no_recycle tp VOL[0-9][2-9][0-9]
    library1 -hwm 95 -mingain 60
    
  3. Agregue el parámetro -ignore a cada directiva de reciclaje en el archivo recycler.cmd. Luego, guarde el archivo y cierre el editor.

    El archivo recycler.cmd no contiene directivas de reciclaje, a menos que haya configurado el reciclaje por biblioteca, en lugar de hacerlo por conjuntos de archivos de almacenamiento. No obstante, compruébelo ahora.

    En el ejemplo, tenemos una directiva de reciclaje para la biblioteca de cintas library1:

    root@solaris:~# vi /etc/opt/SUNWsamfs/recycler.cmd
    # Configuration file for Oracle HSM archiving file systems
    #-----------------------------------------------------------------------
    logfile = /var/adm/recycler.log
    no_recycle tp VOL[0-9][2-9][0-9]
    library1 -hwm 95 -mingain 60 -ignore
    :wq
    root@solaris:~# 
    
  4. Si se está realizando una recuperación después de la pérdida o el daño de uno o más sistemas de archivos de almacenamiento, antes de continuar, realice una copia de seguridad de los archivos restaurados.

  5. Si se está realizando una recuperación después de un problema en el servidor o de la pérdida o el daño de sistemas de archivos, guarde la configuración de Oracle HSM antes de continuar.

  6. Si necesita restaurar directorios y archivos, decida si necesita guardar la configuración de Oracle HSM o vaya directamente al Capítulo 5, Recuperación de archivos perdidos y dañados.

Preservación de datos no almacenados

Los archivos no almacenados pueden permanecer en la caché del disco de un sistema de archivos de almacenamiento dañado. No existen copias de estos archivos en el archivo de almacenamiento. Por lo tanto, si puede, realice copias de seguridad de ellos en un archivo de punto de recuperación ahora. Siga estos pasos:

Realice una copia de seguridad de archivos no almacenados

  1. Inicie sesión en el servidor de metadatos del sistema de archivos como usuario root.

    root@solaris:~# 
    
  2. Seleccione una ubicación de almacenamiento segura para el punto de recuperación.

    En el ejemplo, se crea un subdirectorio, unarchived/, en un directorio que se creó para puntos de recuperación durante la configuración inicial. El sistema de archivos /zfs no tiene dispositivos en común con /hsmfs1, el sistema de archivos que se está recuperando:

    root@solaris:~# mkdir /zfs1/hsmfs_recovery/unarchived/
    root@solaris:~# 
    
  3. Cambie al directorio raíz del sistema de archivos.

    En el ejemplo, se cambia al directorio de punto de montaje /hsmfs1:

    root@solaris:~# cd /hsmfs1
    root@solaris:~# 
    
  4. Realice una copia de seguridad de los archivos no almacenados que permanecen en la caché del disco. Utilice el comando samfsdump -u -f recovery-point, donde recovery-point es la ruta y el nombre de archivo del archivo de salida.

    La opción -u hace que el comando samfsdump realice copias de seguridad los archivos de datos que no se hayan almacenado. En el ejemplo, se guarda el archivo de punto de recuperación 20150325 en el directorio remoto /zfs1/hsmfs_recovery/unarchived/:

    root@solaris:~# samfsdump -u -f /zfs1/hsmfs_recovery/unarchived/20150325
    root@solaris:~# 
    
  5. Si se está realizando una recuperación después de un problema en el servidor o de la pérdida o el daño de sistemas de archivos, guarde la configuración de Oracle HSM antes de continuar.

  6. Si necesita restaurar directorios y archivos, decida si necesita guardar la configuración de Oracle HSM o vaya directamente al Capítulo 5, Recuperación de archivos perdidos y dañados.

Preservación de la configuración y la información de estado

Incluso aunque haya realizado copias de seguridad de todos los archivos de configuración y las secuencias de comandos necesarios para restaurar el sistema de archivos y el software de Oracle HSM, vale la pena preservar el estado actual de un sistema con errores si es posible. Los archivos de configuración y las secuencias de comando que sobrevivan pueden contener cambios que se hayan implementado desde la última vez que la configuración completa se almacenó en una copia de seguridad. Puede haber una diferencia entre restaurar el sistema a un estado casi exacto al del momento previo al error y simplemente acercarse un poco a dicho estado. Los archivos de rastreo y los logs contienen información que ayuda a restaurar los archivos y aclara los motivos de los fallos. Por esta razón, debe conservar todo lo que haya quedado, antes de hacer cualquier otra cosa.

Guardado de la configuración de Oracle HSM

  1. Si es posible, inicie sesión en el servidor de metadatos del sistema de archivos como usuario root.

    root@solaris:~# 
    
  2. Ejecute el comando samexplorer, cree un SAMreport y guarde el informe en el directorio que aloja la información de configuración de su copia de seguridad. Utilice el comando samexplorer path/hostname.YYYYMMDD.hhmmz.tar.gz, donde path es la ruta hacia el directorio deseado, hostname es el nombre del host del sistema de archivos de Oracle HSM y YYYYMMDD.hhmmz es el registro de fecha y hora.

    El nombre de archivo predeterminado es /tmp/SAMreport.hostname.YYYYMMDD.hhmmz.tar.gz. En el ejemplo, ya existe un directorio para guardar SAMreports, /zfs1/sam_config/. Por lo tanto, se crea el informe en este directorio (tenga en cuenta que el siguiente comando se introduce como una sola línea — el salto de línea se identifica por el carácter de barra diagonal inversa):

    root@solaris:~# samexplorer \ /zfs1/sam_config/explorer/server1.20150325.1659MST.tar.gz
         Report name:     /zfs1/sam_config/explorer/samhost1.20150325.1659MST.tar.gz
         Lines per file:  1000
         Output format:   tar.gz (default) Use -u for unarchived/uncompressed.
     
         Please wait.............................................
         Please wait.............................................
         Please wait......................................
     
         The following files should now be ftp'ed to your support provider
         as ftp type binary.
     
         /zfs1/sam_config/explorer/samhost1.20150325.1659MST.tar.gz
    
  3. Copie todos los archivos de configuración de Oracle HSM que pueda en un sistema de archivos independiente. Entre estos archivos, se incluyen los siguientes:

    /etc/opt/SUNWsamfs/
         mcf
         archiver.cmd
         defaults.conf 
         diskvols.conf 
         hosts.family-set-name
         hosts.family-set-name.local
         preview.cmd
         recycler.cmd
         releaser.cmd
         rft.cmd
         samfs.cmd
         stager.cmd
         inquiry.conf
         samremote                  # SAM-Remote server configuration file
         family-set-name            # SAM-Remote client configuration file
         network-attached-library   # Parameters file
         scripts/*                  # Back up all locally modified files
    /var/opt/SUNWsamfs/
    
  4. Realice una copia de seguridad de todos los catálogos de biblioteca supervivientes, incluido el catálogo de historiador. Para cada catálogo, utilice el comando dump_cat -V catalog-file, donde catalog-file es la ruta y el nombre del archivo de catálogo. Redirija la salida a dump-file en una nueva ubicación.

    Se utilizará la salida del archivo dump_cat para reconstruir los catálogos en un sistema de repuesto, mediante el comando build_cat. En el ejemplo, volcamos los datos de catálogo para library1 en el archivo library1cat.dump en un directorio en el sistema de archivos independiente montado en NFS zfs1 (tenga en cuenta que el siguiente comando se introduce como una sola línea — el salto de línea se identifica por el carácter de barra diagonal inversa):

    root@solaris:~# dump_cat -V /var/opt/SUNWsamfs/catalog/library1cat > \ /zfs1/sam_config/20150325/catalogs/library1cat.dump
    
  5. Copie los archivos de configuración del sistema que se modificaron durante la instalación y la configuración de Oracle HSM en un sistema de archivos independiente. Entre ellos, se pueden incluir los siguientes:

    /etc/
         syslog.conf
         system
         vfstab
    /kernel/drv/
         sgen.conf
         samst.conf
         samrd.conf
         sd.conf
         ssd.conf
         st.conf
    /usr/kernel/drv/dst.conf
    
  6. Copie las secuencias de comandos de shell personalizadas y las entradas de crontab que creó como parte de la configuración de Oracle HSM en un sistema de archivos independiente.

    Por ejemplo, si creó una entrada crontab para gestionar la creación de puntos de recuperación, debería guardar una copia ahora.

  7. Cree un archivo readme que registre el nivel de revisión del software instalado actualmente. Incluya Oracle Oracle HSM, Solaris y Solaris Cluster (si corresponde). Guarde el archivo en un sistema de archivos independiente con el resto de la información de recuperación.

  8. Si es posible, guarde copias de paquetes descargados de Oracle Oracle HSM, Solaris y Solaris Cluster en un sistema de archivos independiente.

    Si tiene los paquetes disponibles, puede restaurar el software con rapidez de ser necesario.

  9. Si está efectuando la recuperación de la pérdida de un host de servidor de Oracle HSM, vaya a Capítulo 3, Restauración de la configuración de Oracle HSM.

  10. Si necesita restaurar uno o más sistemas de archivos de Oracle HSM, vaya a Capítulo 4, Recuperación de sistemas de archivos.

  11. Si necesita restaurar directorios y archivos, vaya a Capítulo 5, Recuperación de archivos perdidos y dañados.