Sun Cluster 系统管理指南(适用于 Solaris OS)

如何恢复元设备上的根 (/) 文件系统 (Solstice DiskSuite/Solaris Volume Manager)

执行备份后,使用此过程来恢复元设备上的根 ( /) 文件系统。 比如在根磁盘损坏后更换新磁盘时,就可以执行此过程。 不应引导正在恢复的节点。 在执行此恢复过程前确保群集正在无故障地运行。


注意:

由于新磁盘的分区必须与故障磁盘完全相同,所以在进行此过程前必须先确定分区方案,并相应地重建文件系统。


  1. 成为某个有权访问元集的群集节点(而不是所要恢复的那个节点)的超级用户。

  2. 从所有元集中删除要恢复的节点的主机名。


    # metaset -s setname -f -d -h nodelist
    

    -s setname

    指定元集名称。

    -f

    强制。

    -d

    从元集中删除。

    -h nodelist

    指定要从元集中删除的节点的名称。

  3. 替换要恢复其根 (/) 文件系统的那个节点上的故障磁盘。

    请参阅服务器所附带的文档,以了解磁盘替换过程。

  4. 引导要恢复的节点。

    • 如果使用的是 Solaris CD:

      • SPARC:请在 OpenBoot PROM ok 提示下键入以下命令:


         ok boot cdrom -s
        

      • x86:将 CD 放入到系统的 CD 驱动器中,通过停机然后关闭并打开系统来引导系统。 请在“Current Boot Parameters”屏幕上键入以下命令:


                             <<< Current Boot Parameters >>>
        Boot path: /pci@0,0/pci8086,2545@3/pci8086,1460@1d/pci8086,341a@
        7,1/sd@0,0:a
        Boot args:
        
        Type b [file-name] [boot-flags] <ENTER> to boot with options
        or   i <ENTER>                          to enter boot interpreter
        or   <ENTER>                            to boot with defaults
        
                         <<< timeout in 5 seconds >>>
        Select (b)oot or (i)nterpreter: b -s
        

    • 如果使用的是 Solaris JumpStartTM 服务器:

      • SPARC:请在 OpenBoot PROM ok 提示下键入以下命令:


        ok boot net -s
        

      • x86:通过停机然后关闭并打开系统来引导系统。 请在“Current Boot Parameters”屏幕上键入以下命令:


                             <<< Current Boot Parameters >>>
        Boot path: /pci@0,0/pci8086,2545@3/pci8086,1460@1d/pci8086,341a@
        7,1/sd@0,0:a
        Boot args:
        
        Type b [file-name] [boot-flags] <ENTER> to boot with options
        or   i <ENTER>                          to enter boot interpreter
        or   <ENTER>                            to boot with defaults
        
                         <<< timeout in 5 seconds >>>
        Select (b)oot or (i)nterpreter: b -s
        

  5. 使用 format 命令在根磁盘上创建所有的分区和交换。

    重建故障磁盘上的原分区方案。

  6. 使用 newfs 命令,创建根 (/) 文件系统和相应的其它文件系统

    重建故障磁盘上的原文件系统。


    注意:

    确保创建了 /global/.devices/node@nodeid 文件系统。


  7. 在临时安装点上安装根 (/) 文件系统。


    # mount device temp-mountpoint
    

  8. 使用以下命令来恢复根 (/) 文件系统。


    # cd temp-mountpoint
    # ufsrestore rvf dump-device
    # rm restoresymtable
    

  9. 在新磁盘上安装新的根块。


    # /usr/sbin/installboot /usr/platform/`uname -i`/lib/fs/ufs/bootblk raw-disk-device
    

  10. 删除 /temp-mountpoint/etc/system 文件中有关 MDD 根信息的那些行。


    * Begin MDD root info (do not edit)
    forceload: misc/md_trans
    forceload: misc/md_raid
    forceload: misc/md_mirror
    forceload: misc/md_hotspares
    forceload: misc/md_stripe
    forceload: drv/pcipsy
    forceload: drv/glm
    forceload: drv/sd
    rootdev:/pseudo/md@0:0,10,blk
    * End MDD root info (do not edit)

  11. 对于那些作为元设备组成部分的根磁盘,编辑 /temp-mount-point/etc/vfstab 文件,将这些根磁盘上的各个文件系统的根条目从元设备改为一个相应的正常片。


    Example: 
    Change from—
    /dev/md/dsk/d10   /dev/md/rdsk/d10    /      ufs   1     no       -
    
    Change to—
    /dev/dsk/c0t0d0s0 /dev/rdsk/c0t0d0s0  /      ufs   1     no       -

  12. 卸载临时文件系统,并检查原始磁盘设备。


    # cd /
    # umount temp-mountpoint
    # fsck raw-disk-device
    

  13. 以单用户模式重新引导节点。


    # reboot -- "-s"
    

  14. 使用 scdidadm 命令替换磁盘 ID。


    # scdidadm -R rootdisk
    

  15. 使用 metadb 命令来重建状态数据库复本。


    # metadb -c copies -af raw-disk-device
    

    -c copies

    指定要创建的复本数。

    -af raw-disk-device

    在指定的原始磁盘设备上创建初始状态数据库复本。

  16. 以群集模式重新引导该节点。

    1. 开始重新引导。


      # reboot
      

      在此引导过程中,您将看到错误消息或警告消息,其结尾部分是以下指令:


      Type control-d to proceed with normal startup,
      (or give root password for system maintenance):

    2. 按 Control-d 以引导到多用户模式下。

  17. 从已恢复的节点之外的群集节点中,使用 metaset 命令可以将已恢复的节点添加到所有元集中。


    phys-schost-2# metaset -s setname -a -h nodelist
    

    -a

    添加(创建)元集。

    参照 Solstice DiskSuite 文档为根 (/) 设置元设备/镜像。

    已将节点重新引导到群集模式下。 群集已经就绪。

示例 — 恢复元设备上原有的根 (/) 文件系统 (Solstice DiskSuite/Solaris Volume Manager)

下面的示例展示了将根 (/) 文件系统从磁带设备 /dev/rmt/0 恢复到节点 phys-schost-1 的过程。 从群集中的另一节点 phys-schost-2 上运行 metaset 命令,可以删除节点 phys-schost-1,稍后再将它重新添加到元集 schost-1 中。 所有其他命令都是从 phys-schost-1 上运行的。 新引导块在 /dev/rdsk/c0t0d0s0 上创建,而三个状态数据库复本在 /dev/rdsk/c0t0d0s4 上重建。


[成为具有对元集访问权限的群集节点(而不是将被恢复的节点)上的超级用户。]
[从元集中删除节点:]
phys-schost-2# metaset -s schost-1 -f -d -h phys-schost-1
[替换故障磁盘并引导节点:]

从 Solaris CD 引导节点:


[使用 formatnewfs 来重建分区和文件系统。]
[在临时安装点上安装根文件系统:]
# mount /dev/dsk/c0t0d0s0 /a
[恢复根文件系统:]
# cd /a
# ufsrestore rvf /dev/rmt/0
# rm restoresymtable
[安装新的引导块:]
# /usr/sbin/installboot /usr/platform/`uname \
-i`/lib/fs/ufs/bootblk /dev/rdsk/c0t0d0s0
[删除 /temp-mountpoint/etc/system 文件中有关 MDD 根信息的行:]
* Begin MDD root info (do not edit)
forceload: misc/md_trans
forceload: misc/md_raid
forceload: misc/md_mirror
forceload: misc/md_hotspares
forceload: misc/md_stripe
forceload: drv/pcipsy
forceload: drv/glm
forceload: drv/sd
rootdev:/pseudo/md@0:0,10,blk
* End MDD root info (do not edit)
[编辑 /temp-mountpoint/etc/vfstab文件]
Example: 
Change from—
/dev/md/dsk/d10   /dev/md/rdsk/d10    /      ufs   1     no       -

Change to—
/dev/dsk/c0t0d0s0 /dev/rdsk/c0t0d0s0  /usr   ufs   1     no       -
[卸载临时文件系统并检查原始磁盘设备:]
# cd /
# umount /a
# fsck /dev/rdsk/c0t0d0s0
[以单用户模式重新引导:]
# reboot -- "-s"
[替换磁盘 ID:]
# scdidadm -R /dev/dsk/c0t0d0
[重建状态数据库复本:]
# metadb -c 3 -af /dev/rdsk/c0t0d0s4
# reboot
Type Control-d to boot into multiuser mode.
[将节点重新添加回元集:]
phys-schost-2# metaset -s schost-1 -a -h phys-schost-1