Sun Cluster 系统管理指南(适用于 Solaris OS)

Procedure如何恢复 Solstice DiskSuite 元设备或 Solaris Volume Manager 卷上的根 (/) 文件系统

在执行备份后,使用此过程可以恢复 Solstice DiskSuite 元设备或 Solaris Volume Manager 卷上的根 (/) 文件系统。比如在根磁盘损坏后更换新磁盘时,就可以执行此过程。不应引导正在恢复的节点。在执行此恢复过程前确保群集正在无故障地运行。


注 –

由于新磁盘的分区必须与故障磁盘完全相同,所以在进行此过程前必须先确定分区方案,并相应地重建文件系统。


步骤
  1. 成为有权访问磁盘集的群集节点(不是要恢复的那个节点)的超级用户或使用等效角色。

  2. 从所有磁盘集中删除要恢复的节点的主机名。


    # metaset -s setname -f -d -h nodelist
    
    -s setname

    指定元集名称。

    -f

    强制。

    -d

    从元集中删除。

    -h nodelist

    指定要从元集中删除的节点的名称。

  3. 替换要恢复其根 (/) 文件系统的那个节点上的故障磁盘。

    请参阅服务器所附带的文档,以了解磁盘替换过程。

  4. 引导要恢复的节点。

    • 如果使用的是 Solaris CD:

      • SPARC:请在 OpenBoot PROM ok 提示符下键入以下命令:


        ok boot cdrom -s
        
      • x86: 将 CD 放入系统的 CD 驱动器,并通过关机随后将系统关闭再打开来引导系统。请在“Current Boot Parameters”屏幕上键入以下命令:


                             <<< Current Boot Parameters >>>
        Boot path: /pci@0,0/pci8086,2545@3/pci8086,1460@1d/pci8086,341a@
        7,1/sd@0,0:a
        Boot args:
        
        Type b [file-name] [boot-flags] <ENTER> to boot with options
        or   i <ENTER>                          to enter boot interpreter
        or   <ENTER>                            to boot with defaults
        
                         <<< timeout in 5 seconds >>>
        Select (b)oot or (i)nterpreter: b -s
        
    • 如果您使用的是 Solaris JumpStartTM 服务器:

      • SPARC:请在 OpenBoot PROM ok 提示符下键入以下命令:


        ok boot net -s
        
      • x86: 通过关机并且随后将系统关闭再打开来引导系统。请在“Current Boot Parameters”屏幕上键入以下命令:


                             <<< Current Boot Parameters >>>
        Boot path: /pci@0,0/pci8086,2545@3/pci8086,1460@1d/pci8086,341a@
        7,1/sd@0,0:a
        Boot args:
        
        Type b [file-name] [boot-flags] <ENTER> to boot with options
        or   i <ENTER>                          to enter boot interpreter
        or   <ENTER>                            to boot with defaults
        
                         <<< timeout in 5 seconds >>>
        Select (b)oot or (i)nterpreter: b -s
        
  5. 使用 format 命令在根磁盘上创建所有分区和交换。

    重建故障磁盘上的原分区方案。

  6. 使用 newfs 命令,创建根 (/) 文件系统和相应的其他文件系统

    重建故障磁盘上的原文件系统。


    注 –

    确保创建了 /global/.devices/node@nodeid 文件系统。


  7. 在临时安装点上安装根 (/) 文件系统。


    # mount device temp-mountpoint
    
  8. 使用以下命令来恢复根 (/) 文件系统。


    # cd temp-mountpoint
    # ufsrestore rvf dump-device
    # rm restoresymtable
    
  9. 在新磁盘上安装新的引导块。


    # /usr/sbin/installboot /usr/platform/`uname -i`/lib/fs/ufs/bootblk 
    raw-disk-device
    
  10. 删除 /temp-mountpoint/etc/system 文件中有关 MDD 根信息的那些行。


    * Begin MDD root info (do not edit)
    forceload: misc/md_trans
    forceload: misc/md_raid
    forceload: misc/md_mirror
    forceload: misc/md_hotspares
    forceload: misc/md_stripe
    forceload: drv/pcipsy
    forceload: drv/glm
    forceload: drv/sd
    rootdev:/pseudo/md@0:0,10,blk
    * End MDD root info (do not edit)
  11. 编辑 /temp-mountpoint/etc/vfstab 文件,将 Solstice DiskSuite 元设备或 Solaris Volume Manager 卷的根条目更改为作为元设备或卷的一部分的根磁盘上的各文件系统的相应的正常片。


    Example: 
    Change from—
    /dev/md/dsk/d10   /dev/md/rdsk/d10    /      ufs   1     no       -
    
    Change to—
    /dev/dsk/c0t0d0s0 /dev/rdsk/c0t0d0s0  /      ufs   1     no       -
  12. 卸载临时文件系统并检查原始磁盘设备。


    # cd /
    # umount temp-mountpoint
    # fsck raw-disk-device
    
  13. 在多用户模式下重新引导节点。


    # reboot
    
  14. 使用 scdidadm 命令替换磁盘 ID。


    # scdidadm -R rootdisk
    
  15. 使用 metadb 命令来重建状态数据库复本。


    # metadb -c copies -af raw-disk-device
    
    -c copies

    指定要创建的复本数。

    -af raw-disk-device

    在指定的原始磁盘设备上创建初始状态数据库复本。

  16. 从恢复的节点之外的群集节点,使用 metaset 命令将恢复的节点添加到所有磁盘集中。


    phys-schost-2# metaset -s setname -a -h nodelist
    
    -a

    添加(创建)元集。

    根据 Solstice DiskSuite 文档,为根 (/) 设置元设备或卷/镜像。

    已将节点重新引导到群集模式下。群集已经就绪。


示例 9–7 恢复 Solstice DiskSuite 元设备或 Solaris Volume Manager 卷上的根 (/) 文件系统

下面的示例展示了将根 (/) 文件系统从磁带设备 /dev/rmt/0 恢复到节点 phys-schost-1 的过程。从群集中的另一节点 phys-schost-2 运行 metaset 命令,以删除节点 phys-schost-1,稍后再将它重新添加到元集 schost-1 中。所有其他命令都是从 phys-schost-1 上运行的。在 /dev/rdsk/c0t0d0s0 上创建一个新引导块,而在 /dev/rdsk/c0t0d0s4 上重建状态数据库的三个副本。


[成为某个有权访问元集的群集节点(而不是要恢复的那个节点)的超级用户或使用等效角色。]
[从元集中删除节点:]
phys-schost-2# metaset -s schost-1 -f -d -h phys-schost-1
[替换故障磁盘并引导节点:]

从 Solaris CD 引导节点:


[使用 format  newfs 重建分区和文件系统。]
[在临时安装点上安装根文件系统:]
# mount /dev/dsk/c0t0d0s0 /a
[恢复根文件系统:]
# cd /a
# ufsrestore rvf /dev/rmt/0
# rm restoresymtable
[安装新的引导块:]
# /usr/sbin/installboot /usr/platform/`uname \
-i`/lib/fs/ufs/bootblk /dev/rdsk/c0t0d0s0

[删除 /temp-mountpoint/etc/system 文件中有关 MDD 根信息的那些行:
]
* Begin MDD root info (do not edit)
forceload: misc/md_trans
forceload: misc/md_raid
forceload: misc/md_mirror
forceload: misc/md_hotspares
forceload: misc/md_stripe
forceload: drv/pcipsy
forceload: drv/glm
forceload: drv/sd
rootdev:/pseudo/md@0:0,10,blk
* End MDD root info (do not edit)
[编辑 /temp-mountpoint/etc/vfstab
文件]
Example: 
Change from—
/dev/md/dsk/d10   /dev/md/rdsk/d10    /      ufs   1     no       -

Change to—
/dev/dsk/c0t0d0s0 /dev/rdsk/c0t0d0s0  /usr   ufs   1     no       -
[卸载临时文件系统并检查原始磁盘设备:
]
# cd /
# umount /a
# fsck /dev/rdsk/c0t0d0s0
[重新引导:]
# reboot
[替换磁盘 ID:]
# scdidadm -R /dev/rdsk/c0t0d0
[重建状态数据库副本:]
# metadb -c 3 -af /dev/rdsk/c0t0d0s4
[将节点重新添加至元集:]
phys-schost-2# metaset -s schost-1 -a -h phys-schost-1