跳过导航链接 | |
退出打印视图 | |
Solaris Volume Manager 管理指南 Oracle Solaris 10 1/13 Information Library (简体中文) |
4. Solaris Volume Manager for Sun Cluster(概述)
5. 配置和使用 Solaris Volume Manager(方案)
20. 维护 Solaris Volume Manager(任务)
Solaris Volume Manager 维护(任务列表)
如何查看 Solaris Volume Manager 卷配置
如何根据配置文件初始化 Solaris Volume Manager
21. Solaris Volume Manager 的最佳做法
25. Solaris Volume Manager 故障排除(任务)
A. 重要的 Solaris Volume Manager 文件
B. Solaris Volume Manager 快速参考
Solaris Volume Manager 可以替换并启用 RAID–1(镜像)和 RAID–5 卷中的组件。
在 Solaris Volume Manager 术语中,替换组件是一种使用系统上可用的组件来替换子镜像或 RAID–5 卷中的选定组件的方法。可以将此过程认为是逻辑替换,而不是物理替换组件。有关更多信息,请参见将一个组件替换为另一个可用组件。
启用组件是指“激活”组件,或组件以自身进行替换(即组件名称不变)。有关更多信息,请参见启用组件。
存在以下任何情况时即可启用组件:
Solaris Volume Manager 无法访问物理驱动器。出现此问题的原因可能是断电或驱动器电缆松动。在这种情况下,Solaris Volume Manager 将组件置于 "Maintenance"(维护)状态。您需要确保驱动器可以访问(恢复供电、重新连接电缆等),然后启用卷中的组件。
您怀疑物理驱动器出现了和磁盘不相关的暂时性问题。您可以只通过启用组件来修复处于 "Maintenance"(维护)状态的组件。如果启用组件没有修复该问题,则需要执行以下操作之一:
物理替换该磁盘驱动器并启用组件
使用系统上其他可用的组件替换该组件
物理替换磁盘时,务必要与被替换的磁盘同样地对该磁盘进行分区,确保在每一个使用的组件上均有足够的空间。
注 - 始终检查被替换的磁盘上的状态数据库副本和热备件。替换磁盘前,应当删除处于出错状态的所有状态数据库副本。然后,在启用组件后,使用相同的大小重新创建状态数据库副本。您应当以同样方式来处理热备件。
要将现有的组件替换或切换为系统上可用但尚未使用的不同组件,可以使用 metareplace 命令。
存在以下任何情况时即可使用该命令:
磁盘驱动器出现问题,并且没有替换驱动器。但是,在系统中其他位置确实有可用的组件。
当替换绝对必要,但又不想关闭系统时,可能需要使用该策略。
在物理磁盘上发现软错误。
物理磁盘可能会报告软错误,即使 Solaris Volume Manager 显示镜像/子镜像或 RAID-5 卷处于 "Okay"(正常)状态。通过将存在问题的组件替换为另一个可用的组件,您可以执行预防维护,还可能防止产生不可更正的错误。
您想进行性能调优。
有一种评估组件的方法是使用 Solaris Management Console 中增强的存储工具提供的性能监视功能。例如,您可以看到 RAID-5 卷中某一特定组件的平均负载很高,即使它处于 "Okay"(正常)状态。要平衡卷上的负载,您可以将该组件替换为较少使用的磁盘中的组件。您可以在不中断对卷提供服务的情况下联机执行此类替换。
RAID-1 或 RAID-5 卷中的组件出现错误时,Solaris Volume Manager 会将组件置于 "Maintenance"(维护)状态。对处于 "Maintenance"(维护)状态的组件,不执行进一步的读取或写入。
有时组件会进入 "Last Erred"(最近出错)状态。对于 RAID–1 卷,这种情况通常伴随单向镜像出现。卷出现错误。但是,没有冗余组件可进行读取。对于 RAID–5 卷,这种情况在一个组件进入 "Maintenance"(维护)状态,而另一个组件又发生故障后出现。发生故障的第二个组件将进入 "Last Erred"(最近出错)状态。
当 RAID–1 卷或 RAID–5 卷有某一组件处于 "Last Erred"(最近出错)状态时,仍会尝试对标记为 "Last Erred"(最近出错)的组件执行 I/O 操作。进行这种 I/O 尝试是因为 "Last Erred"(最近出错)状态的组件包含最近一次的正确数据副本(从 Solaris Volume Manager 的角度来看)。对于处于 "Last Erred"(最近出错)状态的组件,卷的行为类似于正常的设备(磁盘),会向应用程序返回 I/O 错误。通常,此时已丢失一些数据。
相同卷中其他组件上的后续错误会以不同方式进行处理,具体取决于卷的类型。
RAID–1 卷可能容许多个组件处于 "Maintenance"(维护)状态,且仍然可以进行读取和写入。如果组件处于 "Maintenance"(维护)状态,则未丢失任何数据。您可以按任何顺序安全地替换或启用这些组件。如果组件处于 "Last Erred"(最近出错)状态,则无法替换它,除非您先替换那些处于 "Maintenance"(维护)状态的组件。替换或启用处于 "Last Erred"(最近出错)状态的组件通常意味着某些数据已丢失。请确保在修复后验证镜像上的数据。
RAID–5 卷可以容许单个组件处于 "Maintenance"(维护)状态。您可以在不丢失数据的情况下安全地替换处于 "Maintenance"(维护)状态的单个组件。如果在其他组件上出现错误,该组件将置于 "Last Erred"(最近出错)状态。此时,RAID–5 卷为只读设备。您需要执行某些类型的错误恢复,以便稳定 RAID–5 卷的状态和减少数据丢失的可能性。如果一个 RAID–5 卷到达 "Last Erred"(最近出错)状态,则它很可能已丢失数据。请确保在修复后验证 RAID–5 卷上的数据。
始终先替换处于 "Maintenance"(维护)状态的组件,然后再替换处于 "Last Erred"(最近出错)状态的组件。替换和重新同步组件后,使用 metastat 命令验证其状态。然后,验证数据。
替换 RAID–1 卷或 RAID–5 卷中的组件时,请遵循以下这些原则:
始终先替换处于 "Maintenance"(维护)状态的组件,然后再替换处于 "Last Erred"(最近出错)状态的组件。
替换和重新同步组件后,使用 metastat 命令验证该卷的状态。然后,验证数据。替换或启用处于 "Last Erred"(最近出错)状态的组件通常意味着某些数据已丢失。请确保在修复后验证卷上的数据。对于 UFS,运行 fsck 命令验证“元数据”(文件系统的结构)。然后,检查实际的用户数据。(实际上,用户必须检查他们的文件。)数据库或其他应用程序必须有自己的方法来验证其内部数据结构。
替换组件时始终检查状态数据库副本和热备件。替换物理磁盘前,应当删除处于出错状态的所有状态数据库副本。启用组件前应当添加回状态数据库副本。相同过程也适用于热备件。
在替换 RAID–5 卷组件的期间,可使用两种方法中的任一种恢复数据。或者从当前正在使用的热备件恢复数据,或者使用 RAID–5 奇偶校验恢复数据(没有热备件处于使用中时)。
替换 RAID–1 卷的组件时,Solaris Volume Manager 会自动启动新组件与其他卷的重新同步。重新同步完成后,替换的组件即可读取且可写入。如果使用来自热备件的数据替换出现故障的组件,该热备件将置于 "Available"(可用)状态,并可用于其他热备件替换。
新的组件必须足够大,才能替换旧的组件。
作为预防措施,在替换 "Last Erred"(最近出错)设备之前,请备份所有数据。