问题摘要:在故障转移或使用 scswitch 将数据服务定位到节点之前,无法检查 NFS 文件系统的持久性。如果某节点没有 NFS 文件系统,则对该节点的切换/故障转移将导致需要手动介入的数据服务出现故障。在尝试对该节点进行切换/故障转移之前,需要使用类似于 HAStoragePlus 的机制来检查文件系统的持久性。
解决方法:使用 NAS 文件管理器(带有 /etc/vfstab 中的条目)的文件系统不是在 Sun Cluster 软件的控制下安装的,这意味着 Sun Cluster 软件不会发现任何问题。 如果文件系统变得不可用,则执行数据服务方法(如 START 或 STOP)时,某些数据服务(如 Sun Cluster HA for Oracle)将失败。
这些方法的失败可能会导致几种可能性:
如果应用程序 (Oracle) 的二进制文件不可用,则数据服务资源(例如 HA-Oracle)可能会进入 STOP_FAILED 状态。
数据服务可能会不断地尝试故障转移到备用节点,直到该数据服务能够成功启动或在所有可能节点上的启动尝试均失败。
执行以下过程之一以避免上述问题:
将应用程序二进制文件置于故障转移文件系统或群集文件系统。然后配置 HAStoragePlus 资源以代表此文件系统并记录应用程序对此资源的依赖性。当文件系统不可用时,系统将不会尝试启动应用程序。
将应用程序二进制文件置于本地根文件系统中。如果本地根文件系统未运行,节点将不能加入群集,并且系统将不会尝试启动该节点上的应用程序。