问题摘要:如果一个群集节点在不同子网上将两个或两个以上的网络地址用于通信,则必须将 /etc/horcm.conf 文件中的 IP_addres 设置为 NONE。即使这些网络地址属于同一子网,也必须将 IP_address 字段设置为 NONE。
如果未将 IP_address 字段设置为 NONE,则即使远程进程 horcmd 处于活动状态并且能够进行响应,Hitachi TrueCopy 命令也会做出意外的响应并出现超时错误 ENORMT。
解决方法:如果 /etc/horcm.conf 文件中 Hitachi TrueCopy 的默认超时值发生了变化,请更新 SUNW.GeoCtlTC 资源超时值。/etc/horcm.conf 中 Hitachi TrueCopy 的默认超时值为 3000(10ms),即 30 秒。
通过 Sun Cluster Geographic Edition 环境创建的 SUNW.GeoCtlTC 资源的默认超时值也被设置为 3000(10ms)。
如果 /etc/horcm.conf 中 Hitachi TrueCopy 的默认超时值发生了变化,则必须按照下面讨论的算法对资源超时值进行更新。除非情况需要,否则请勿更改 /etc/horcm.conf 和 Hitachi TrueCopy 资源的默认超时值。
基于各种因素,以下的等式确立了 Hitachi TrueCopy 命令超时的时间上限:
以下等式中的单位是秒。
将 horctimeout 设置为在 /etc/horcm.conf 中配置的超时值
将 numhosts 设置为远程群集中的主机数目。对于对命令,horcmd 命令尝试与每个远程主机进行联系。
将 numretries 设置为 2。numretries 指定 horcmd 命令尝试与每个远程主机进行联系的最大次数。
将 Upper-limit-on-timeout 设置为 (horctimeout * numhosts * numretries)。
例如,如果 horctimeout 被设置为 30,numhosts 被设置为 2,numretries 被设置为 2,则 Upper-limit-on-timeout 将为 120。
基于 Upper-limit-on-timeout 的值,应设置以下资源超时值。为了处理其他命令,应至少指定 60 秒的缓冲时间。
Validate_timeout = Upper-limit-on-timeout + 60 Update_timeout = Upper-limit-on-timeout + 60 Monitor_Check_timeout = Upper-limit-on-timeout + 60 Probe_timeout = Upper-limit-on-timeout + 60 Retry_Interval = (Prote_timeout + Thorough_probe_interval) + 60 |
资源中的其他超时参数应包含默认值。
要更改超时值,请完成以下步骤:
使用 scswitch 命令使资源组脱机。
使用 scrgadm 命令更新所需的超时属性。
使用 scswitch 命令使资源组联机。