问题摘要: 在 Oracle Solaris 11.2 中,当一个冗余物理 IB 网络路径或端口发生故障时,使用 Oracle Solaris Cluster 的专用网络的套接字直接协议 (Socket Direct Protocol, SDP) 可能失败。
默认情况下,对于 SDP 通信流量,Oracle Solaris 11.2 支持基于 IPMP 和 APM 的 HCA 管理故障转移。在 Oracle Solaris Cluster 环境中,互连不是在 IPMP 下进行管理的,需要在 InfiniBand 链路失败时进行 SDP 通信流量透明自动恢复。
解决方法: 要启用自动恢复功能并禁用 HCA 管理故障转移支持,请在 /etc/system 文件中添加以下行:
set sdpib:sdp_ip_path_verify=0
使用更新的引导归档文件重新引导节点,使更改生效。