Skip Headers
StorageTek Automated Cartridge System Library Software High Availability 8.3 Cluster 安装、配置和运行
发行版 8.3
E54100-01
  转到目录
目录
转到索引
索引

上一页
上一页
 
下一页
下一页
 

12 故障排除技巧

ACSLS HA 8.3 是在由 Solaris 11 控制的双节点系统上运行的 ACSLS 应用程序与由 Solaris Cluster 4.1 控制的 IPMP 和 ZFS 的集成。

检验 ACSLS 是否正在运行

要检验 ACSLS 服务是否在活动节点上运行,请以 acsss 用户身份使用以下命令:

# su - acsss
$ acsss status

如果一项或多项服务被禁用,请使用 $ acsss enable 启用它们。

如果状态显示结果表明一项或多项 ACSLS 服务处于维护模式,则运行以下命令:$ acsss l-status

查找有错服务的日志文件的路径,并在该日志中查找可以解释为何将服务置于维护模式的线索。

如果一项或多项 acsls 服务处于维护模式,则可以通过使用 acsss 命令禁用再启用它们来将其清除。

$ acsss shutdown
$ acsss enable

作为 root 用户,您还可以清除单个服务:# svcadm clear <service name>

在纠正底层故障之前,将不会清除服务。

还应当查看特定的运行日志来查明问题的根源。这些日志大多数都位于 $ACS_HOME/log 目录中。

要查看的主日志是 acsss_event.log。此日志记录了关于 ACSLS 的整体运行的大多数事件。

如果问题与 ACSLS GUI 或逻辑磁带库操作有关,则可以在 $ACS_HOME/log/sslm 目录中找到相关日志。

对于 ACSLS GUI 和 WebLogic,请查找 AcslsDomain.logAdminServer.loggui_trace.logs

与 WebLogic 相关的安装问题位于 weblogic.log 中。

对于逻辑磁带库问题,如果已配置了一个逻辑磁带库,则可以查阅 slim_event.logssmce_stderr.log

处理与共享磁盘资源之间的连接

  1. 检验 acsls-storage 资源是否已在活动群集节点上联机。

    # clrs status acsls-storage
    
  2. 如果 acsls-storage 资源没有联机,请检验该资源是否已挂载到活动节点上的 ZFS:

    # zpool status
    

    如果 acslspool 未挂载到活动节点上,请检验它是否已挂载到备用节点上

    # ssh standby hostname zpool status
    

    如果共享磁盘资源已挂载到备用节点上,则将群集控件切换到该节点。

    # clrg switch -n standby hostname acsls-rg
    
  3. 如果 acslspool 未挂载到活动节点上,并且 acsls-storage 资源处于脱机状态,请检验 acslspool 对活动节点是否可见。

    # zpool import (no argument)
    

    注:

    只有当 acsls-storage 处于脱机状态时,此操作才可运行。要使其脱机,请使用命令 clrs disable acsls-storage

    如果 acslspool 对活动节点可见,则可以尝试导入它:

    # zpool import -f acslspool
    

    如果 import 操作成功,则使 acsls-storage 资源在 Solaris Cluster 上联机:

    # clrs enable acsls-storage
    

    如果 acslspool 对活动节点不可见,则需要排除与共享驱动器之间的物理连接的故障。

确定为何无法 ping 通逻辑主机

  1. 检验是否已向 Solaris Cluster 注册了逻辑主机名。

    # clrslh list
    
  2. 确定活动节点:

    # clrg status | grep -i Online
    
  3. 检验是否可以 ping 通活动节点。

    # ping <node name>
    
  4. 检验 logical-host-name 资源是否已在活动节点上联机。

    # clrslh status
    

    如果逻辑主机没有联机,则启用它。

    # clrs enable <logical host>
    
  5. 检验分配给公共组的 IP 接口的状态。

    # ipadm
    

    在输出显示中,检验公共 ipmp 组的每个成员是否处于 ok 状态。

  6. 对于公共组 (ipmp0) 中的每个接口,检验其物理状态。

    # dladm show-phys
    
  7. 检验是否已为公共 ipmp 组中的两个接口(步骤 5 中显示的)之一激活了逻辑主机

    # arp <logical-hostname>
    # ifconfig net0
    # ifconfig net4
    

    此示例假定 net0 和 ne4 已分配给公共 ipmp 组。

    两个接口之一的 MAC 地址应当与分配给逻辑主机名的 MAC 地址一致。

检查节点之间的互连

如果您怀疑群集控件因为两个节点之间的 Cluster 通信中断而失败,则可以按以下所示检查 Cluster 的专用互连:

# cluster status -t interconnect