执行 Hardware Management Pack 安装之前,请查看以下主题。
如果 Oracle Linux 故障管理体系结构 (Fault Management Architecture, FMA) 软件未正常工作,请检查以下模块和服务是否处于正确状态:
|
要检查以下服务和模块,请参见在安装 Oracle Linux FMA 软件之前安装所需的 Linux 组件。
如果在运行 Oracle Solaris OS 或 Linux OS 的服务器上设置了 DISPLAY 变量,则安装程序会中止。要避免此问题,请在安装 Hardware Management Pack 之前取消设置 DISPLAY 变量。
在 Oracle Solaris OS 系统上启动 Oracle Hardware Management Pack 安装程序时,可能会出现以下错误:
./install.bin: !: not found
可以忽略此错误,安装程序将正常启动。
在运行 Oracle Solaris OS 并安装了 SUNWCreq(核心系统支持)元簇的服务器上安装 Oracle Hardware Management Pack 之前,必须先安装 SUNWxcu4(包含 POSIX df 命令)或设置以下环境变量:
IATEMPDIR=$HOME
对于运行 Windows Server 2008 R2 的 Sun Fire X4170 M2 系统,从 X4170 M2 工具和驱动程序 CD 安装驱动程序,然后再使用 RAIDconfig 工具。如果安装驱动程序失败,则可能会导致无法正确报告连接到内部 ICH10 控制器的 HDD 的插槽信息。
也可以使用 Oracle Hardware Installation Assistant 安装 Windows Server 2008 R2 来避免此问题。
在安装了 SUNWipmi 的 Oracle Solaris OS 10 服务器上,无法成功安装 Hardware Management Pack。唯一的解决方法是使用 Ctrl-C 停止当前安装,删除已安装的 SUNWipmi 版本,然后重新启动 Hardware Management Pack 安装。
在 Oracle Linux 6 上使用 GUI 模式的 Oracle Hardware Management Pack 安装程序时,无法启动图形安装程序。这是因为默认情况下未安装 libXtst.i686 软件包。要么安装此软件包再使用 GUI 模式,要么使用控制台模式。
如果选择使用 Oracle Hardware Management Pack 安装程序在 Linux 上安装 QLogic 支持,此过程可能需要很长时间。为了提高此过程的效率,请手动安装 QLogic 软件包。
在安装过程中,可能会显示摘要屏幕
Disk Space Information (for Installation Target): Required: 169,082,111 bytes Available: Error!
可以放心地忽略此消息。
当使用 Solaris 自动化安装程序(Solaris 11 中引入)在服务器上部署软件时,在自动化安装程序在安装期间执行重新引导后,服务器的主机到 ILOM 互连功能(是许多 Oracle Hardware Management Pack 功能必需的功能)可能会留在禁用状态。如果发生此情况,请在安装完成后再次重新引导服务器,这样应当可以纠正问题。
要确定您的服务器是否由自动化安装程序安装,请键入以下命令:
# netadm list | grep ncp ncp Automatic online <-- Automated Installer was used ncp DefaultFixed disabled
使用 Linux Anaconda 安装程序或 Oracle System Assistant 辅助 OS 安装(称为 Anaconda 安装程序)时,Oracle Linux FMA 软件安装可能失败。将成功完成 OS 安装并安装该软件;不过,在安装之后服务器重新引导时,所需的 Oracle Linux FMA 服务不会自动启动。因此,在主机上不会记录或观察到任何 Oracle Linux FMA 故障事件。
如果发生该情况,请执行以下过程。
完成 OS 安装过程(忽略任何 Oracle Linux FMA 软件安装故障消息)。
在系统重新引导之后,以 root 用户身份登录并创建手册页的目录。
# mkdir -p /usr/local/share/man/man1m
创建指向安装的手册页的软链接。
# ln -s -t /usr/local/share/man/man1m /opt/fma/share/man/man1m/fmadm.1m /opt/fma/share/man/man1m/fmdump.1m /opt/fma/share/man/man1m/fmd.1m /opt/fma/share/man/man1m/intro.1m
启用相应的服务。
# chkconfig --add ksyseventd.init
# chkconfig --add fmd.init
然后,启动这些服务。
# service ksyseventd.init start
# service fmd.init start
使用 fmadm config 命令确保所有 Oracle Linux FMA 软件组件已安装并就绪。
例如:
[root@testserver16 ~]# fmadm config MODULE VERSION STATUS DESCRIPTION ext-event-transport 0.2 active External FM event transport fmd-self-diagnosis 1.0 active Fault Manager Self-Diagnosis ip-transport 1.1 active IP Transport Agent mce 1.0 active Machine Check Translator sysevent-transport 1.0 active SysEvent Transport Agent syslog-msgs 1.1 active Syslog Messaging Agent
为了使 Oracle Linux FMA 能够正常与 Oracle Linux 7 一起使用,mcelog 服务必须仅以守护进程模式运行。不过,默认情况下,Oracle Linux 7 中的 mcelog 服务使用参数运行:--ignorenodev --daemon --foreground。因此,在具有 Oracle Linux 7 的系统上安装 Oracle Linux FMA 2.3.1 之前,需要重新配置 mcelog 服务。
键入以下命令确保 mcelog 服务已安装并正在运行:
systemctl status mcelog
如果未安装 mcelog,您将看到:
[root@testserver16 ~]# systemctl status mcelog mcelog.service Loaded: not-found (Reason: No such file or directory) Active: inactive (dead)
如果未安装 mcelog,则键入以下命令使用 yum 安装 mcelog:
yum install mcelog
成功安装之后,继续执行下一步。
编辑 /etc/mcelog/mcelog.conf 文件,执行以下操作:
取消注释 "raw=yes" 条目。
注释掉现有的 "memory-ce-threshold" 条目并创建内容为 "memory-ce-threshold = 3 / 72h" 的新条目。
编辑 /etc/mcelog/mcelog.setup 文件,注释掉现有的 "/usr/sbin/mcelog --ignorenodev --syslog --foreground" 条目,然后创建内容为 "/usr/sbin/mcelog --daemon" 的新条目。
编辑 /etc/systemd/system/multi-usr.target.wants/mcelog.service 文件,将 "[Service]" 部分从:
[Service] ExecStartPre=/etc/mcelog/mcelog.setup ExecStart=/usr/sbin/mcelog --ignorenodev --daemon --foreground StandardOutput=syslog
更改为:
[Service] Type=forking ExecStartPre=/etc/mcelog/mcelog.setup ExecStart=/usr/sbin/mcelog --daemon StandardOutput=syslog
键入以下命令应用所做的更改:
systemctl daemon-reload
键入以下命令重新启动 mcelog 服务:
systemctl restart mcelog
键入以下命令确认 mcelog 正以守护进程模式运行:
systemctl status mcelog
您应看到类似以下内容的输出:
[root@testserver16 ~]# systemctl status mcelog mcelog.service - Machine Check Exception Logging Daemon Loaded: loaded (/usr/lib/systemd/system/mcelog.service; enabled) Active: active (running) since Fri 2014-10-03 12:52:13 EDT; 6s ago Process: 3939 ExecStart=/usr/sbin/mcelog --daemon (code=exited, status=0/SUCCESS) Process: 3935 ExecStartPre=/etc/mcelog/mcelog.setup (code=exited, status=0/SUCCESS) Main PID: 3940 (mcelog) CGroup: /system.slice/mcelog.service |__3940 /usr/sbin/mcelog --daemon