请查看下列有关客户机系统引导时所出现错误的附加信息。
如果在自动化安装过程中未找到引导磁盘,则验证引导磁盘并修改 AI 清单。
在 SPARC OBP 中或在 x86 BIOS 中显式选择引导设备。
重新引导系统。
登录到安装的系统。
确定要在安装期间使用的设备。可通过 SYS/HDD* 插口名称或 CTD 磁盘名称来确定设备,如 format 命令中所示。
修改 /system/volatile/ai.xml 清单并替换 "boot_disk" 值。例如:
<disk_keyword key="SYS/HDD1" name_type="receptacle"/>
<disk_keyword key="c0t5000CCA012B2A254d0" name_type="ctd"/>
刷新安装服务。
# svcadm clear auto-installer
本节介绍了在通过网络引导 SPARC 客户机时可能出现的错误或问题以及可能的原因:
如果 DHCP 服务器未响应 SPARC 客户机的请求,将显示如下消息:
... OpenBoot 4.23.4, 8184 MB memory available, Serial #69329298. Ethernet address 0:14:4f:21:e1:92, Host ID: 8421e192. Rebooting with command: boot net:dhcp - install Boot device: /pci@7c0/pci@0/network@4:dhcp File and args: 1000 Mbps FDX Link up Timed out waiting for BOOTP/DHCP reply Timed out waiting for BOOTP/DHCP reply Timed out waiting for BOOTP/DHCP reply Timed out waiting for BOOTP/DHCP reply
此超时消息意味着客户机发出了 DHCP 请求,但没有针对该请求的响应。此错误可能是由于 DHCP 配置问题而导致的。检查是否在 DHCP 服务器中正确配置了您的客户机。
如果 AI 客户机开始下载 boot_archive,但失败并出现 "Boot load failed" 错误,那么意味着客户机的 DHCP 信息配置错误。
Rebooting with command: boot net:dhcp - install Boot device: /pci@7c0/pci@0/network@4:dhcp File and args: 1000 Mbps FDX Link up HTTP: Bad Response: 500 Internal Server Error Evaluating: Boot load failed
如果有另一个 DHCP 服务器响应了该客户机,就会发生此错误。检查此客户机的 DHCP 配置。如果配置看上去没有错误,那么应确定子网中是否存在另一个 DHCP 服务器。
在 AI 客户机获取了 IP 地址和初始参数并开始下载引导归档文件后,客户机可能无法找到或下载 boot_archive。
如果客户机找不到 boot_archive,那么会显示以下错误:
Rebooting with command: boot net:dhcp - install Boot device: /pci@7c0/pci@0/network@4:dhcp File and args: 1000 Mbps FDX Link up <time unavailable> wanboot info: WAN boot messages->console <time unavailable> wanboot info: Starting DHCP configuration <time unavailable> wanboot info: DHCP configuration succeeded <time unavailable> wanboot progress: wanbootfs: Read 366 of 366 kB (100%) <time unavailable> wanboot info: wanbootfs: Download complete Mon Aug 5 20:46:43 wanboot alert: miniinfo: Request returned code 500 Mon Aug 5 20:46:44 wanboot alert: Internal Server Error \ (root filesystem image missing)
如果 AI 客户机找到了 boot_archive 文件,但无法访问该文件,那么会显示以下错误:
Rebooting with command: boot net:dhcp - install Boot device: /pci@7c0/pci@0/network@4:dhcp File and args: 1000 Mbps FDX Link up <time unavailable> wanboot info: WAN boot messages->console <time unavailable> wanboot info: Starting DHCP configuration <time unavailable> wanboot info: DHCP configuration succeeded <time unavailable> wanboot progress: wanbootfs: Read 366 of 366 kB (100%) <time unavailable> wanboot info: wanbootfs: Download complete Mon Aug 5 20:53:02 wanboot alert: miniroot: Request returned code 403 Mon Aug 5 20:53:03 wanboot alert: Forbidden
对于这两种问题,都应修复为该客户机配置的 boot_archive 文件。检查位于 $IMAGE/boot/boot_archive 的 boot_archive 的路径名和权限。
如果 AI 客户机成功下载 boot_archive 并引导 Oracle Solaris 内核,但无法获取映像归档文件之一,则显示消息 ERROR 403: Forbidden 和 ERROR 404: Not Found。将显示一个指示是哪个文件导致此问题的错误消息。例如,在 SPARC 客户机的以下输出中,solaris.zlib 文件在指定的位置不存在或无法访问:
<time unavailable> wanboot info: Starting DHCP configuration <time unavailable> wanboot info: DHCP configuration succeeded <time unavailable> wanboot progress: wanbootfs: Read 368 of 368 kB (100%) <time unavailable> wanboot info: wanbootfs: Download complete Mon May 5 18:57:36 wanboot progress: miniroot: Read 235737 of 235737 kB (100%) Mon May 5 18:57:36 wanboot info: miniroot: Download complete SunOS Release 5.11 Version 11.2 64-bit Copyright (c) 1983, 2014, Oracle and/or its affiliates. All rights reserved. Remounting root read/write Probing for device nodes ... Preparing network image for use Downloading solaris.zlib --2014-05-05 18:52:30-- http://10.134.125.136:5555/export/auto_install/11_2_sparc/solaris.zlib Connecting to 10.134.125.136:5555... connected. HTTP request sent, awaiting response... 404 Not Found 2014-05-05 18:52:30 ERROR 404: Not Found. Could not obtain http://10.134.125.136:5555/export/auto_install/11_2_sparc/solaris.zlib from install server Please verify that the install server is correctly configured and reachable from the client
此问题可能是由于下列情况之一所导致的:
WAN Boot 中配置的映像路径不正确。
映像路径不存在或者不完整。
由于权限问题,访问被拒绝。
检查 DHCP 配置或者您在运行 installadm create-service 时指定的网络映像的内容。检查 WAN Boot 配置。
在客户机系统上安装 Oracle Solaris OS 时,需要在引导时按以下方式包括 install 参数,以便启动安装:
ok boot net:dhcp - install
如果在未使用 install 引导参数的情况下进行引导,SPARC 客户机会引导到自动化安装程序引导映像,但不会启动安装。有关如何从此刻启动自动安装的说明,请参见从命令行启动自动化安装。
如果引导 SPARC AI 客户机后不久即在 SPARC 控制台上看到消息 Invalid HMAC value,并且系统返回到 ok 提示符,则导致该问题的原因可能是以下几种情况之一:
该 AI 客户机由验证机制提供保护,但是您未设置 OBP 密钥。解决方法是在客户机固件中设置 OBP 密钥。有关验证的信息,请参见提高自动化安装的安全性。有关设置 OBP 密钥的信息,请参见使用安全下载安装 SPARC 客户机。
该 AI 客户机未受保护,但是已设置 OBP 密钥。解决方法是取消客户机固件中 OBP 密钥的设置。请参见重置散列密钥和加密密钥。
客户机的安装服务具有要求客户机验证的策略,但未分配适用于该客户机的凭证。确保具有策略 require-client-auth 的所有客户机服务都有可用凭证。
以下步骤说明了如何识别该问题。
确认没有为 AI 服务器禁用安全功能。使用 installadm list -sv 查看是否启用了安全功能。
确认没有为客户机的安装服务禁用安全功能。使用 installadm list -vn <svcname> 查看是否未禁用安全功能。
如果客户机使用定制凭证,则使用 installadm list -ve <macaddr> 获取固件密钥值。
如果客户机不是定制客户机,则使用 installadm list -vn default-sparc 查看是否为 default-sparc 服务定义了任何固件密钥。
使用 installadm list -vn <svcname> 检查客户机服务的策略。
如果 default-sparc 服务没有凭证,则使用 installadm list -sv 命令查找缺省客户机凭证。如果有缺省客户机凭证,则使用为缺省客户机列出的固件密钥。
如果没有缺省客户机凭证,则使用 installadm list -vn default-sparc 查看是否已将服务策略设置为 require-server-auth。如果已设置,则使用 installadm list -sv 中为缺省客户机列出的固件密钥。
本节介绍了在通过网络引导 x86 客户机时可能出现的错误或问题以及可能的原因:
如果 DHCP 服务器未响应 x86 客户机的请求,您将看到以下消息:
Intel(R) Boot Agent PXE Base Code (PXE-2.1 build 0.86) Copyright(C) 1997-2007, Intel Corporation CLIENT MAC ADDR 00 14 4F 29 04 12 GUID FF2000008 FFFF FFFF FFFF 7BDA264F1400 DHCP......... No DHCP or ProxyDHCP offers were received PXE-MOF: Exiting Intel Boot Agent
超时消息意味着客户机发送了 DHCP 请求,但未收到响应。此问题可能是由于 DHCP 配置错误而引起的。检查是否在 DHCP 服务器中正确配置了您的客户机。
DHCP 服务器在 DHCP 响应中提供 IP 地址和初始引导程序的位置。
如果引导程序不存在,那么 AI 客户机引导将无法继续。将显示以下消息:
Intel(R) Boot Agent PXE Base Code (PXE-2.1 build 0.86) Copyright(C) 1997-2007, Intel Corporation CLIENT MAC ADDR 00 14 4F 29 04 12 GUID FF2000008 FFFF FFFF FFFF 7BDA264F1400 CLIENT IP: 10.6.68.29 MASK: 255.255.255.0 DHCP IP: 10.6.68.49 GATEWAY: 10.6.68.1 TFTP. PXE-T02: Access Violation PXE-E3C: TFTP Error - Access violation PXE-MOF: Exiting Intel Boot Agent
如果引导程序存在,但不是正确的程序,那么 AI 客户机将在显示如下消息后挂起:
Intel(R) Boot Agent PXE Base Code (PXE-2.1 build 0.86) Copyright(C) 1997-2007, Intel Corporation CLIENT MAC ADDR 00 14 4F 29 04 12 GUID FF2000008 FFFF FFFF FFFF 7BDA264F1400 CLIENT IP: 10.6.68.29 MASK: 255.255.255.0 DHCP IP: 10.6.68.49 GATEWAY: 10.6.68.1
如果客户机能够执行初始引导,但内核无法引导,那么系统将在用户从 GRUB 菜单中选择某一项后挂起。
在 AI 服务器上,检查此客户机的 grub.cfg 文件或 menu.lst 文件是否指向有效的引导归档文件。在该服务器上,映像的引导目录应当回送挂载到 /etc/netboot 目录下,如用于 installadm list 所示映像路径的 df -k 所生成的以下摘录样例所示:
Filesystem 1K-blocks Used Available Use% Mounted on /export/auto_install/solaris11_2-i386 92052473 36629085 55423388 40% /etc/netboot/default-i386 /export/auto_install/solaris11_2-i386 92052473 36629085 55423388 40% /etc/netboot/solaris11_2-i386
在 AI 服务器上,如果某个安装程序在 /etc/netboot 下的 grub.cfg 文件或 menu.lst 文件中所指定的位置不可访问或不存在,则客户机能够引导,但无法下载该文件。将显示一个指示是哪个文件导致此问题的错误消息。例如,在 x86 客户机上的以下输出中,solaris.zlib 文件在指定的位置不存在:
SunOS Release 5.11 Version 11.2 64-bit Copyright (c) 1983, 2012, Oracle and/or its affiliates. All rights reserved. Remounting root read/write Probing for device nodes ... Preparing network image for use Downloading solaris.zlib --2015-05-05 20:02:26-- http://10.134.125.136:5555/export/auto_install/solaris11_2-i386/solaris.zlib Connecting to 10.134.125.136:5555... connected. HTTP request sent, awaiting response... 404 Not Found 2015-05-05 20:02:26 ERROR 404: Not Found. Could not obtain http://10.134.125.136:5555/export/auto_install/solaris11_2-i386/solaris.zlib from install server Please verify that the install server is correctly configured and reachable from the client Requesting System Maintenance Mode (See /lib/svc/share/README for more information.) Console login service(s) cannot run
检查您在运行 installadm create-service 命令时所指定的目标目录的内容。
对于通过网络进行引导的安装,在 x86 客户机系统上安装 Oracle Solaris OS 时,您必须选择 GRUB 引导菜单中的第二项以启动自动化安装。通常,菜单项如下所示:
Oracle Solaris 11.2 Text Installer and command line Oracle Solaris 11.2 Automated Install
如果选择了第一个 GRUB 菜单项或允许超时提示,那么系统将引导到自动化安装引导映像,但是不会启动安装。有关如何从此刻启动自动安装的说明,请参见从命令行启动自动化安装。
以下错误是 SPARC 和 x86 安装的常见错误:
如果安装期间发生失败,那么会显示以下消息:
21:43:34 Automated Installation Failed. See install log at /system/volatile/install_log Automated Installation failed Please refer to the /system/volatile/install_log file for details Jul 6 21:43:34 solaris svc.startd[9]: application/auto-installer:default failed fatally: transitioned to maintenance (see 'svcs -xv' for details)
为了安装 Oracle Solaris OS,安装客户机需要访问 AI 清单中定义的 IPS 软件包系统信息库。如果客户机无法访问软件包系统信息库,安装将失败,并且 application/auto-installer 服务将转换到维护状态。以下输出是有关控制台上显示内容的示例:
15:54:46 Creating IPS image 15:54:46 Error occurred during execution of 'generated-transfer-1341-1' checkpoint. 15:54:47 Failed Checkpoints: 15:54:47 15:54:47 generated-transfer-1341-1 15:54:47 15:54:47 Checkpoint execution error: 15:54:47 15:54:47 Framework error: code: 6 reason: Couldn't resolve host 'pkg.example.com' 15:54:47 URL: 'http://pkg.example.com/solaris/release/versions/0/'. 15:54:47 15:54:47 Automated Installation Failed. See install log at /system/volatile/install_log Automated Installation failed Please refer to the /system/volatile/install_log file for details Aug 21 15:54:47 line2-v445 svc.startd[8]: application/auto-installer:default failed fatally: transitioned to maintenance (see 'svcs -xv' for details) ... SUNW-MSG-ID: SMF-8000-YX, TYPE: defect, VER: 1, SEVERITY: major EVENT-TIME: Wed Aug 21 15:54:47 UTC 2013 PLATFORM: SUNW,Sun-Fire-V445, CSN: -, HOSTNAME: line2-v445 SOURCE: software-diagnosis, REV: 0.1 EVENT-ID: c8a5b809-ece4-4399-9646-d8c64d78aac7 DESC: A service failed - a start, stop or refresh method failed. AUTO-RESPONSE: The service has been placed into the maintenance state. IMPACT: svc:/application/auto-installer:default is unavailable. REC-ACTION: Run 'svcs -xv svc:/application/auto-installer:default' to determine the generic reason why the service failed, the location of any logfiles, and a list of other services impacted. Please refer to the associated reference document at http://support.oracle.com/msg/SMF-8000-YX for the latest service procedures and policies regarding this diagnosis.
检查 /system/volatile/install_log 文件中是否存在如下消息:
TransportFailures: Framework error: code: 6 reason: Couldn't resolve host 'pkg.example.com' URL: 'http://pkg.example.com/solaris/versions/0/'
TransportFailures: Framework error: code: 7 reason: Failed connect to pkg.example.com:80; Connection refused URL: 'http://pkg.example.com/solaris/versions/0/'
TransportFailures: http protocol error: code: 404 reason: Not Found URL: 'http://pkg.oracle.com/mysolaris/versions/0/'
根据所看到的消息,尝试以下可能的补救措施:
尝试从发生故障的客户机系统访问软件包服务器,例如通过使用 ping。
如果使用的是 DNS,请检查 AI 客户机上的 DNS 是否正确配置。请参见检查 DNS。
如果使用的是本地系统信息库,请检查是否已将该系统信息库设为可供所有客户机访问。请参见在 Oracle Solaris 11.2 中复制和创建软件包系统信息库 中的第 3 章 提供对系统信息库的访问。
确保 AI 清单中的 URI 不存在排字错误。
使用命令(如以下命令)检查软件包系统信息库是否有效:
$ pkg list -g http://pkg.example.com/solaris/ entire
您可能需要刷新目录或重新生成索引。
如果不能在 IPS 系统信息库中找到 AI 清单中指定的某个软件包,那么安装程序将会失败,从而无法在磁盘上安装任何软件包。在以下示例中,安装程序在 IPS 系统信息库中找不到软件包 mypkg。以下输出是有关控制台上显示内容的示例:
14:04:02 Failed Checkpoints: 14:04:02 14:04:02 generated-transfer-1230-1 14:04:02 14:04:02 Checkpoint execution error: 14:04:02 14:04:02 The following pattern(s) did not match any allowable packages. Try 14:04:02 using a different matching pattern, or refreshing publisher information: 14:04:02 14:04:02 pkg:/mypkg 14:04:02 14:04:02 Automated Installation Failed. See install log at /system/volatile/install_log
以下输出是 /system/volatile/install_log 日志文件部分内容的示例:
PlanCreationException: The following pattern(s) did not match any allowable packages. Try using a different matching pattern, or refreshing publisher information: pkg:/mypkg
检查所提到的软件包是否是有效的软件包。如果可从其他 IPS 系统信息库获取此软件包,请通过将另一个 publisher 元素添加到 source 元素来在 AI 清单中添加该 IPS 系统信息库。
引导 AI 客户机时,如果出现与以下内容类似的消息,则表示 TLS 证书尚未生效:
SSL3_GET_RECORD:wrong version number - secure HTTPS GET REQUEST to unsecured HTTP port
此问题的原因可能是,客户机上的系统时间在证书的生成时间之前。检查客户机上的系统时间。有关如何生成和分配安全凭证的信息,请参见提高自动化安装的安全性。
如果您已按提高自动化安装的安全性中的说明对 AI 服务器和客户机实施了保护,并且在引导或安装这些客户机时遇到问题,请尝试执行以下步骤来检查验证错误:
检查客户机上 /var/ai/image-server/logs/ 中的 Apache access_log 和 error_log。
登录到 AI 客户机的控制台。检查 /system/volatile/ 中的 /tmp/install_log 文件和 SMF 服务日志。
如果在引导归档文件装入到 AI 客户机后,尝试获取映像文件、AI 清单或系统配置文件时,发生验证失败,则可能是发生了瞬时网络中断。检查 AI 服务器是否正常运行,然后重新启动客户机安装。
尝试使用 openssl s_client 命令测试连接:
$ openssl s_client -key client-key -cert client-certificate \ -CAcert server-CA-certificate -connect AI-server-address:port
使用 installadm list -s -v 命令显示 AI 服务器上安全功能的启用或禁用状态。请参见Example 8–40。
使用 installadm list -v -n <svcname> 命令检查客户机的服务策略
。
根据 CA 证书检查分配的凭证。将 –K 和 –C 选项与 installadm list 子命令结合使用以列出分配的密钥和证书。使用字符比较实用程序(如 diff)将这些密钥和证书与预期密钥和证书加以比较。
确保已从客户机上的 /var/ai/ai-webserver/tls.key/server.key 删除口令短语。X.509 私钥文件必须已删除任何口令短语。
尝试使用 wget 命令以及相应密钥、证书和 CA 认证,从 AI 映像提取文件,如以下示例所示:
$ wget --private-key=client-key --certificate=client-certificate \ --ca-certificate=server-CA-certificate \ http://AI-server-address:5555/path-to-file-in-image