安装 Oracle® Solaris 11.2 系统

退出打印视图

更新时间: 2014 年 7 月
 
 

检查客户机引导错误

未找到引导磁盘

如果在自动化安装过程中未找到引导磁盘,则验证引导磁盘并修改 AI 清单。

  1. 在 SPARC OBP 中或在 x86 BIOS 中显式选择引导设备。

  2. 重新引导系统。

  3. 登录到安装的系统。

  4. 确定要在安装期间使用的设备。可通过 SYS/HDD* 插口名称或 CTD 磁盘名称来确定设备,如 format 命令中所示。

  5. 修改 /system/volatile/ai.xml 清单并替换 "boot_disk" 值。例如:

    <disk_keyword key="SYS/HDD1" name_type="receptacle"/>  
      
    <disk_keyword key="c0t5000CCA012B2A254d0" name_type="ctd"/> 
      
  6. 刷新安装服务。

    # svcadm clear auto-installer 
      

SPARC 网络引导错误和可能的原因

等待 BOOTP/DHCP 应答超时

如果 DHCP 服务器未响应 SPARC 客户机的请求,将显示如下消息:

   ...
   OpenBoot 4.23.4, 8184 MB memory available, Serial #69329298.
   Ethernet address 0:14:4f:21:e1:92, Host ID: 8421e192.
   Rebooting with command: boot net:dhcp - install
   Boot device: /pci@7c0/pci@0/network@4:dhcp  File and args: 
   1000 Mbps FDX Link up
   Timed out waiting for BOOTP/DHCP reply
   Timed out waiting for BOOTP/DHCP reply
   Timed out waiting for BOOTP/DHCP reply
   Timed out waiting for BOOTP/DHCP reply

此超时消息意味着客户机发出了 DHCP 请求,但没有针对该请求的响应。此错误可能是由于 DHCP 配置问题而导致的。检查是否在 DHCP 服务器中正确配置了您的客户机。

引导装入失败

如果 AI 客户机开始下载 boot_archive,但失败并出现 "Boot load failed" 错误,那么意味着客户机的 DHCP 信息配置错误。

Rebooting with command: boot net:dhcp - install
   Boot device: /pci@7c0/pci@0/network@4:dhcp  File and args: 
   1000 Mbps FDX Link up
   HTTP: Bad Response: 500 Internal Server Error
   Evaluating: 

   Boot load failed

如果有另一个 DHCP 服务器响应了该客户机,就会发生此错误。检查此客户机的 DHCP 配置。如果配置看上去没有错误,那么应确定子网中是否存在另一个 DHCP 服务器。

内部服务器错误或 WAN Boot 警报

    在 AI 客户机获取了 IP 地址和初始参数并开始下载引导归档文件后,客户机可能无法找到或下载 boot_archive

  • 如果客户机找不到 boot_archive,那么会显示以下错误:

    Rebooting with command: boot net:dhcp - install
          Boot device: /pci@7c0/pci@0/network@4:dhcp  File and args: 
          1000 Mbps FDX Link up
          <time unavailable> wanboot info: WAN boot messages->console
          <time unavailable> wanboot info: Starting DHCP configuration
          <time unavailable> wanboot info: DHCP configuration succeeded
          <time unavailable> wanboot progress: wanbootfs: Read 366 of 366 kB (100%)
          <time unavailable> wanboot info: wanbootfs: Download complete
          Mon Aug  5 20:46:43 wanboot alert: miniinfo: Request returned code 500
          Mon Aug  5 20:46:44 wanboot alert: Internal Server Error \
    (root filesystem image missing)
  • 如果 AI 客户机找到了 boot_archive 文件,但无法访问该文件,那么会显示以下错误:

    Rebooting with command: boot net:dhcp - install
          Boot device: /pci@7c0/pci@0/network@4:dhcp  File and args: 
          1000 Mbps FDX Link up
          <time unavailable> wanboot info: WAN boot messages->console
          <time unavailable> wanboot info: Starting DHCP configuration
          <time unavailable> wanboot info: DHCP configuration succeeded
          <time unavailable> wanboot progress: wanbootfs: Read 366 of 366 kB (100%)
          <time unavailable> wanboot info: wanbootfs: Download complete
          Mon Aug  5 20:53:02 wanboot alert: miniroot: Request returned code 403
          Mon Aug  5 20:53:03 wanboot alert: Forbidden

对于这两种问题,都应修复为该客户机配置的 boot_archive 文件。检查位于 $IMAGE/boot/boot_archiveboot_archive 的路径名和权限。

ERROR 403: ForbiddenERROR 404: Not Found

如果 AI 客户机成功下载 boot_archive 并引导 Oracle Solaris 内核,但无法获取映像归档文件之一,则显示消息 ERROR 403: ForbiddenERROR 404: Not Found。将显示一个指示是哪个文件导致此问题的错误消息。例如,在 SPARC 客户机的以下输出中,solaris.zlib 文件在指定的位置不存在或无法访问:

<time unavailable> wanboot info: Starting DHCP configuration
<time unavailable> wanboot info: DHCP configuration succeeded
<time unavailable> wanboot progress: wanbootfs: Read 368 of 368 kB (100%)
<time unavailable> wanboot info: wanbootfs: Download complete
Mon May  5 18:57:36 wanboot progress: miniroot: Read 235737 of 235737 kB (100%)
Mon May  5 18:57:36 wanboot info: miniroot: Download complete
SunOS Release 5.11 Version 11.2 64-bit
Copyright (c) 1983, 2014, Oracle and/or its affiliates. All rights reserved.
Remounting root read/write
Probing for device nodes ...
Preparing network image for use
Downloading solaris.zlib
--2014-05-05 18:52:30--  http://10.134.125.136:5555/export/auto_install/11_2_sparc/solaris.zlib
Connecting to 10.134.125.136:5555... connected.
HTTP request sent, awaiting response... 404 Not Found
2014-05-05 18:52:30 ERROR 404: Not Found.

Could not obtain http://10.134.125.136:5555/export/auto_install/11_2_sparc/solaris.zlib from install server
Please verify that the install server is correctly configured and reachable from the client

    此问题可能是由于下列情况之一所导致的:

  • WAN Boot 中配置的映像路径不正确。

  • 映像路径不存在或者不完整。

  • 由于权限问题,访问被拒绝。

检查 DHCP 配置或者您在运行 installadm create-service 时指定的网络映像的内容。检查 WAN Boot 配置。

自动化安装程序未启动

在客户机系统上安装 Oracle Solaris OS 时,需要在引导时按以下方式包括 install 参数,以便启动安装:

ok boot net:dhcp - install

如果在未使用 install 引导参数的情况下进行引导,SPARC 客户机会引导到自动化安装程序引导映像,但不会启动安装。有关如何从此刻启动自动安装的说明,请参见从命令行启动自动化安装

HMAC 值无效

    如果引导 SPARC AI 客户机后不久即在 SPARC 控制台上看到消息 Invalid HMAC value,并且系统返回到 ok 提示符,则导致该问题的原因可能是以下几种情况之一:

  • 该 AI 客户机由验证机制提供保护,但是您未设置 OBP 密钥。解决方法是在客户机固件中设置 OBP 密钥。有关验证的信息,请参见提高自动化安装的安全性。有关设置 OBP 密钥的信息,请参见使用安全下载安装 SPARC 客户机

  • 该 AI 客户机未受保护,但是已设置 OBP 密钥。解决方法是取消客户机固件中 OBP 密钥的设置。请参见重置散列密钥和加密密钥

  • 客户机的安装服务具有要求客户机验证的策略,但未分配适用于该客户机的凭证。确保具有策略 require-client-auth 的所有客户机服务都有可用凭证。

以下步骤说明了如何识别该问题。

  1. 确认没有为 AI 服务器禁用安全功能。使用 installadm list -sv 查看是否启用了安全功能。

  2. 确认没有为客户机的安装服务禁用安全功能。使用 installadm list -vn <svcname> 查看是否未禁用安全功能。

  3. 如果客户机使用定制凭证,则使用 installadm list -ve <macaddr> 获取固件密钥值。

  4. 如果客户机不是定制客户机,则使用 installadm list -vn default-sparc 查看是否为 default-sparc 服务定义了任何固件密钥。

  5. 使用 installadm list -vn <svcname> 检查客户机服务的策略。

  6. 如果 default-sparc 服务没有凭证,则使用 installadm list -sv 命令查找缺省客户机凭证。如果有缺省客户机凭证,则使用为缺省客户机列出的固件密钥。

  7. 如果没有缺省客户机凭证,则使用 installadm list -vn default-sparc 查看是否已将服务策略设置为 require-server-auth。如果已设置,则使用 installadm list -sv 中为缺省客户机列出的固件密钥。

x86 网络引导错误和可能的原因

未收到 DHCP 或代理 DHCP 供给

如果 DHCP 服务器未响应 x86 客户机的请求,您将看到以下消息:

Intel(R) Boot Agent PXE Base Code (PXE-2.1 build 0.86)
   Copyright(C) 1997-2007, Intel Corporation

   CLIENT MAC ADDR 00 14 4F 29 04 12 GUID FF2000008 FFFF FFFF FFFF 7BDA264F1400
   DHCP......... No DHCP or ProxyDHCP offers were received
   PXE-MOF: Exiting Intel Boot Agent

超时消息意味着客户机发送了 DHCP 请求,但未收到响应。此问题可能是由于 DHCP 配置错误而引起的。检查是否在 DHCP 服务器中正确配置了您的客户机。

TFTP 错误或者系统在 GATEWAY 消息后挂起

    DHCP 服务器在 DHCP 响应中提供 IP 地址和初始引导程序的位置。

  • 如果引导程序不存在,那么 AI 客户机引导将无法继续。将显示以下消息:

    Intel(R) Boot Agent PXE Base Code (PXE-2.1 build 0.86)
         Copyright(C) 1997-2007, Intel Corporation
    
         CLIENT MAC ADDR 00 14 4F 29 04 12 GUID FF2000008 FFFF FFFF FFFF 7BDA264F1400
         CLIENT IP: 10.6.68.29   MASK: 255.255.255.0    DHCP IP:  10.6.68.49
         GATEWAY: 10.6.68.1
         TFTP.
         PXE-T02:    Access Violation
         PXE-E3C: TFTP Error - Access violation
         PXE-MOF: Exiting Intel Boot Agent
  • 如果引导程序存在,但不是正确的程序,那么 AI 客户机将在显示如下消息后挂起:

    Intel(R) Boot Agent PXE Base Code (PXE-2.1 build 0.86)
         Copyright(C) 1997-2007, Intel Corporation
    
         CLIENT MAC ADDR 00 14 4F 29 04 12 GUID FF2000008 FFFF FFFF FFFF 7BDA264F1400
         CLIENT IP: 10.6.68.29   MASK: 255.255.255.0    DHCP IP:  10.6.68.49
         GATEWAY: 10.6.68.1
在选择 GRUB 菜单项后系统挂起

如果客户机能够执行初始引导,但内核无法引导,那么系统将在用户从 GRUB 菜单中选择某一项后挂起。

在 AI 服务器上,检查此客户机的 grub.cfg 文件或 menu.lst 文件是否指向有效的引导归档文件。在该服务器上,映像的引导目录应当回送挂载到 /etc/netboot 目录下,如用于 installadm list 所示映像路径的 df -k 所生成的以下摘录样例所示:

Filesystem      1K-blocks      Used Available Use% Mounted on
/export/auto_install/solaris11_2-i386
                 92052473  36629085  55423388  40% /etc/netboot/default-i386
/export/auto_install/solaris11_2-i386
                 92052473  36629085  55423388  40% /etc/netboot/solaris11_2-i386
所发送的 HTTP 请求导致 403 Forbidden 或 404 Not Found

在 AI 服务器上,如果某个安装程序在 /etc/netboot 下的 grub.cfg 文件或 menu.lst 文件中所指定的位置不可访问或不存在,则客户机能够引导,但无法下载该文件。将显示一个指示是哪个文件导致此问题的错误消息。例如,在 x86 客户机上的以下输出中,solaris.zlib 文件在指定的位置不存在:

SunOS Release 5.11 Version 11.2 64-bit
Copyright (c) 1983, 2012, Oracle and/or its affiliates. All rights reserved.
Remounting root read/write
Probing for device nodes ...
Preparing network image for use
Downloading solaris.zlib
--2015-05-05 20:02:26--  http://10.134.125.136:5555/export/auto_install/solaris11_2-i386/solaris.zlib
Connecting to 10.134.125.136:5555... connected.
HTTP request sent, awaiting response... 404 Not Found
2015-05-05 20:02:26 ERROR 404: Not Found.

Could not obtain http://10.134.125.136:5555/export/auto_install/solaris11_2-i386/solaris.zlib from install server
Please verify that the install server is correctly configured and reachable from the client

Requesting System Maintenance Mode
(See /lib/svc/share/README for more information.)
Console login service(s) cannot run

检查您在运行 installadm create-service 命令时所指定的目标目录的内容。

自动化安装程序未启动

对于通过网络进行引导的安装,在 x86 客户机系统上安装 Oracle Solaris OS 时,您必须选择 GRUB 引导菜单中的第二项以启动自动化安装。通常,菜单项如下所示:

Oracle Solaris 11.2 Text Installer and command line
Oracle Solaris 11.2 Automated Install

如果选择了第一个 GRUB 菜单项或允许超时提示,那么系统将引导到自动化安装引导映像,但是不会启动安装。有关如何从此刻启动自动安装的说明,请参见从命令行启动自动化安装

SPARC 和 x86 错误消息

Automated Installation Failed 消息

如果安装期间发生失败,那么会显示以下消息:

21:43:34    Automated Installation Failed.  See install log at /system/volatile/install_log
Automated Installation failed
Please refer to the /system/volatile/install_log file for details
Jul  6 21:43:34 solaris svc.startd[9]: application/auto-installer:default failed fatally:
transitioned to maintenance (see 'svcs -xv' for details)
IPS 服务器不可用

为了安装 Oracle Solaris OS,安装客户机需要访问 AI 清单中定义的 IPS 软件包系统信息库。如果客户机无法访问软件包系统信息库,安装将失败,并且 application/auto-installer 服务将转换到维护状态。以下输出是有关控制台上显示内容的示例:

15:54:46    Creating IPS image
15:54:46    Error occurred during execution of 'generated-transfer-1341-1' checkpoint.
15:54:47    Failed Checkpoints:
15:54:47
15:54:47        generated-transfer-1341-1
15:54:47
15:54:47    Checkpoint execution error:
15:54:47
15:54:47        Framework error: code: 6 reason: Couldn't resolve host 'pkg.example.com'
15:54:47        URL: 'http://pkg.example.com/solaris/release/versions/0/'.
15:54:47
15:54:47    Automated Installation Failed.  See install log at /system/volatile/install_log
Automated Installation failed
Please refer to the /system/volatile/install_log file for details
Aug 21 15:54:47 line2-v445 svc.startd[8]: application/auto-installer:default failed fatally:
transitioned to maintenance (see 'svcs -xv' for details)
...
SUNW-MSG-ID: SMF-8000-YX, TYPE: defect, VER: 1, SEVERITY: major
EVENT-TIME: Wed Aug 21 15:54:47 UTC 2013
PLATFORM: SUNW,Sun-Fire-V445, CSN: -, HOSTNAME: line2-v445
SOURCE: software-diagnosis, REV: 0.1
EVENT-ID: c8a5b809-ece4-4399-9646-d8c64d78aac7
DESC: A service failed - a start, stop or refresh method failed.
AUTO-RESPONSE: The service has been placed into the maintenance state.
IMPACT: svc:/application/auto-installer:default is unavailable.
REC-ACTION: Run 'svcs -xv svc:/application/auto-installer:default' to determine the generic reason
why the service failed, the location of any logfiles, and a list of other services impacted. Please
refer to the associated reference document at http://support.oracle.com/msg/SMF-8000-YX for the latest service
procedures and policies regarding this diagnosis.

检查 /system/volatile/install_log 文件中是否存在如下消息:

TransportFailures: Framework error: code: 6 reason: Couldn't resolve host
'pkg.example.com'
URL: 'http://pkg.example.com/solaris/versions/0/'
TransportFailures: Framework error: code: 7 reason: Failed connect to
pkg.example.com:80; Connection refused
URL: 'http://pkg.example.com/solaris/versions/0/'
TransportFailures: http protocol error: code: 404 reason: Not Found
URL: 'http://pkg.oracle.com/mysolaris/versions/0/'

    根据所看到的消息,尝试以下可能的补救措施:

  • 尝试从发生故障的客户机系统访问软件包服务器,例如通过使用 ping

  • 如果使用的是 DNS,请检查 AI 客户机上的 DNS 是否正确配置。请参见检查 DNS

  • 如果使用的是本地系统信息库,请检查是否已将该系统信息库设为可供所有客户机访问。请参见在 Oracle Solaris 11.2 中复制和创建软件包系统信息库 中的第 3  章 提供对系统信息库的访问

  • 确保 AI 清单中的 URI 不存在排字错误。

  • 使用命令(如以下命令)检查软件包系统信息库是否有效:

    $ pkg list -g http://pkg.example.com/solaris/ entire

    您可能需要刷新目录或重新生成索引。

找不到软件包

如果不能在 IPS 系统信息库中找到 AI 清单中指定的某个软件包,那么安装程序将会失败,从而无法在磁盘上安装任何软件包。在以下示例中,安装程序在 IPS 系统信息库中找不到软件包 mypkg。以下输出是有关控制台上显示内容的示例:

14:04:02    Failed Checkpoints:
14:04:02
14:04:02        generated-transfer-1230-1
14:04:02
14:04:02    Checkpoint execution error:
14:04:02
14:04:02        The following pattern(s) did not match any allowable packages.  Try
14:04:02        using a different matching pattern, or refreshing publisher information:
14:04:02
14:04:02                pkg:/mypkg
14:04:02
14:04:02    Automated Installation Failed.  See install log at /system/volatile/install_log

以下输出是 /system/volatile/install_log 日志文件部分内容的示例:

PlanCreationException: The following pattern(s) did not match any allowable packages.
Try using a different matching pattern, or refreshing publisher information:

pkg:/mypkg

检查所提到的软件包是否是有效的软件包。如果可从其他 IPS 系统信息库获取此软件包,请通过将另一个 publisher 元素添加到 source 元素来在 AI 清单中添加该 IPS 系统信息库。

受保护的客户机上的引导错误

引导 AI 客户机时,如果出现与以下内容类似的消息,则表示 TLS 证书尚未生效:

SSL3_GET_RECORD:wrong version number - secure HTTPS GET REQUEST to unsecured HTTP port

此问题的原因可能是,客户机上的系统时间在证书的生成时间之前。检查客户机上的系统时间。有关如何生成和分配安全凭证的信息,请参见提高自动化安装的安全性

与安全相关的 AI 失败

    如果您已按提高自动化安装的安全性中的说明对 AI 服务器和客户机实施了保护,并且在引导或安装这些客户机时遇到问题,请尝试执行以下步骤来检查验证错误:

  • 检查客户机上 /var/ai/image-server/logs/ 中的 Apache access_logerror_log

  • 登录到 AI 客户机的控制台。检查 /system/volatile/ 中的 /tmp/install_log 文件和 SMF 服务日志。

  • 如果在引导归档文件装入到 AI 客户机后,尝试获取映像文件、AI 清单或系统配置文件时,发生验证失败,则可能是发生了瞬时网络中断。检查 AI 服务器是否正常运行,然后重新启动客户机安装。

  • 尝试使用 openssl s_client 命令测试连接:

    $ openssl s_client -key client-key -cert client-certificate \
    -CAcert server-CA-certificate -connect AI-server-address:port
  • 使用 installadm list -s -v 命令显示 AI 服务器上安全功能的启用或禁用状态。请参见Example 8–40

  • 使用 installadm list -v -n <svcname> 命令检查客户机的服务策略

  • 根据 CA 证书检查分配的凭证。将 –K–C 选项与 installadm list 子命令结合使用以列出分配的密钥和证书。使用字符比较实用程序(如 diff)将这些密钥和证书与预期密钥和证书加以比较。

  • 确保已从客户机上的 /var/ai/ai-webserver/tls.key/server.key 删除口令短语。X.509 私钥文件必须已删除任何口令短语。

  • 尝试使用 wget 命令以及相应密钥、证书和 CA 认证,从 AI 映像提取文件,如以下示例所示:

    $ wget --private-key=client-key --certificate=client-certificate \
    --ca-certificate=server-CA-certificate \
    http://AI-server-address:5555/path-to-file-in-image