Sun N1 System Manager 1.1 管理ガイド

OS プロファイルの配備失敗

次にあげる状態が発生すると、OS プロファイルの配備に失敗する場合があります。

障害の解決のために、次の図を使用してください。この図は、プロビジョニング操作を開始する際に行う手順を示しています。この手順を行うことによって効率的に配備の問題を解決できます。

この図は、プロビジョニング操作を開始する際に行う手順を示しています。

ProcedureSun Fire V40z または SPARC v440 サーバー用にデフォルトの Solaris OS プロファイルを変更する

ここでは、デフォルトで作成されている Solaris OS プロファイルを変更する手順を説明しています。Sun Fire V40z または SPARC v440 サーバーにデフォルトの Solaris OS プロファイルを正しくインストールするには、次の変更が必要です。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. デフォルトプロファイルのコピーを作成します。


    N1-ok> create osprofile sol10v40z clone sol10
    
  3. ルートパーティションを削除します。


    N1-ok> remove osprofile sol10v40z partition /
    
  4. スワップパーティションを削除します。


    N1-ok> remove osprofile sol10v40z partition swap
    
  5. 新しいルートパーティションを追加します。


    N1-ok> add osprofile sol10v40z partition / device c1t0d0s0 sizeoption free
     type ufs
    
  6. 新しいスワップパーティションを追加します。


    N1-ok> add osprofile sol10v40z partition swap device c1t0d0s1 size 2000
     type swap sizeoption fixed
    
参照

変更した OS プロファイルのロード方法については、「サーバーまたはサーバーグループに OS プロファイルをロードする」を参照してください。

ProcedureSun Fire V20z サーバー (K2.0 マザーボード) 用に Solaris 9 OS プロファイルを変更する

ここでは、スクリプトを作成して Solaris OS プロファイルに追加する方法を説明します。このスクリプトは、K2.0 マザーボードを持つ Sun Fire V20z サーバーが、Ethernet インタフェースを認識するために必要な Broadcom 5704 NIC ドライバをインストールします。K1.0 マザーボードは、Sun Fire V20z サーバーの初期バージョンで使用されています。最近のバージョンでは、K2.0 マザーボードが使用されています。


注 –

このパッチは、K2.0 マザーボードに必要なものですが、K1.0 マザーボードに対して使用しても悪影響はありません。


手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    % /opt/sun/n1gc/bin/n1sh show os
    

    使用可能な OS ディストリビューションの一覧が表示されます。Solaris 9 ディストリビューションの名前をメモします。

  3. as_distro.pl スクリプトを実行し、出力を表示します。


    # /scs/sbin/as_distro.pl -l
    
  4. Solaris 9 ディストリビューションの DISTRO_ID を書き留めます。

    この ID は次の手順で使用します。

  5. 次のコマンドを入力します。


    # mkdir /js/DISTRO_ID/patch
    

    Solaris 9 ディストリビューション用にパッチディレクトリが作成されます。

  6. http://sunsolve.sun.com から /js/DISTRO_ID/patch ディレクトリにパッチ 116666-04 をダウンロードします。

  7. /js/ DISTRO_ID/patch ディレクトリに移動します。


    # cd /js/DISTRO_ID/patch
    
  8. パッチファイルを展開します。


    # unzip 116666-04.zip
    
  9. 次のコマンドを入力します。


    # mkdir /js/scripts
    
  10. /js/scripts ディレクトリに、次の 3 行を含む patch_sol9_k2.sh という名前のスクリプトを作成します。


    #!/bin/sh
    echo "Adding patch for bge devices."
    patchadd -R /a -M /cdrom/patch 116666-04

    注 –

    スクリプトが実行可能ファイルであることを確認します。chmod 775 patch_sol9_k2.sh コマンドを使用します。


  11. Solaris 9 OS プロファイルにスクリプトを追加します。


    N1-ok> add osprofile osprofile script /js/scripts/patch_sol9_k2.sh type post 
    

例 6–1 Solaris OS プロファイルへのスクリプトの追加

この例は、OS プロファイルをスクリプトに追加する方法を示しています。type 属性には、スクリプトをインストールのあとで実行することが指定されています。


N1-ok> add osprofile sol9K2 script /js/scripts/patch_sol9_k2.sh 
type post

次の手順

変更した Solaris OS プロファイルをロードするには、「サーバーまたはサーバーグループに OS プロファイルをロードする」を参照してください。

Solaris 配備のジョブのタイムアウトまたは停止

Solaris OS プロファイルをロードしようとしてm「OS の配備」ジョブがタイムアウトまたは停止した場合は、ジョブの詳細で出力をチェックしてターゲットのサーバーの PXE ブートが完了していることを確認します。次に例を示します。


PXE-M0F: Exiting Broadcom PXE ROM.
      Broadcom UNDI PXE-2.1 v7.5.14
     Copyright (C) 2000-2004 Broadcom Corporation
     Copyright (C) 1997-2000 Intel Corporation
     All rights reserved.      
CLIENT MAC ADDR: 00 09 3D 00 A5 FC  GUID: 68D3BE2E 6D5D 11D8 BA9A 0060B0B36963
     DHCP.

PXE ブートに失敗している場合は、N1 System Manager による 管理サーバー の /etc/dhcpd.conf ファイルの設定が正しくありません。


注 –

最良の診断方法は、ターゲットのマシンのコンソールウィンドウを開き、配備を実行することです。「サーバーのシリアルコンソールを開く」を参照してください。


/etc/dhcpd.conf ファイルが正しく設定されていないことが疑われる場合は、次の手順で設定を変更してください。

Procedureネットワークインタフェース構成を変更する

手順
  1. root として 管理サーバー にログインします。

  2. dhcpd.conf のエラーを調べます。


    # vi /etc/dhcpd.conf
    
  3. エラーがある場合は修正する必要があります。次のコマンドを実行します。


    # /usr/bin/n1smconfig
    

    n1smconfig ユーティリティーが表示されます。

  4. プロビジョニングネットワークインタフェースの構成を変更します。

    詳細は、『Sun N1 System Manager 1.1 インストールおよび構成ガイド』「N1 System Manager システムの設定」を参照してください。

  5. ターゲットのサーバーで OS をロードします。

Solaris OS プロファイルのインストールの失敗

OS プロファイルのインストールが Core System Support ディストリビューショングループのみの場合ロードは成功しません。distributiongroup パラメータの値として、“Entire Distribution plus OEM Support” を指定してください。これによって、必要な SSH のバージョン、および N1 System Manager によって管理するサーバーに必要なそのほかのツール をインストールするようにプロファイルを構成します。

無効な管理サーバーネットマスク

Solaris 10 の配備中に、ターゲットのサーバーが DHCP 情報にアクセスできない、または管理サーバーのディストリビューションディレクトリをマウントできない場合は、無効なネットマスクによってネットワークに問題があることが考えられます。コンソールに、次に類似する出力がみられます。


Booting kernel/unix...
  krtld: Unused kernel arguments: `install'.
  SunOS? Release 5.10 Version Generic 32-bit
  Copyright 1983-2005 Sun Microsystems, Inc.  All rights reserved.
  Use is subject to license terms.
  Unsupported Tavor FW version: expected: 0003.0001.0000, actual: 0002.0000.0000
  NOTICE: tavor0: driver attached (for maintenance mode only)
  Configuring devices.
  Using DHCP for network configuration information.
  Beginning system identification...
  Searching for configuration file(s)...
  Using sysid configuration file /sysidcfg
  Search complete.
  Discovering additional network configuration...
  Completing system identification...
  Starting remote procedure call (RPC) services: done.
  System identification complete.
  Starting Solaris installation program...
  Searching for JumpStart directory...
  /sbin/dhcpinfo: primary interface requested but no primary interface is set
  not found
  Warning: Could not find matching rule in rules.ok
  Press the return key for an interactive Solaris install program...

この問題を修正するには、管理サーバーのネットマスク値を 255.255.255.0 に設定します。『Sun N1 System Manager 1.1 インストールおよび構成ガイド』「Sun N1 System Manager システムを設定する」を参照してください。

Linux の配備の停止

Linux OS を配備していて、配備が停止する場合は、ターゲットのサーバーのコンソールをチェックしてインストーラが双方向モードになっているかどうかを確認します。インストーラが双方向モードになっている場合は、管理サーバー からターゲットのサーバーへのデータの送信の遅延が原因でタイムアウトしています。この遅延は、通常、2 つのマシンを接続しているスイッチ (複数の場合もある) の spanning tree が有効になっているために起こります。スイッチの spanning tree をオフにするか、管理サーバー とターゲットのサーバーを接続するポートの spanning tree を無効にしてください。

spanning tree がすでに無効になっていて OS の配備が停止する場合は、ネットワークに問題があると考えられます。

Boot Failed エラーの解決のための NFS の再起動


Error: boot: lookup /js/4/Solaris_10/Tools/Boot failed boot: cannot open kernel/sparcv9/unix

対処方法:

このメッセージは、配備している OS によって異なります。「OS のロード」の操作中に、管理サーバーがファイルにアクセスできない場合は、ネットワークに問題があると考えられます。この問題を修正する 1 つの方法として、NFS を再起動することがあげられます。

Solaris システムでは、次のように入力します。


# /etc/init.d/nfs.server stop
# /etc/init.d/nfs.server start

Linux システムでは、次のように入力します。


# /etc/init.d/nfs restart

OS 監視に関連する wget コマンドの失敗の解決

add server feature osmonitor agentip に失敗し、次のエラーが表示される場合は、 wget 情報を手動でインストールする必要があります。 Internal error: wget command failed: /usr/bin/wget —0 /tmp/hostinstall.pl http://xx.xx.xx.xx/pub/hostinstall.pl (xx.xx.xx.xx は問題のマシンの IP アドレス)。

管理サーバーの古い SSH エントリが原因で、機能の追加に失敗する場合があります。add server server-name feature osmonitor agentip コマンドが失敗し、セキュリティ違反がないことが確かな場合は、/root/.ssh/known_hosts ファイル、またはプロビジョニング可能なサーバーに対応するファイル内のエントリを削除します。そのあとで add コマンドを再度実行します

さらに、基本管理機能を持つサーバーへの OS 監視機能の追加に失敗することがありますジョブの出力に次のようなエラーが表示されます。Repeat attempts for this operation are not allowed. このエラーは、SSH 資格が以前に提供されていて変更できないことを示しています。このエラーを回避するには、add server feature osmonitor コマンドに agentssh 資格をつけないで発行してください。手順については、「OS 監視機能を追加する」を参照してください。


N1-ok> show job 61
Job ID: 61
Date: 2005-08-16T16:14:27-0400
Type: Modify OS Monitoring Support
Status: Error (2005-08-16T16:14:38-0400)
Owner: root
Errors: 1
Warnings: 0

Steps
ID Type Start Completion Result
1 Acquire Host 2005-08-16T16:14:27-0400 2005-08-16T16:14:28-0400 Completed
2 Run Command 2005-08-16T16:14:28-0400 2005-08-16T16:14:28-0400 Completed
3 Acquire Host 2005-08-16T16:14:29-0400 2005-08-16T16:14:30-0400 Completed
4 Run Command 2005-08-16T16:14:30-0400 2005-08-16T16:14:36-0400 Error

Results
Result 1:
Server: 192.168.2.10
Status: -3
Message: Repeate attempts for this operation are not allowed.