Sun N1 System Manager 1.2 管理ガイド

OS プロファイルの配備失敗

『Sun N1 System Manager 1.2 サイト計画の手引き』の第 2 章「Sun N1 System Manager システムとネットワークの準備」では、OS プロビジョニングネットワークを分離することが推奨されています。おもな理由は、ネットワーク上で DHCP が使用されることと、プロビジョニング動作で大きな帯域幅が使用されることです。

DHCP はブロードキャストプロトコルであるため、DHCP サーバー間でネットワークの衝突が発生する可能性があります。プロビジョニングネットワークでは、OS 監視も実行されます。大規模な構成では、OS 監視によって大量のネットワーク帯域幅が使用されることがあります。

管理ネットワークでは、ハードウェア監視および管理機能を運用することも推奨します。ただし、業務上のニーズからネットワークを均一なものとする必要があり、DHCP と上記の帯域幅に関する事項に対応するようネットワークを設定できる場合は、サイトでネットワークを分離する必要はありません。

次のいずれかの状態では、OS プロファイル配備できないか、配備を完了できません。

障害の解決のために、次の図を使用してください。この図は、プロビジョニング操作を開始する際に行う手順を示しています。この手順を行うことによって効率的に配備の問題を解決できます。

この図は、プロビジョニング操作を開始する際に行う手順を示しています。

ProcedureSun Fire V40z または SPARC v440 サーバー用にデフォルトの Solaris OS プロファイルを変更する

ここでは、デフォルトで作成されている Solaris OS プロファイルを変更する手順を説明しています。Sun Fire V40z または SPARC v440 サーバーにデフォルトの Solaris OS プロファイルを正しくインストールするには、次の変更が必要です。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. デフォルトプロファイルのコピーを作成します。


    N1-ok> create osprofile sol10v40z clone sol10
    
  3. ルートパーティションを削除します。


    N1-ok> remove osprofile sol10v40z partition /
    
  4. スワップパーティションを削除します。


    N1-ok> remove osprofile sol10v40z partition swap
    
  5. 新しいルートパーティションを追加します。


    N1-ok> add osprofile sol10v40z partition / device c1t0d0s0 sizeoption free\
     type ufs
    
  6. 新しいスワップパーティションを追加します。


    N1-ok> add osprofile sol10v40z partition swap device c1t0d0s1 size 2000\
     type swap sizeoption fixed
    
参照

変更した OS プロファイルのロード方法については、「サーバーまたはサーバーグループに OS プロファイルをロードする」を参照してください。

ProcedureSun Fire V20z サーバー (K2.0 マザーボード) 用に Solaris 9 OS プロファイルを変更する

ここでは、スクリプトを作成して Solaris OS プロファイルに追加する方法を説明します。このスクリプトは、K2.0 マザーボードを持つ Sun Fire V20z サーバー上の Ethernet インタフェースを Solaris 9 x86 で認識するために必要な、Broadcom 5704 NIC ドライバをインストールします。Sun Fire V20z サーバーの初期バージョンでは、K1.0 マザーボードが使用されています。最近のバージョンでは、K2.0 マザーボードが使用されています。


注 –

このパッチは、K2.0 マザーボードに必要なものですが、K1.0 マザーボードに対して使用しても悪影響はありません。


手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    % /opt/sun/n1gc/bin/n1sh show os
    

    使用可能な OS ディストリビューションの一覧が表示されます。

  3. Solaris 9 ディストリビューションの ID を書き留めておきます。

    次のステップで、この ID (実際には DISTRO_ID) を使用します。

  4. 次のコマンドを入力します。


    # mkdir /js/DISTRO_ID/patch
    

    ここで、distro_id は前のステップで書き留めた ID です。Solaris 9 ディストリビューション用にパッチディレクトリが作成されます。

  5. http://sunsolve.sun.com から /js/DISTRO_ID/patch ディレクトリにパッチ 116666-04 をダウンロードします。

  6. /js/DISTRO_ID/patch ディレクトリに移動します。


    # cd /js/DISTRO_ID/patch
    
  7. パッチファイルを展開します。


    # unzip 116666-04.zip
    
  8. 次のコマンドを入力します。


    # mkdir /js/scripts
    
  9. /js/scripts ディレクトリに、次の 3 行を含む patch_sol9_k2.sh という名前のスクリプトを作成します。


    #!/bin/sh
    echo "Adding patch for bge devices."
    patchadd -R /a -M /cdrom/patch 116666-04

    注 –

    スクリプトが実行可能ファイルであることを確認します。chmod 775 patch_sol9_k2.sh コマンドを使用します。


  10. Solaris 9 OS プロファイルにスクリプトを追加します。


    N1-ok> add osprofile osprofile script /js/scripts/patch_sol9_k2.sh type post 
    

例 6–1 Solaris OS プロファイルへのスクリプトの追加

この例は、OS プロファイルにスクリプトを追加する方法を示しています。type 属性には、スクリプトをインストールのあとで実行することが指定されています。


N1-ok> add osprofile sol9K2 script /js/scripts/patch_sol9_k2.sh\ 
type post

次の手順

変更した Solaris OS プロファイルをロードするには、「サーバーまたはサーバーグループに OS プロファイルをロードする」を参照してください。

Solaris の配備ジョブのタイムアウトまたは停止

Solaris OS プロファイルをロードしようとして、「OS の配備」ジョブがタイムアウトまたは停止した場合は、ジョブの詳細で出力をチェックして対象のサーバーの PXE ブートが完了していることを確認します。次に例を示します。


PXE-M0F: Exiting Broadcom PXE ROM.
      Broadcom UNDI PXE-2.1 v7.5.14
     Copyright (C) 2000-2004 Broadcom Corporation
     Copyright (C) 1997-2000 Intel Corporation
     All rights reserved.      
CLIENT MAC ADDR: 00 09 3D 00 A5 FC  GUID: 68D3BE2E 6D5D 11D8 BA9A 0060B0B36963
     DHCP.

PXE ブートに失敗している場合は、N1 System Manager による管理サーバーの /etc/dhcpd.conf ファイルの設定が正しくありません。


注 –

最良の診断方法は、対象のマシンのコンソールウィンドウを開き、配備を実行することです。「サーバーのシリアルコンソールを開く」を参照してください。


/etc/dhcpd.conf ファイルが正しく設定されていないことが疑われる場合は、次の手順で設定を変更してください。

Procedureネットワークインタフェース構成を変更する

手順
  1. root として管理サーバーにログインします。

  2. dhcpd.conf のエラーを調べます。


    # vi /etc/dhcpd.conf
    
  3. エラーがある場合は修正する必要があります。次のコマンドを実行します。


    # /usr/bin/n1smconfig
    

    n1smconfig ユーティリティーが表示されます。

  4. プロビジョニングネットワークインタフェースの構成を変更します。

    詳細は、『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「N1 System Manager システムの設定」を参照してください。

  5. 対象のサーバーで OS プロファルをロードします。

Solaris OS プロファイルのインストールの失敗

コアシステムサポートディストリビューショングループのみをインストールする OS プロファイルは、正常にロードできません。distributiongroup パラメータの値として “Entire Distribution plus OEM Support” を指定してください。これによって、必要な SSH のバージョン、および N1 System Manager によって管理するサーバーに必要なそのほかのツール をインストールするようにプロファイルを構成します。

無効な管理サーバーネットマスク

Solaris 10 の配備中に、対象のサーバーが DHCP 情報にアクセスできない、または管理サーバーのディストリビューションディレクトリをマウントできない場合は、無効なネットマスクによってネットワークに問題があることが考えられます。コンソールに、次に類似する出力がみられます。


Booting kernel/unix...
  krtld: Unused kernel arguments: `install'.
  SunOS? Release 5.10 Version Generic 32-bit
  Copyright 1983-2005 Sun Microsystems, Inc.  All rights reserved.
  Use is subject to license terms.
  Unsupported Tavor FW version: expected: 0003.0001.0000, actual: 0002.0000.0000
  NOTICE: tavor0: driver attached (for maintenance mode only)
  Configuring devices.
  Using DHCP for network configuration information.
  Beginning system identification...
  Searching for configuration file(s)...
  Using sysid configuration file /sysidcfg
  Search complete.
  Discovering additional network configuration...
  Completing system identification...
  Starting remote procedure call (RPC) services: done.
  System identification complete.
  Starting Solaris installation program...
  Searching for JumpStart directory...
  /sbin/dhcpinfo: primary interface requested but no primary interface is set
  not found
  Warning: Could not find matching rule in rules.ok
  Press the return key for an interactive Solaris install program...

この問題を解決するには、管理サーバーのネットマスク値を 255.255.255.0 に設定します。『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「N1 System Manager システムを設定する」を参照してください。

Linux の配備の停止

Linux OS を配備していて、配備が停止する場合は、対象のサーバーのコンソールをチェックしてインストーラが双方向モードになっているかどうかを確認します。インストーラが双方向モードになっている場合は、管理サーバーから対象のサーバーへのデータ送信の遅延が原因で、配備がタイムアウトしています。この遅延は、通常、2 つのマシンを接続しているスイッチ (複数の場合もある) のスパニングツリーが有効になっているために起こります。スイッチのスパニングツリーをオフにするか、管理サーバーに接続されているポートと対象サーバーに接続されているポートのスパニングツリーを無効にしてください。

スパニングツリーがすでに無効になっていて OS の配備が停止する場合は、ネットワークに問題があると考えられます。


注 –

一部のネットワーク設定で Red Hat をインストールするには、スパニングツリーを有効にする必要があります。


Red Hat OS プロファイルの配備の失敗

N1 System Manager で Red Hat OS プロファイルを構築するには、さらなる分析を行わないと失敗することがあります。カスタム OS プロファイルで問題がある場合は、問題の配備が有効な状態のまま、次の手順を実行します。

  1. root として管理サーバーにログインします。

  2. 次のスクリプトを実行します。


    # cat /var/opt/sun/scs/share/allstart/config/ks*cfg > failed_ks_cfg

failed_ks_cfg ファイルには、カスタマイズしたものを含めてすべての KickStart パラメータが格納されます。設定ファイルで設定したパラメータが、現在のハードウェア構成に合ったものになっていることを確認します。誤りを修正し、配備を再実行します。

V20z または V40z の OS 配備が「internal error」メッセージで失敗

V20z または V40z の OS 配備が失敗し、ジョブ結果に「internal error occurred」メッセージが表示される場合は、プラットフォームのコンソール出力をサービスプロセッサに出力してください。プラットフォームのコンソール出力を簡単にサービスプロセッサに出力できない場合は、サービスプロセッサを再起動します。サービスプロセッサを再起動するには、サービスプロセッサにログオンし、sp reboot コマンドを実行します。

コンソール出力を調べるには、サービスプロセッサにログオンし、 platform console コマンドを実行します。OS 配備中の出力を確認し、問題を解決してください。

Boot Failed エラーの解決のための NFS の再起動


Error: boot: lookup /js/4/Solaris_10/Tools/Boot failed boot: cannot open kernel/sparcv9/unix

対処方法:

このメッセージは、配備している OS によって異なります。「OS のロード」の操作中に、管理サーバーがファイルにアクセスできない場合は、ネットワークに問題があると考えられます。この問題を修正する 1 つの方法として、NFS を再起動することがあげられます。

Solaris システムでは、次のように入力します。


# /etc/init.d/nfs.server stop
# /etc/init.d/nfs.server start

Linux システムでは、次のように入力します。


# /etc/init.d/nfs restart

OS 監視に関連するコマンドの失敗の解決

管理サーバーの古い SSH エントリが原因で、機能の追加に失敗することがあります。add server server-name feature osmonitor agentip コマンドが失敗し、セキュリティー違反がないことが確かな場合は、/root/.ssh/known_hosts ファイル、またはプロビジョニング可能なサーバーに対応するファイル内のエントリを削除します。そのあとで add コマンドを再度実行します。

さらに、基本管理機能を持つサーバーへの OS 監視機能の追加に失敗することがあります。ジョブの出力に次のようなエラーが表示されます。

Repeat attempts for this operation are not allowed.

このエラーは、SSH 資格が以前に提供されていて変更できないことを示しています。このエラーを回避するには、add server feature osmonitor コマンドに agentssh 資格をつけないで実行してください。手順については、「OS 監視機能を追加する」を参照してください。


N1-ok> show job 61
ジョブ ID:     61
日時:         2005-08-16T16:14:27-0400
種類:         Modify OS Monitoring Support
ステータス:      Error (2005-08-16T16:14:38-0400)
コマンド:       add server 192.168.2.10 feature osmonitor agentssh root/rootpasswd
所有者:        root
エラー:        1
警告:         0

ステップ
ID    種類         開始                        Completion                  結果
1     ホスト取得      2005-08-16T16:14:27-0400  2005-08-16T16:14:28-0400    完了
2     コマンドの実行    2005-08-16T16:14:28-0400  2005-08-16T16:14:28-0400    完了
3     ホスト取得      2005-08-16T16:14:29-0400  2005-08-16T16:14:30-0400    完了
4     コマンドの実行    2005-08-16T16:14:30-0400  2005-08-16T16:14:36-0400    エラー

結果
結果 1:
サーバー:       192.168.2.10
ステータス:      -3
メッセージ:      Repeate attempts for this operation are not allowed.

OS 監視エージェントの確認

「OS 監視機能を追加する」の説明に従って OS 監視エージェントをインストールしても、OS 監視データが表示されない場合は、OS 監視機能がインストールされたことを、次のようにして確認してください。