『Sun N1 System Manager 1.2 サイト計画の手引き』の第 2 章「Sun N1 System Manager システムとネットワークの準備」では、OS プロビジョニングネットワークを分離することが推奨されています。おもな理由は、ネットワーク上で DHCP が使用されることと、プロビジョニング動作で大きな帯域幅が使用されることです。
DHCP はブロードキャストプロトコルであるため、DHCP サーバー間でネットワークの衝突が発生する可能性があります。プロビジョニングネットワークでは、OS 監視も実行されます。大規模な構成では、OS 監視によって大量のネットワーク帯域幅が使用されることがあります。
管理ネットワークでは、ハードウェア監視および管理機能を運用することも推奨します。ただし、業務上のニーズからネットワークを均一なものとする必要があり、DHCP と上記の帯域幅に関する事項に対応するようネットワークを設定できる場合は、サイトでネットワークを分離する必要はありません。
次のいずれかの状態では、OS プロファイル配備できないか、配備を完了できません。
Sun Fire V40z または SPARC V440 サーバーに適したパーティションの変更が行われていない。「Sun Fire V40z または SPARC v440 サーバー用にデフォルトの Solaris OS プロファイルを変更する」を参照してください。
Sun Fire V20z サーバー上で、Ethernet インタフェースを認識するのに必要なドライバをインストールするようにスクリプトが変更されていない。「Sun Fire V20z サーバー (K2.0 マザーボード) 用に Solaris 9 OS プロファイルを変更する」を参照してください。
DHCP が正しく構成されていない。「Solaris の配備ジョブのタイムアウトまたは停止」を参照してください。
OS プロファイルが、コアシステムサポートディストリビューショングループのみをインストールする。「Solaris OS プロファイルのインストールの失敗」を参照してください。
対象のサーバーが DHCP 情報にアクセスできないか、またはディストリビューションのディレクトリをマウントできない。「無効な管理サーバーネットマスク」を参照してください。
管理サーバーが、「OS のロード」操作中にファイルにアクセスできない。「Boot Failed エラーの解決のための NFS の再起動」を参照してください。
Linux の配備が停止している。「Linux の配備の停止」を参照してください。
Red Hat の配備に失敗している。「Red Hat OS プロファイルの配備の失敗」を参照してください。
障害の解決のために、次の図を使用してください。この図は、プロビジョニング操作を開始する際に行う手順を示しています。この手順を行うことによって効率的に配備の問題を解決できます。
ここでは、デフォルトで作成されている Solaris OS プロファイルを変更する手順を説明しています。Sun Fire V40z または SPARC v440 サーバーにデフォルトの Solaris OS プロファイルを正しくインストールするには、次の変更が必要です。
N1 System Manager にログインします。
詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。
デフォルトプロファイルのコピーを作成します。
N1-ok> create osprofile sol10v40z clone sol10 |
ルートパーティションを削除します。
N1-ok> remove osprofile sol10v40z partition / |
スワップパーティションを削除します。
N1-ok> remove osprofile sol10v40z partition swap |
新しいルートパーティションを追加します。
N1-ok> add osprofile sol10v40z partition / device c1t0d0s0 sizeoption free\ type ufs |
新しいスワップパーティションを追加します。
N1-ok> add osprofile sol10v40z partition swap device c1t0d0s1 size 2000\ type swap sizeoption fixed |
変更した OS プロファイルのロード方法については、「サーバーまたはサーバーグループに OS プロファイルをロードする」を参照してください。
ここでは、スクリプトを作成して Solaris OS プロファイルに追加する方法を説明します。このスクリプトは、K2.0 マザーボードを持つ Sun Fire V20z サーバー上の Ethernet インタフェースを Solaris 9 x86 で認識するために必要な、Broadcom 5704 NIC ドライバをインストールします。Sun Fire V20z サーバーの初期バージョンでは、K1.0 マザーボードが使用されています。最近のバージョンでは、K2.0 マザーボードが使用されています。
このパッチは、K2.0 マザーボードに必要なものですが、K1.0 マザーボードに対して使用しても悪影響はありません。
N1 System Manager にログインします。
詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。
次のコマンドを入力します。
% /opt/sun/n1gc/bin/n1sh show os |
使用可能な OS ディストリビューションの一覧が表示されます。
Solaris 9 ディストリビューションの ID を書き留めておきます。
次のステップで、この ID (実際には DISTRO_ID) を使用します。
次のコマンドを入力します。
# mkdir /js/DISTRO_ID/patch |
ここで、distro_id は前のステップで書き留めた ID です。Solaris 9 ディストリビューション用にパッチディレクトリが作成されます。
http://sunsolve.sun.com から /js/DISTRO_ID/patch ディレクトリにパッチ 116666-04 をダウンロードします。
/js/DISTRO_ID/patch ディレクトリに移動します。
# cd /js/DISTRO_ID/patch |
パッチファイルを展開します。
# unzip 116666-04.zip |
次のコマンドを入力します。
# mkdir /js/scripts |
/js/scripts ディレクトリに、次の 3 行を含む patch_sol9_k2.sh という名前のスクリプトを作成します。
#!/bin/sh echo "Adding patch for bge devices." patchadd -R /a -M /cdrom/patch 116666-04 |
スクリプトが実行可能ファイルであることを確認します。chmod 775 patch_sol9_k2.sh コマンドを使用します。
Solaris 9 OS プロファイルにスクリプトを追加します。
N1-ok> add osprofile osprofile script /js/scripts/patch_sol9_k2.sh type post |
この例は、OS プロファイルにスクリプトを追加する方法を示しています。type 属性には、スクリプトをインストールのあとで実行することが指定されています。
N1-ok> add osprofile sol9K2 script /js/scripts/patch_sol9_k2.sh\ type post |
変更した Solaris OS プロファイルをロードするには、「サーバーまたはサーバーグループに OS プロファイルをロードする」を参照してください。
Solaris OS プロファイルをロードしようとして、「OS の配備」ジョブがタイムアウトまたは停止した場合は、ジョブの詳細で出力をチェックして対象のサーバーの PXE ブートが完了していることを確認します。次に例を示します。
PXE-M0F: Exiting Broadcom PXE ROM. Broadcom UNDI PXE-2.1 v7.5.14 Copyright (C) 2000-2004 Broadcom Corporation Copyright (C) 1997-2000 Intel Corporation All rights reserved. CLIENT MAC ADDR: 00 09 3D 00 A5 FC GUID: 68D3BE2E 6D5D 11D8 BA9A 0060B0B36963 DHCP. |
PXE ブートに失敗している場合は、N1 System Manager による管理サーバーの /etc/dhcpd.conf ファイルの設定が正しくありません。
最良の診断方法は、対象のマシンのコンソールウィンドウを開き、配備を実行することです。「サーバーのシリアルコンソールを開く」を参照してください。
/etc/dhcpd.conf ファイルが正しく設定されていないことが疑われる場合は、次の手順で設定を変更してください。
root として管理サーバーにログインします。
dhcpd.conf のエラーを調べます。
# vi /etc/dhcpd.conf |
エラーがある場合は修正する必要があります。次のコマンドを実行します。
# /usr/bin/n1smconfig |
n1smconfig ユーティリティーが表示されます。
プロビジョニングネットワークインタフェースの構成を変更します。
詳細は、『Sun N1 System Manager 1.2 インストールおよび構成ガイド』の「N1 System Manager システムの設定」を参照してください。
対象のサーバーで OS プロファルをロードします。
コアシステムサポートディストリビューショングループのみをインストールする OS プロファイルは、正常にロードできません。distributiongroup パラメータの値として “Entire Distribution plus OEM Support” を指定してください。これによって、必要な SSH のバージョン、および N1 System Manager によって管理するサーバーに必要なそのほかのツール をインストールするようにプロファイルを構成します。
Solaris 10 の配備中に、対象のサーバーが DHCP 情報にアクセスできない、または管理サーバーのディストリビューションディレクトリをマウントできない場合は、無効なネットマスクによってネットワークに問題があることが考えられます。コンソールに、次に類似する出力がみられます。
Booting kernel/unix... krtld: Unused kernel arguments: `install'. SunOS? Release 5.10 Version Generic 32-bit Copyright 1983-2005 Sun Microsystems, Inc. All rights reserved. Use is subject to license terms. Unsupported Tavor FW version: expected: 0003.0001.0000, actual: 0002.0000.0000 NOTICE: tavor0: driver attached (for maintenance mode only) Configuring devices. Using DHCP for network configuration information. Beginning system identification... Searching for configuration file(s)... Using sysid configuration file /sysidcfg Search complete. Discovering additional network configuration... Completing system identification... Starting remote procedure call (RPC) services: done. System identification complete. Starting Solaris installation program... Searching for JumpStart directory... /sbin/dhcpinfo: primary interface requested but no primary interface is set not found Warning: Could not find matching rule in rules.ok Press the return key for an interactive Solaris install program... |
この問題を解決するには、管理サーバーのネットマスク値を 255.255.255.0 に設定します。『Sun N1 System Manager 1.2 インストールおよび構成ガイド』の「N1 System Manager システムを設定する」を参照してください。
Linux OS を配備していて、配備が停止する場合は、対象のサーバーのコンソールをチェックしてインストーラが双方向モードになっているかどうかを確認します。インストーラが双方向モードになっている場合は、管理サーバーから対象のサーバーへのデータ送信の遅延が原因で、配備がタイムアウトしています。この遅延は、通常、2 つのマシンを接続しているスイッチ (複数の場合もある) のスパニングツリーが有効になっているために起こります。スイッチのスパニングツリーをオフにするか、管理サーバーに接続されているポートと対象サーバーに接続されているポートのスパニングツリーを無効にしてください。
スパニングツリーがすでに無効になっていて OS の配備が停止する場合は、ネットワークに問題があると考えられます。
一部のネットワーク設定で Red Hat をインストールするには、スパニングツリーを有効にする必要があります。
N1 System Manager で Red Hat OS プロファイルを構築するには、さらなる分析を行わないと失敗することがあります。カスタム OS プロファイルで問題がある場合は、問題の配備が有効な状態のまま、次の手順を実行します。
root として管理サーバーにログインします。
次のスクリプトを実行します。
# cat /var/opt/sun/scs/share/allstart/config/ks*cfg > failed_ks_cfg |
failed_ks_cfg ファイルには、カスタマイズしたものを含めてすべての KickStart パラメータが格納されます。設定ファイルで設定したパラメータが、現在のハードウェア構成に合ったものになっていることを確認します。誤りを修正し、配備を再実行します。
V20z または V40z の OS 配備が失敗し、ジョブ結果に「internal error occurred」メッセージが表示される場合は、プラットフォームのコンソール出力をサービスプロセッサに出力してください。プラットフォームのコンソール出力を簡単にサービスプロセッサに出力できない場合は、サービスプロセッサを再起動します。サービスプロセッサを再起動するには、サービスプロセッサにログオンし、sp reboot コマンドを実行します。
コンソール出力を調べるには、サービスプロセッサにログオンし、 platform console コマンドを実行します。OS 配備中の出力を確認し、問題を解決してください。
Error: boot: lookup /js/4/Solaris_10/Tools/Boot failed boot: cannot open kernel/sparcv9/unix
対処方法:このメッセージは、配備している OS によって異なります。「OS のロード」の操作中に、管理サーバーがファイルにアクセスできない場合は、ネットワークに問題があると考えられます。この問題を修正する 1 つの方法として、NFS を再起動することがあげられます。
Solaris システムでは、次のように入力します。
# /etc/init.d/nfs.server stop # /etc/init.d/nfs.server start |
Linux システムでは、次のように入力します。
# /etc/init.d/nfs restart |
管理サーバーの古い SSH エントリが原因で、機能の追加に失敗することがあります。add server server-name feature osmonitor agentip コマンドが失敗し、セキュリティー違反がないことが確かな場合は、/root/.ssh/known_hosts ファイル、またはプロビジョニング可能なサーバーに対応するファイル内のエントリを削除します。そのあとで add コマンドを再度実行します。
さらに、基本管理機能を持つサーバーへの OS 監視機能の追加に失敗することがあります。ジョブの出力に次のようなエラーが表示されます。
Repeat attempts for this operation are not allowed.
このエラーは、SSH 資格が以前に提供されていて変更できないことを示しています。このエラーを回避するには、add server feature osmonitor コマンドに agentssh 資格をつけないで実行してください。手順については、「OS 監視機能を追加する」を参照してください。
N1-ok> show job 61 ジョブ ID: 61 日時: 2005-08-16T16:14:27-0400 種類: Modify OS Monitoring Support ステータス: Error (2005-08-16T16:14:38-0400) コマンド: add server 192.168.2.10 feature osmonitor agentssh root/rootpasswd 所有者: root エラー: 1 警告: 0 ステップ ID 種類 開始 Completion 結果 1 ホスト取得 2005-08-16T16:14:27-0400 2005-08-16T16:14:28-0400 完了 2 コマンドの実行 2005-08-16T16:14:28-0400 2005-08-16T16:14:28-0400 完了 3 ホスト取得 2005-08-16T16:14:29-0400 2005-08-16T16:14:30-0400 完了 4 コマンドの実行 2005-08-16T16:14:30-0400 2005-08-16T16:14:36-0400 エラー 結果 結果 1: サーバー: 192.168.2.10 ステータス: -3 メッセージ: Repeate attempts for this operation are not allowed. |
「OS 監視機能を追加する」の説明に従って OS 監視エージェントをインストールしても、OS 監視データが表示されない場合は、OS 監視機能がインストールされたことを、次のようにして確認してください。
OS 監視データが完全に初期化されるまで、5 〜 7 分かかります。CPU アイドルが 0.0% と表示されていると、OS 使用の Failed Critical を引き起こします。OS 監視機能の追加またはアップグレード後、5 〜 7 分以内に、この状態が解消されるはずです。その時点で、show server server コマンドを使用すると、プロビジョニング可能なサーバーから OS 監視データを使用できるようになります。
grep コマンドを使用し、エージェント自身が正常にインストールされたかどうかを調べてください。
Solaris の機能を確認する場合は、次のコマンドを入力します。
# pkginfo |grep n1sm sparc: SUNWn1smsparcag-1-2 solx86: SUNWn1smx86ag-1-2 # ps -ef |grep -i esd root 23817 1 0 19:57:59 ? 0:01 esd - init agent -dir /var/opt/SUNWsymon -q |
Linux の機能を確認する場合は、次のコマンドを入力します。
# rpm -qa | grep n1sm-linux-agent # ps -ef | grep -i esd root 1940 1 0 Jan28 ? 00:00:14 esd - init agent -dir /var/opt/SUNWsymon -q |