機械翻訳について

13.2 Oracle VM Serverのトラブルシューティング

この項では、Oracle VM Serverの使用時に発生する可能性があるいくつかの問題およびその解決方法について説明します。

Oracleサポート・サービスに問合せが必要な場合、この項で説明するログ・ファイルの提供を求められます。 各Oracle VM構成要素の正確なバージョンを提供する必要がある場合もあります。 Oracle VM Managerのバージョンを確認するには、「Help」メニューをクリックし、次に「About」をクリックします。 Oracle VM ServerおよびOracle VM Agentのバージョンを確認するには、Oracle VM Managerユーザー・ガイド制御ドメインのパースペクティブの項を参照してください。

13.2.1 Oracle VM Serverのデバッグ・ツール

仮想マシンの作成に失敗した場合、Oracle VM Serverのログ・ファイルを確認し、コマンドライン・ツールを使用して問題の原因を特定してください。 Oracle VM Serverの問題をトラブルシューティングする際に使用する多くの便利なコマンドライン・ツールや、確認する必要のある重要なディレクトリおよびログ・ファイルがあります。 この項では、これらのツールおよびログ・ファイルについて説明します。

13.2.1.1 Oracle VM Serverのディレクトリ

表13.1「Oracle VM Serverのディレクトリ」に、Oracle VM Serverの問題をトラブルシューティングする際に確認する必要がある重要なOracle VM Serverのディレクトリを示します。

表 13.1 Oracle VM Serverのディレクトリ

ディレクトリ

用途

/etc/xen

Oracle VM Serverデーモンと仮想化ゲストのOracle VM Server構成ファイルを含みます。

/etc/xen/scripts

ネットワーク関連スクリプトを含みます。

/var/log

次のファイルを含む:

  • ovs-agent.log。Oracle VM Agentのログ・ファイル。

  • ovmwatch.log。仮想マシンのライフサイクル・イベントを記録します。

  • ovm-consoled.log。リモートVNCコンソール・アクセスおよびOracle VM Managerとのすべての通信をログに記録します。

  • messages*。すべてのOracle VM Serverメッセージをログに記録します。

/var/log/xen

Oracle VM Serverのログ・ファイルを含みます。


13.2.1.2 Oracle VM Serverのログ・ファイル

次の表に、Oracle VM Serverの問題をトラブルシューティングする際に確認する必要があるOracle VM Serverのログ・ファイルを示します。

表 13.2 Oracle VM Serverのログ・ファイル

ログ・ファイル

ディレクトリ

説明

xend.log

/var/log/xen/

Oracle VM Serverデーモンのすべてのアクションのログを含みます。 アクションは、通常の条件またはエラー条件です。 このログ・ファイルには、xm logコマンドによる出力と同じ情報を含みます。

xend-debug.log

/var/log/xen/

Oracle VM Serverデーモンのアクションの詳細ログを含みます。

xen-hotplug.log

/var/log/xen/

ホットプラグ・イベントのログを含みます。 デバイスまたはネットワーク・スクリプトが起動しない、または使用できない場合、ホットプラグ・イベントがログに記録されます。

qemu-dm.pid.log

/var/log/xen/

ハードウェア仮想化ゲストのログを含みます。 このログは、quemu-dmプロセスによって作成されます。 psコマンドを使用してpid(プロセス識別子)を検索し、これをファイル名に置き換えます。

ovs-agent.log

/var/log/

Oracle VM Agentのログを含みます。

osc.log

/var/log/

Oracle VM Storage Connectプラグインのログを含みます。

ovm-consoled.log

/var/log/

Oracle VM仮想マシン・コンソールのログを含みます。

ovmwatch.log

/var/log/

Oracle VM監視デーモンのログを含みます。


13.2.1.3 Oracle VM Serverのコマンドライン・ツール

次の表は、Oracle VM Serverの問題をトラブルシューティングする際に使用できるコマンドライン・ツールを示します。

ノート

これらのコマンドライン・ツールはXen環境の一部として組み込まれています。 これらの使用方法の詳細は、該当するXenドキュメントを参照してください。

Table 13.3 Oracle VM Serverのコマンドライン・ツール

コマンドライン・ツール

説明

xentop

Oracle VM Serverおよびドメインのリアルタイム情報を表示します。

xm dmesg

ハイパーバイザのログ情報を表示します。

xm log

Oracle VM Serverデーモンのログ情報を表示します。


13.2.2 Oracle VM ServerでのDHCPの使用

Oracle VM Serverは、静的IPアドレスのコンピュータにインストールすることをお薦めします。 ご使用の環境でDHCPを使用してIPアドレス領域を管理するには、DHCPサーバーはサーバー・インタフェースのMACアドレスを特定のIP割当てにマップするように構成してください。 これによって、ホストは常に同じIPアドレスを受信できます。 DHCPのリース期間によってIPアドレスが変わる可能性のある環境で使用すると、Oracle VM Serverホストの動作が不確定になります。

13.2.3 Dom0コンソールに接続時に特定のキーの組合せが使用できない

一部のサーバー・モデルと一部のクライアント端末は、特殊なキーの組合せに関して理論的には互換性がありません。 たとえば、HP DL380G4 (BIOS P51)サーバーなどの一部のHPサーバーでは、ログイン画面に切り替えるために必要な[Alt]-[F2]キーの組合せが、すべての端末クライアントで機能するわけではありません。 一部の端末クライアントでは別のキー・マッピングを使用するため、代わりのマッピングを使用できるかどうか、選択した端末クライアントのドキュメントを確認することをお薦めします。

Windows PuTTY SSHクライアントを使用している場合、[Alt] + 右矢印キーおよび[Alt] + 左矢印キーを押して、記載されている[Alt]-[F2]ではなくログイン画面に切り替えます。

13.2.4 Oracle VM Serverでのストレージ・アレイのLUN再マッピング

ストレージ・アレイのLUN再マッピングは、Oracle VM Serverではサポートされていません。 Oracle VM Serverは、同じLUN IDを使用してストレージ・アレイの論理ドライブに対する接続を維持する必要があります。 LUNが再マップされると、次のエラーがOracle VM Serverのメッセージ・ログに出力される可能性があります。

Warning! Received an indication that the LUN assignments on this target have changed. 
The Linux SCSI layer does not automatically remap LUN assignments.

この問題を解決するには、次の操作を実行します。

  • ファイバ・チャネル・ストレージの場合、Oracle VM Serverを再起動します。 新しいストレージ・アレイLUN IDが使用されます。

  • iSCSI記憶域の場合、次の例に示すように、Oracle VM Serverでiscsiデーモンを再起動し、すべてのiSCSIターゲット接続を削除およびリストアします。

    # service iscsi restart

    または、Oracle VM Serverにおいて、次の例に示すように、LUN IDが変更されたターゲットに対してログアウトしてから再度ログインします。

    # iscsiadm --mode node --logout ip_address iqn.xyz:1535.uuid
    # iscsiadm --mode node --login ip_address iqn.xyz:1535.uuid

13.2.5 Oracle VM ServerでのISCSI設定のチューニング

場合によっては、特定のISCSI実装で制限またはバグに遭遇する可能性があり、それによりOracle VM Serverごとにストレージ・イニシエータのISCSI設定のチューニングが必要となることがあります。

通常、LUNでIOロックが発生し、Oracle VM Server上でカーネル・ワークロードに対する予期しない変更があった場合にこうしたことが必要になります。 Oracle VM Serverとストレージ・アレイとの間のネットワーク・トラフィックが大幅に増加していることにも気づく可能性があります。 この特定のケースは、Oracle Solaris 11で実行されているZFSアプライアンスで発生することがわかっており、Sun iSCSI COMSTARポート・プロバイダに関連しています。 この問題は、通常、パッケージのバージョンを更新することで解決できますが、バージョンの更新が選択肢にない場合には、SUN.COMSTARターゲットと通信する各Oracle VM ServerのISCSI設定をチューニングすることでフロー・コントロールを有効にできます。

ISCSIをチューニングするには、各Oracle VM Serverで次のステップを実行します。

  • テキスト・エディタで/etc/iscsi/iscsid.confを開きます。

  • iSCSI settingsというセクションを検索します。

  • エントリnode.session.iscsi.InitialR2Tの値をyesに変更し、エントリnode.session.iscsi.ImmediateDataの値をnoに変更します。

  • ファイルを保存します。

  • 次のコマンドを実行してISCSIデーモンを再起動します。

    # service iscsid restart
ノート

この問題に対するお薦めの解決策は、ソフトウェアを更新することです。 Oracle VM Server設定の手動構成は、今後の更新で変更内容が失われる可能性があるため一般的にはお薦めできません。

13.2.6 クラスタリングされたサーバー・プールのOracle VM Server for x86のトラブルシューティング

サーバー・プールからOracle VM Serverを削除すると、エラーが発生する場合があります。 典型的な例は、OCFS2ベース・リポジトリがサーバー・プールから削除しようとした時点でもまだOracle VM Serverに提示されている場合、またはOracle VM Serverがサーバー・プール・ファイル・システムに対するアクセス権を失ったり、そのOracle VM Serverに対するハートビート機能が失敗したりしている場合です。 次のリストは、このような状況に対処するステップを説明します。

  • サーバー・プールからリポジトリを削除する際に、サーバーに提示されているリポジトリが存在しないことを確認します。 これが問題の原因である場合には、通常、表示されるエラーにOCFS2ファイル・システムがまだ存在していることが示されます。 詳細は、Oracle VM Managerオンライン・ヘルプの「リポジトリの観点」セクションを参照してください。

  • プール・ファイル・システムが原因で削除操作が失敗する場合は、アンマウント時にプール・ファイル・システムで他のプロセスが動作していた可能性があります。 後でOracle VM Serverの削除を試行してください。

  • 新しくインストールされたOracle VM Managerのインスタンスにあるクラスタリングされたサーバー・プールからサーバーを削除しようとすると、ご使用の環境でサーバー・プールが検出されて以降ファイル・サーバーがリフレッシュされていない可能性があります。 Oracle VM Serverを削除する前に、記憶域上で、すべての記憶域とすべてのファイル・システムをリフレッシュしてみてください。

  • サーバーが残りのサーバー・プールまたはサーバー・プール・ファイル・システムのある記憶域とのネットワーク接続を失ったためにOracle VM Serverをサーバー・プールから削除できない場合、通常、疑いのあるサーバーに対して重大なイベントが生成されます。 疑いのあるOracle VM Serverに対して生成された重大なイベントを確認してください。 詳細は、Oracle VM Managerオンライン・ヘルプの「イベントの観点」セクションを参照してください。 これらのイベントが確認されれば、再度サーバー・プールからサーバーを削除してみることができます。 ほとんどの場合、重大なイベントを確認した後にはサーバー・プールからのサーバーの削除は正常に行われますが、削除プロセス中にいくつかの警告が生成される場合があります。 サーバーがサーバー・プールから削除されたら、サーバーで発生している可能性のあるネットワークまたはストレージのアクセスの問題を解決する必要があります。

  • サーバーにまだ記憶域へのアクセスの問題があり、すべての重大なイベントが確認されてもまだサーバー・プールから削除できない場合、サーバーを再起動してクラスタに正しく再結合できるようにしてから再度削除してみてください。

  • サーバー・プールのファイル・システムがなんらかの理由で壊れた場合、または古くなったクラスタの残骸がサーバーに残っている場合、サーバー・プールを完全に消去して最初から再構築する必要があります。 これには、通常、クラスタ内の各Oracle VM Serverで一連の手動ステップを実行する必要があり、これはOracle Supportの支援のもとに実行する必要があります。

13.2.7 複数のインフィニバンドHCAのメモリーの割当て

Oracle VM Serverの準仮想化環境用のPCIe Scalable Interface (psif)ドライバで複数のInfinibandホスト・チャネル・アダプタ(HCA)を使用すると、メモリー不足のエラーが発生することがあります。 こうしたメモリー不足のエラーは、psifドライバが各インタフェース・インスタンスのメモリー50MBに加えて、ドライバ自体に最小30MBのメモリーを必要とするために発生します。 dom0のデフォルトのメモリー割当てでは、複数のインタフェースをサポートするのに十分なメモリーがありません。

メモリー不足のエラーを解決するには、Oracle VM Serverのdom0メモリー割当てを増やしてください。  1.6項「管理ドメインのメモリー・サイズの変更」を参照してください。

/var/log/messagesに記載されている、メモリー不足の例を次に示します。

time_stamp hostname kernel: [ 1465.466059] Out of memory: Kill process
8106 (python) score 0 or sacrifice child
Connection to hostname closed.l: [ 1465.466089] Killed process 8467
     (ovs-agent) total-vm:108488kB, anon-rss:12kB, file-rss:2064kB

13.2.8 NICがDHCP用に構成されている場合にIPアドレスの取得に失敗する問題の解決

場合によっては、DHCPを通じてIPアドレスを取得するようにOracle VM Serverのネットワーク・インタフェースを構成してから、そのインタフェースを起動すると、IPアドレスを取得できず、次に示すエラーが発生します。

Determining IP information for interface_name... 
failed; no link present. Check cable?

この問題は、ネットワーク・インタフェースの起動にかかる時間が、LINKDELAY環境変数に設定された時間よりも長い場合に発生する可能性があります。

この問題を解決するには、次の例に示すように、/etc/sysconfig/network-scripts/ifcfg-eth*ファイルでLINKDELAYの値を10以上に設定します。

DEVICE=eth3
BOOTPROTO=dhcp
HWADDR=00:00:00:00:00:00
ONBOOT=yes
LINKDELAY=10