ヘッダーをスキップ
Oracle® Database Applianceスタート・ガイド
リリース2.7 for Linux x86-64
B69545-07
  目次へ移動
目次
索引へ移動
索引

前
 
次
 

9 Oracle Database Applianceのトラブルシューティング

この章では、Oracle Database Applianceの問題のトラブルシューティング方法に関する情報について説明します。この章は次の項で構成されています:

Oracle Database Applianceの診断および検証ツールについて

Oracle Database ApplianceのOAKCLI validateコマンド・オプションは、サポートの問題を解決するための診断および検証機能を提供します。Oracle Database Applianceに問題が発生した場合、validateオプションを使用して、環境が適切に構成されていること、およびベスト・プラクティスが有効であることを確認します。サービス・リクエストを送信する場合、この章の説明どおりにOAKCLIも使用して、Oracleサポート・サービスに送信するためのログ・ファイルを用意します。

Oracle Database Applianceの検証ツール・コマンド・リファレンス

この項では、Oracle Database Appliance X3-2の検証ツールのリファレンスを示します。

Oracle Database Applianceの検証ツールの概要

コマンドoakcli validateを使用して、Oracle Database Applianceのステータスを検証します。

コマンドは次の構文を使用します。checklistは1回のチェックまたはカンマ区切りリストのチェック、output_file_nameは検証出力ファイルに指定する名前です。

oakcli validate -h 
oakcli validate [-V | -l | -h]
oakcli validate [-v] [-f output_file_name] [-a | -d | -c checklist]

権限およびセキュリティ

oakcli validateコマンドはrootユーザーとして実行する必要があります。

Oracle Database Applianceの検証ツール・オプションのサマリー

表9-1 Oracle Database Applianceの検証ツール・オプション

オプション 目的

-a

DiskCalibrationなど、すべてのシステム・チェックを実行します。このコマンドを使用して、デプロイメントの前にシステムの準備状況を検証することをお薦めします。DiskCalibrationシステム・チェックによりパフォーマンスの問題が発生する可能性があるため、実行中のシステム上で、このオプションを使用してoakcli validateを実行しないでください。

-c

カンマ区切りのチェックのリストを実行します。このコマンドを使用して、特定のチェックまたはチェックのリストを実行します。

-d

デフォルトのシステム・チェックを実行します。表9-2で説明されているように、デフォルトのシステム・チェックは、DiskCalibrationNetworkComponentsOSDiskStorageおよびSystemComponentsです。注意: NetworkComponentsオプションは、Oracle Database Appliance X3-2より前のハードウェアでは無効です。

-f

出力ファイルを作成します。-fフラグの後に、ファイルの名前を指定します。検証コマンドの出力内容は、このファイルに書き込まれます。出力内容をファイルに送信するよう指定しない場合、ページ表示(stdout)に送信されます。

-h

ヘルプ情報を出力します。

-l

すべてのシステム・チェック・オプションをリストし、オプションについて説明します。

-v

詳細出力を行います。

-V

検証ツール・バージョンを出力します。


表9-2 Oracle Database Applianceのシステム・チェック

チェック 目的

DiskCalibration

/opt/oracle/oak/orionを使用したストレージ・ディスクのパフォーマンスのインストール前チェック。

デプロイ済のシステム上でDiskCalibrationコマンドを実行するとパフォーマンスの問題が発生するため、Oracle Database ApplianceにOracleソフトウェアをデプロイした後でこのチェックを実行しないでください。

NetworkComponents

Oracle Database Appliance X3-2でパブリックおよびプライベートのネットワーク・ハードウェア接続を検証します。このオプションは、前のハードウェア・バージョンでは無効です。

OSDiskStorage

オペレーティング・システム・ディスクおよびファイル・システム情報を検証します。

SystemComponents

Oracle ILOMセンサー・データの読取りに基づいて、システム・コンポーネントを検証します。


Oracle Database Applianceの検証ツール・コマンドの例

次の項ではすべての検証コマンド・オプションとその説明を示します。

$ ./oakcli validate -l

すべてのシステム・チェックを実行します。

$ ./oakcli validate -a

ディスク測定のシステム・チェックを実行します。

$ ./oakcli validate -c DiskCalibration

ハードウェア・システム・コンポーネントおよびOracle Database Applianceネットワーク・コンポーネントを検証するシステム・チェックを実行します。

$ ./oakcli validate -c SystemComponents,NetworkComponents

注意:

NetworkComponentsオプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。

Oracle Database Applianceのシステム・トラブルシューティング

Oracle Database Applianceの構成中にエラーが発生した場合、次のメッセージおよび処置を確認してください。

Error Encountered in Step 11 Validation VIP appears to be up on the network
原因: このメッセージが表示される可能性が高いのは、前のデプロイをクリーンアップせずにエンドユーザー・バンドルを再デプロイしようとする場合です。このエラーが発生するのは、Oracle Database Applianceに割り当てられたアドレスに既存のVIPが構成されていることが原因です。
処置: ノード0でcleanupDeploy.plを実行してから、Oracle Appliance Managerを再起動します。
Error CRS-4402: The CSS daemon was started in exclusive mode but found an active CSS daemon on node oda2-1, number 1, and is terminating
原因: このエラーが発生するのは、Oracle Grid Infrastructure CSSデーモンがノードをスタンドアロン・クラスタ・ノードとして開始しようとしたが、起動時に他のクラスタ・ノードが実行されていることを検出し、クラスタに結合するためにクラスタ・モードに変更しようとした場合です。
処置: このエラーは無視してください。
インストールにはハード・ドライブのパーティション化が必要です。
原因: このメッセージは、2つのオペレーティング・システム・ディスクのうち1つがインストールされていないが、オペレーティング・システムを再イメージしようとしている場合に、ノード上で発生します。
処置: 両方のオペレーティング・システム・ディスクがインストールされ、使用可能であることを確認します。
マシン・チェック例外 ...これはソフトウェアの問題ではありません。
原因: ハードウェア・システム・エラーがあります。
処置: Oracle ILOMリモート・コンソールにログインし、ハードウェア・エラーを特定します。
ボリューム・コントロールのGStreamerプラグインおよび/またはデバイスが見つかりません。
原因: Oracle ILOMリモート・リダイレクション・コンソールのサウンド・カードに必要なオペレーティング・システムのプラグインがインストールされていません。
処置: このメッセージは無視してください。コンソールのボリューム・コントロールは必要ありません。
再起動して適切なブート・デバイスを選択するか、選択したブート・デバイスにブート・メディアを挿入してキーを押してください。
原因: 1つまたは両方のオペレーティング・システム・ディスクが使用できません。このメッセージは、システムの再イメージ中に「デフォルトのハード・ディスク」を選択したが、そのディスクが使用できない場合に発生します。
処置: 両方のオペレーティング・システム・ディスクがインストールされ、使用可能であることを確認します。
そのディレクトリのAoDB Linuxインストール・ツリーは、ご使用のブート・メディアに一致していない可能性があります。
原因: このメッセージは、両方のオペレーティング・ディスクがインストールされ、オペレーティング・システム・ディスクを再イメージするよう選択した場合に、ノード上で発生します。「デフォルト(BIOS設定を使用)」をイメージ化オプションに選択しているが、1つまたは両方のディスクが使用できない場合に発生します。
処置: 両方のオペレーティング・システム・ディスクが使用可能であることを確認します。
ERROR: Gateway IP is not pingable
原因: Windowsプラットフォームでは、Oracle Appliance Managerコンフィギュレータはポート7でエコー・サービスを使用してゲートウェイに接続します。エコー・サービスが無効である場合、おそらくセキュリティ上の理由により、pingが失敗します。
処置: ネイティブ・プラットフォームのpingコマンドを実行します。pingが成功した場合、コンフィギュレータの検証出力は無視できます。
ACFS Resources Failed to Start After Applying 2.2 Infra Patch
原因: Oracle Database Applianceオペレーティング・システムのアップグレードには、Oracle Enterprise LinuxのOracle Unbreakable Enterprise Kernel (Oracle UEK)へのアップグレードが含まれます。Oracle Automatic Storage Management Cluster File System (ACFS)はOracle Linuxのすべてのバージョンでサポートされているわけではないため、オペレーティング・システムのアップグレードが成功すると、Oracle ACFSが事実上無効になる可能性があります。

Oracle Database Appliance 2.2へのアップグレードには、—infra—giおよび—databaseという3つのオプションがあります。—infraオプションには、Oracle Enterprise LinuxからOracle UEKへのアップグレードが含まれます。—infraで2.2にアップグレードする前、オペレーティング・システムは11.2.0.2.x Grid Infrastructureを備えたOracle Enterprise Linuxです。—infraでのアップグレード後、オペレーティング・システムは、Oracle UEK、およびOracle UEKと互換性のない11.2.0.2.x ACFSです。

たとえば、Oracle Linux 2.6.32-300.11.1.el5uekにアップグレードすると、reco.acfsvol.acfsおよびora.registry.acfsが一時的にOFFLINE状態になります。これは、2.6.32-300.11.1.el5uekがOracle 11.2.0.2.x ACFSをサポートしていないためです。ただし、Oracle Grid Infrastructureを11.2.0.3.2にアップグレードすると、これらのコンポーネントは再度オンラインになります。

処置: —giオプションを使用してOracle Database Appliance 2.2にアップグレードします。このバージョンのソフトウェアには、Oracle UEKと連携して動作するOracle ACFSモジュールが含まれるOracle Grid Infrastructure 11.2.0.3.2が含まれます。

詳細は、My Oracle Supportのノート1369107.1を参照してください。

https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=1369107.1

Oracle ILOM構成のトラブルシューティング

この項では、インストール中に発生する可能性があるOracle Integrated Lights Out Manager (Oracle ILOM)のトラブルシューティング問題について説明します。

Oracle ILOMの一般的なトラブルシューティングのガイドライン

Oracle ILOMの構成でエラーが発生した場合、次のタスクを最初に実行してください。

  1. 必要なJDKバージョンがサーバーにインストールされていることを確認します。jdk-6u24-linux-i586.rpmなどの32ビットJDKが必要です。JDKをダウンロードするには、次の場所にアクセスしてください。http://www.oracle.com/technetwork/java/javase/downloads/index.html.

  2. 環境をチェックして、リモート・コンソールが起動できるように、必要なJavaアプリケション(たとえば、Java Web Start、javaws)がインストールされていることを確認します。

Oracle ILOMのエラー・メッセージおよび処置

次に、Oracle Integrated Lights Out Managerリモート・コンソールの使用時に発生するメッセージを示します。

CD-ROMイメージをリダイレクトできません。
原因: リモート・コンソールにログインしようとすると、「CD-ROM image redirection is not supported on your client OS」というエラー・メッセージを示した、「Cannot redirect CD-ROM image」というタイトルのメッセージ・ウィンドウが表示されます。このエラーは、リモート・コンソールに必要なJava Development Kit (JDK)がインストールされていない場合に発生します。CD-ROMのリダイレクションには、32ビットJDKが必要です。リモート・コンソールは、32ビットJDKおよび64ビットJDKの両方で動作します。
処置: 使用しているリモート・コンソールのバージョンに必要なJDKキットをインストールします。JDKをダウンロードするには、次のURLにアクセスしてください。

http://www.oracle.com/technetwork/java/javase/downloads/index.html.

Class fault.memory.intel.dimm_ueエラー
原因: ノードがオフラインであるためOracle ILOMリモート・コンソールを開くと、class fault.memory.intel.dimmエラーが発生します。このエラーは、デュアル・インライン・メモリー・モジュール(DIMM)が失敗していることを示しています。
処置: 失敗したDIMMを置き換える方法に関する手順は、『Oracle Database Applianceサービス・マニュアル』のメモリー・モジュール(DIMM)の提供に関する項を参照してください。
システム概要でシステム・ステータスが失敗しました。
原因: システム・エラーが発生しました。
処置: 「View」をクリックして、システム・エラーの詳細を確認します。
再起動して適切なブート・デバイスを選択してください。
原因: システムをリセットして、システム起動ファイルを読み込む必要があります。
処置: 次のIPMIツール・コマンドを入力して、システムをリセットします。servernameはシステムの名前です。
ipmitool -U root -P changeme -H servername chassis power off
ipmitool -U root -P changeme -H servername chassis power on
JNLPファイルであるjnipgenerator-16を開くよう選択しています。
原因: リモート・コンソールを開くのに必要なアプリケーションが、システムにインストールされていません。リモート・コンソールを起動すると、このメッセージが表示されます。「OK」をクリックして、デフォルトのブラウザで開くと、Javaコンソールのソース・コードが表示されます。
処置: リモート・コンソール・インタフェースが起動できるように、欠落したJavaアプリケション(たとえばjavaws)をインストールします。

Oracleサポート・サービス用のログ・ファイルの用意

システム・フォルトが発生した場合、ディレクトリ/opt/oracle/oak/binでコマンドoakcli manage diagcollectを使用して、Oracle Database Applianceからログ・ファイル情報を収集します。このコマンドではOracle Database Applianceに格納されたログ・ファイル情報が収集され、Oracleサポート・サービスに送信可能な単一のログ・ファイルに情報がパッケージ化されます。ファイルの場所は、コマンド出力で指定されます。

その他のトラブルシューティング・ツールおよびコマンド

この項では、Oracle Database Applianceの問題の診断およびトラブルシューティングに使用できるその他のツールおよびコマンドを示します。Oracle Database Applianceに固有のものもあれば、クラスタ・システムの管理支援を目的とした汎用ツールもあります。この項では、使用可能な次のリソースについて説明します。

ODAchk

ODAchkは、Oracle RAC 2ノード・デプロイ用の重要な構成設定の監査を目的としたOracle Database Appliance Configuration Auditツールです。このツールは、次のカテゴリの構成設定を監査します。

  • オペレーティング・システムのカーネル・パラメータ、パッケージなど

  • RDBMDS

  • データベース・パラメータおよびその他のデータベース構成設定

  • CRS/Grid Infrastructure

  • ASM


関連項目:

ODAchkのダウンロード、インストールおよび使用の詳細は、My Oracle SupportのドキュメントID 1485630.1『ODAchk- Oracle Database Appliance (ODA) Configuration Audit Tool』(https://support.us.oracle.com/oip/faces/secure/km/DocumentDisplay.jspx?id=1485630.1)を参照

配線検証コマンド

Oracle Database Appliance X3-2を配線または再配線している場合、Oracle Appliance Managerを使用してケーブルが正しく構成されているかどうかをチェックできます。新しく配線したOracle Appliance Managerを起動した後、次のようにoakcli validate -c storagetopologyコマンドを実行して、ケーブルが正しく敷設されていることを検証します。

# /opt/oracle/oak/bin/oakcli validate -c storagetopology
INFO    : ODA Topology Verification Utility v0.1
INFO    : Check hardware type              
SUCCESS : Type of hardware found : V2
INFO    : Check for Environment(Bare Metal or Virtual Machine)
SUCCESS : Type of environment found : Bare Metal
INFO    : Check number of Controllers      
SUCCESS : Number of Internal LSI SAS controller found : 1
SUCCESS : Number of External LSI SAS controller found : 2
INFO    : Check for Controllers correct PCIe slot address
SUCCESS : Internal LSI SAS controller   : 50:00.0
SUCCESS : External LSI SAS controller 0 : 30:00.0
SUCCESS : External LSI SAS controller 1 : 40:00.0
INFO    : Check if JBOD powered on         
SUCCESS : 1JBOD : Powered-on
INFO    : Check for correct number of EBODS(2 or 4)
SUCCESS : EBOD found : 2
INFO    : Check for External Controller 0  
SUCCESS : Controller connected to correct ebod number
SUCCESS : Controller port connected to correct ebod port
SUCCESS : Overall Cable check for controller 0
INFO    : Check for External Controller 1  
SUCCESS : Controller connected to correct ebod number
SUCCESS : Controller port connected to correct ebod port
SUCCESS : Overall Cable check for controller 1
INFO    : Check for overall status of cable validation on Node
SUCCESS : Overall Cable Validation on Node
INFO    : Check Node Identification status 
SUCCESS : Node Identification
SUCCESS : Node name based on cable configuration found : NODE0

エラーがレポートされていないか出力を確認し、エラーがある場合は、システムを停止して指示どおりに再配線します。次に、Oracle Database Applianceを再起動してケーブル検証テストを再実行します。

トレース・ファイル・アナライザ・コレクタ

トレース・ファイル・アナライザ(TFA)コレクタは診断収集ユーティリティで、Oracle Clusterware/Grid InfrastructureおよびRACシステムでの診断データ収集が簡単になります。TFAは、診断データを収集およびパッケージ化するという点でOracle Clusterwareに同梱されているdiagcollectionユーティリティと似ていますが、診断情報の一元管理機能と収集の自動化機能があるため、diagcollectionに比べてずっと強力です。TFAには、次の主なメリットとオプションがあります。

  • 単一ノードから実行される単一コマンドへの、すべてのクラスタ・ノード上のすべてのCRS/GIおよびRACコンポーネントに関する診断データ収集のカプセル化

  • データ・アップロード・サイズを削減するためにデータ収集時に診断ファイルを削減するオプション

  • 一定期間および特定の製品コンポーネント(ASM、RDBMS、Clusterware)に対する診断データ収集を分離するオプション

  • クラスタ内の単一サーバーに対する収集された診断出力の一元管理(必要な場合)

  • すべてのログ・ファイルおよびトレース・ファイルでの問題を示す状態のオンデマンド・スキャン

  • 問題を示す状態に関するリアルタイム・スキャン・アラート・ログ(DBアラート・ログ、ASMアラート・ログ、Clusterwareアラート・ログなど)


関連項目:

ダウンロード、インストールおよび使用の詳細は、My Oracle SupportのドキュメントID 1513912.1『TFA Collector- The Preferred Tool for Automatic or Ad Hoc Diagnostic Gathering Across All Cluster Nodes』を参照

HRDディスク診断ツール

ディスクの問題が発生した場合は、HRDツールを使用すると原因の特定に役立ちます。このツールにより、ノードごとに14のディスク・チェックのリストが生成されます。ツールを実行するには、次のコマンドを入力します。

# /opt/oracle/oak/bin/stordiag/hrd.sh id

idは、チェックするディスクのスロット番号です。

Oracleソフトウェアのアンインストールおよびストレージの再初期化

Oracle Grid InfrastructureおよびOracle Real Application Clusters (Oracle RAC)をアンインストールする必要がある場合、ノード0でOracle Appliance ManagerユーティリティcleanupDeploy.plを実行して、アンインストールを実行します。


注意:

このコマンドを実行すると、ストレージが再初期化され、既存のデータは破棄されます。

Oracleソフトウェアをアンインストールするには、次の手順を実行します。

  1. rootとしてノード0にログインします。

  2. ディレクトリを/opt/oracle/oak/onecmdに変更します。

  3. コマンドcleanupDeploy.plを実行します。次に例を示します。

    # ./cleanupDeploy.pl