ヘッダーをスキップ
Oracle® Database Applianceスタート・ガイド
リリース2.8.1 for Linux x86-64
B69545-09
  目次へ移動
目次
索引へ移動
索引

前
 
次
 

8 Oracle Database Applianceのトラブルシューティング

この章では、Oracle Database Applianceの問題のトラブルシューティング方法に関する情報について説明します。この章は次の項で構成されています:

Oracle Database Applianceの診断および検証ツールについて

Oracle Database ApplianceのOAKCLI validateコマンド・オプションは、サポートの問題を解決するための診断および検証機能を提供します。Oracle Database Applianceに問題が発生した場合、validateオプションを使用して、環境が適切に構成されていること、およびベスト・プラクティスが有効であることを確認します。サービス・リクエストを送信する場合、この章の説明どおりにOAKCLIも使用して、Oracleサポート・サービスに送信するためのログ・ファイルを用意します。

Oracle Database Applianceの検証ツール・コマンド・リファレンス

この項では、Oracle Database Applianceの検証ツールのリファレンスを示します。このツールは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。

Oracle Database Applianceの検証ツールの概要

コマンドoakcli validateを使用して、Oracle Database Applianceのステータスを検証します。

コマンドは次の構文を使用します。checklistは1回のチェックまたはカンマ区切りリストのチェック、output_file_nameは検証出力ファイルに指定する名前です。

oakcli validate -h 
oakcli validate [-V | -l | -h]
oakcli validate [-v] [-f output_file_name] [-a | -d | -c checklist]

権限およびセキュリティ

oakcli validateコマンドはrootユーザーとして実行する必要があります。

Oracle Database Applianceの検証ツール・オプションのサマリー

表8-1 Oracle Database Applianceの検証ツール・オプション

オプション 目的

-a

DiskCalibrationなど、すべてのシステム・チェックを実行します。このコマンドを使用して、デプロイメントの前にシステムの準備状況を検証することをお薦めします。DiskCalibrationシステム・チェックによりパフォーマンスの問題が発生する可能性があるため、実行中のシステム上で、このオプションを使用してoakcli validateを実行しないでください。各チェックの詳細は、表8-2を参照してください。

-c

カンマ区切りのチェックのリストを実行します。このコマンドを使用して、特定のチェックまたはチェックのリストを実行します。

-d

デフォルトのシステム・チェックを実行します。デフォルトのシステム・チェックは、NetworkComponentsOSDiskStorageSharedStorageDiskCalibrationおよびSystemComponentsです。各チェックの詳細は、表8-2を参照してください。

-f

出力ファイルを作成します。-fフラグの後に、ファイルの名前を指定します。検証コマンドの出力内容は、このファイルに書き込まれます。出力内容をファイルに送信するよう指定しない場合、画面(stdout)に送信されます。

-h

ヘルプ情報を出力します。

-l

すべてのシステム・チェック・オプションをリストし、オプションについて説明します。

-v

詳細出力を行います。

-V

検証ツール・バージョンを出力します。


表8-2 Oracle Database Applianceのシステム・チェック

チェック 目的

asr

Oracle Auto Service Request (Oracle ASR)構成ファイルおよびOracle Integrated Lights Out Manager (Oracle ILOM)センサー・データに基づいて、Oracle ASRコンポーネントを検証します。

DiskCalibration

/opt/oracle/oak/orionを使用したストレージ・ディスクのパフォーマンスのインストール前チェック。

デプロイ済のシステム上でDiskCalibrationコマンドを実行するとパフォーマンスの問題が発生するため、Oracle Database ApplianceにOracleソフトウェアをデプロイした後でこのチェックを実行しないでください。

NetworkComponents

パブリックおよびプライベートのネットワーク・ハードウェア接続を検証します。注意: このオプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。

OSDiskStorage

オペレーティング・システム・ディスクおよびファイル・システム情報を検証します。

SharedStorage

共有ストレージおよびマルチパス情報を検証します。

StorageTopology

外部JBOD (ストレージ・シェルフ)の接続を検証します。

SystemComponents

Oracle ILOMセンサー・データの読取りに基づいて、システム・コンポーネントを検証します。


Oracle Database Applianceの検証ツール・コマンドの例

次の項ではすべての検証コマンド・オプションとその説明を示します。

$ ./oakcli validate -l

すべてのシステム・チェックを実行します。

$ ./oakcli validate -a

ディスク測定のシステム・チェックを実行します。

$ ./oakcli validate -c DiskCalibration

ハードウェア・システム・コンポーネントおよびOracle Database Applianceネットワーク・コンポーネントを検証するシステム・チェックを実行します。

$ ./oakcli validate -c SystemComponents,NetworkComponents

注意:

NetworkComponentsオプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。

Oracle Database Applianceのシステム・トラブルシューティング

Oracle Database Applianceの構成中にエラーが発生した場合、次のメッセージおよび処置を確認してください。

Error Encountered in Step 11 Validation VIP appears to be up on the network
原因: このメッセージが表示される可能性が高いのは、前のデプロイをクリーンアップせずにエンドユーザー・バンドルを再デプロイしようとする場合です。このエラーが発生するのは、Oracle Database Applianceに割り当てられたアドレスに既存のVIPが構成されていることが原因です。
処置: ノード0でcleanupDeploy.plを実行してから、Oracle Appliance Managerを再起動します。
Error CRS-4402: The CSS daemon was started in exclusive mode but found an active CSS daemon on node oda2-1, number 1, and is terminating
原因: このエラーが発生するのは、Oracle Grid Infrastructure CSSデーモンがノードをスタンドアロン・クラスタ・ノードとして開始しようとしたが、起動時に他のクラスタ・ノードが実行されていることを検出し、クラスタに結合するためにクラスタ・モードに変更しようとした場合です。
処置: このエラーは無視してください。
インストールにはハード・ドライブのパーティション化が必要です。
原因: このメッセージは、2つのオペレーティング・システム・ディスクのうち1つがインストールされていないが、オペレーティング・システムを再イメージしようとしている場合に、ノード上で発生します。
処置: 両方のオペレーティング・システム・ディスクがインストールされ、使用可能であることを確認します。
マシン・チェック例外 ...これはソフトウェアの問題ではありません。
原因: ハードウェア・システム・エラーがあります。
処置: Oracle ILOMリモート・コンソールにログインし、ハードウェア・エラーを特定します。
ボリューム・コントロールのGStreamerプラグインおよび/またはデバイスが見つかりません。
原因: Oracle ILOMリモート・リダイレクション・コンソールのサウンド・カードに必要なオペレーティング・システムのプラグインがインストールされていません。
処置: このメッセージは無視してください。コンソールのボリューム・コントロールは必要ありません。
再起動して適切なブート・デバイスを選択するか、選択したブート・デバイスにブート・メディアを挿入してキーを押してください。
原因: 1つまたは両方のオペレーティング・システム・ディスクが使用できません。このメッセージは、システムの再イメージ中に「デフォルトのハード・ディスク」を選択したが、そのディスクが使用できない場合に発生します。
処置: 両方のオペレーティング・システム・ディスクがインストールされ、使用可能であることを確認します。
そのディレクトリのAoDB Linuxインストール・ツリーは、ご使用のブート・メディアに一致していない可能性があります。
原因: このメッセージは、両方のオペレーティング・ディスクがインストールされ、オペレーティング・システム・ディスクを再イメージするよう選択した場合に、ノード上で発生します。「デフォルト(BIOS設定を使用)」をイメージ化オプションに選択しているが、1つまたは両方のディスクが使用できない場合に発生します。
処置: 両方のオペレーティング・システム・ディスクが使用可能であることを確認します。
ERROR: Gateway IP is not pingable
原因: Windowsプラットフォームでは、Oracle Appliance Managerコンフィギュレータはポート7でエコー・サービスを使用してゲートウェイに接続します。エコー・サービスが無効である場合、おそらくセキュリティ上の理由により、pingが失敗します。
処置: ネイティブ・プラットフォームのpingコマンドを実行します。pingが成功した場合、コンフィギュレータの検証出力は無視できます。
ACFS Resources Failed to Start After Applying 2.2 Infra Patch
原因: Oracle Database Applianceオペレーティング・システムのアップグレードには、Oracle Enterprise LinuxのOracle Unbreakable Enterprise Kernel (Oracle UEK)へのアップグレードが含まれます。Oracle Automatic Storage Management Cluster File System (ACFS)はOracle Linuxのすべてのバージョンでサポートされているわけではないため、オペレーティング・システムのアップグレードが成功すると、Oracle ACFSが事実上無効になる可能性があります。

Oracle Database Appliance 2.2へのアップグレードには、—infra—giおよび—databaseという3つのオプションがあります。—infraオプションには、Oracle Enterprise LinuxからOracle UEKへのアップグレードが含まれます。—infraで2.2にアップグレードする前、オペレーティング・システムは11.2.0.2.x Grid Infrastructureを備えたOracle Enterprise Linuxです。—infraでのアップグレード後、オペレーティング・システムは、Oracle UEK、およびOracle UEKと互換性のない11.2.0.2.x ACFSです。

たとえば、Oracle Linux 2.6.32-300.11.1.el5uekにアップグレードすると、reco.acfsvol.acfsおよびora.registry.acfsが一時的にOFFLINE状態になります。これは、2.6.32-300.11.1.el5uekがOracle 11.2.0.2.x ACFSをサポートしていないためです。ただし、Oracle Grid Infrastructureを11.2.0.3.2にアップグレードすると、これらのコンポーネントは再度オンラインになります。

処置: —giオプションを使用してOracle Database Appliance 2.2にアップグレードします。このバージョンのソフトウェアには、Oracle UEKと連携して動作するOracle ACFSモジュールが含まれるOracle Grid Infrastructure 11.2.0.3.2が含まれます。

詳細は、My Oracle Supportのノート1369107.1を参照してください。

https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=1369107.1

Oracle ILOM構成のトラブルシューティング

この項では、インストール中に発生する可能性があるOracle Integrated Lights Out Manager (Oracle ILOM)のトラブルシューティング問題について説明します。

Oracle ILOMの一般的なトラブルシューティングのガイドライン

Oracle ILOMの構成でエラーが発生した場合、次のタスクを最初に実行してください。

  1. 必要なJDKバージョンがサーバーにインストールされていることを確認します。jdk-6u24-linux-i586.rpmなどの32ビットJDKが必要です。JDKをダウンロードするには、次の場所にアクセスしてください: http://www.oracle.com/technetwork/java/javase/downloads/index.html

  2. 環境をチェックして、リモート・コンソールが起動できるように、必要なJavaアプリケション(たとえば、Java Web Start、javaws)がインストールされていることを確認します。

Oracle ILOMのエラー・メッセージおよび処置

次に、Oracle Integrated Lights Out Managerリモート・コンソールの使用時に発生するメッセージを示します。

CD-ROMイメージをリダイレクトできません。
原因: リモート・コンソールにログインしようとすると、「CD-ROM image redirection is not supported on your client OS」というエラー・メッセージを示した、「Cannot redirect CD-ROM image」というタイトルのメッセージ・ウィンドウが表示されます。このエラーは、リモート・コンソールに必要なJava Development Kit (JDK)がインストールされていない場合に発生します。CD-ROMのリダイレクションには、32ビットJDKが必要です。リモート・コンソールは、32ビットJDKおよび64ビットJDKの両方で動作します。
処置: 使用しているリモート・コンソールのバージョンに必要なJDKキットをインストールします。JDKをダウンロードするには、次のURLにアクセスしてください。

http://www.oracle.com/technetwork/java/javase/downloads/index.html.

Class fault.memory.intel.dimm_ueエラー
原因: ノードがオフラインであるためOracle ILOMリモート・コンソールを開くと、class fault.memory.intel.dimmエラーが発生します。このエラーは、デュアル・インライン・メモリー・モジュール(DIMM)が失敗していることを示しています。
処置: 失敗したDIMMを置き換える方法に関する手順は、『Oracle Database Applianceサービス・マニュアル』のメモリー・モジュール(DIMM)の提供に関する項を参照してください。
システム概要でシステム・ステータスが失敗しました。
原因: システム・エラーが発生しました。
処置: 「View」をクリックして、システム・エラーの詳細を確認します。
再起動して適切なブート・デバイスを選択してください。
原因: システムをリセットして、システム起動ファイルを読み込む必要があります。
処置: 次のIPMIツール・コマンドを入力して、システムをリセットします。servernameはシステムの名前です。
ipmitool -U root -P changeme -H servername chassis power off
ipmitool -U root -P changeme -H servername chassis power on
JNLPファイルであるjnipgenerator-16を開くよう選択しています。
原因: リモート・コンソールを開くのに必要なアプリケーションが、システムにインストールされていません。リモート・コンソールを起動すると、このメッセージが表示されます。「OK」をクリックして、デフォルトのブラウザで開くと、Javaコンソールのソース・コードが表示されます。
処置: リモート・コンソール・インタフェースが起動できるように、欠落したJavaアプリケション(たとえばjavaws)をインストールします。

Oracleサポート・サービス用のログ・ファイルの用意

システム・フォルトが発生した場合、ディレクトリ/opt/oracle/oak/binでコマンドoakcli manage diagcollectを使用して、Oracle Database Applianceからログ・ファイル情報を収集します。このコマンドではOracle Database Applianceに格納されたログ・ファイル情報が収集され、Oracleサポート・サービスに送信可能な単一のログ・ファイルに情報がパッケージ化されます。ファイルの場所は、コマンド出力で指定されます。

その他のトラブルシューティング・ツールおよびコマンド

この項では、Oracle Database Applianceの問題の診断およびトラブルシューティングに使用できるその他のツールおよびコマンドを示します。Oracle Database Applianceに固有のものもあれば、クラスタ・システムの管理支援を目的とした汎用ツールもあります。この項では、使用可能な次のリソースについて説明します。

構成監査、ディスク診断および配線検証用のOracle Appliance Managerツール

Oracle Appliance Managerでは、様々な高性能の監視ツールやレポート作成ツールにアクセスできますが、これらのツールには、独自の構文およびコマンド・セットを必要としたスタンドアロン・ツールから派生したものがあります。この項では、次に示すコマンドについて簡単に説明します。各コマンドの詳細は、付録D「Oracle Appliance Manager (OAKCLI)リファレンス」を参照してください。

  • ODAchk

    ODAchk構成監査ツールは、次のようなカテゴリでOracle RAC 2ノード・デプロイ用の重要な構成設定を監査します。

    • オペレーティング・システムのカーネル・パラメータ、パッケージなど

    • RDBMDS

    • データベース・パラメータおよびその他のデータベース構成設定

    • CRS/Grid Infrastructure

    • ASM


      関連項目:

      ODAchkのダウンロード、インストールおよび使用の詳細は、My Oracle SupportのドキュメントID 1485630.1『ODAchk- Oracle Database Appliance (ODA) Configuration Audit Tool』(https://support.us.oracle.com/oip/faces/secure/km/DocumentDisplay.jspx?id=1485630.1)を参照してください。

  • ディスク診断ツール

    ディスクの問題が発生した場合は、ディスク診断ツールを使用すると原因の特定に役立ちます。このツールにより、ノードごとに14のディスク・チェックのリストが生成されます。ツールを実行するには、次のコマンドを入力します。

    # /opt/oracle/oak/bin/oakcli stordiag e_shelf_pd_unit
    
  • 配線検証ツール

    Oracle Database Applianceを配線または再配線している場合、Oracle Appliance Managerを使用してケーブルが正しく構成されているかどうかをチェックできます。(注意: このツールは、Oracle Database Appliance X3-2より前のハードウェアに適用できません。)新しく配線したOracle Appliance Managerを起動した後、次のようにoakcli validate -c storagetopologyコマンドを実行して、ケーブルが正しく敷設されていることを検証します。

    # /opt/oracle/oak/bin/oakcli validate -c storagetopology
    INFO    : ODA Topology Verification Utility v0.1
    INFO    : Check hardware type              
    SUCCESS : Type of hardware found : V2
    INFO    : Check for Environment(Bare Metal or Virtual Machine)
    SUCCESS : Type of environment found : Bare Metal
    INFO    : Check number of Controllers      
    SUCCESS : Number of Internal LSI SAS controller found : 1
    SUCCESS : Number of External LSI SAS controller found : 2
    INFO    : Check for Controllers correct PCIe slot address
    SUCCESS : Internal LSI SAS controller   : 50:00.0
    SUCCESS : External LSI SAS controller 0 : 30:00.0
    SUCCESS : External LSI SAS controller 1 : 40:00.0
    INFO    : Check if JBOD powered on         
    SUCCESS : 1JBOD : Powered-on
    INFO    : Check for correct number of EBODS(2 or 4)
    SUCCESS : EBOD found : 2
    INFO    : Check for External Controller 0  
    SUCCESS : Controller connected to correct ebod number
    SUCCESS : Controller port connected to correct ebod port
    SUCCESS : Overall Cable check for controller 0
    INFO    : Check for External Controller 1  
    SUCCESS : Controller connected to correct ebod number
    SUCCESS : Controller port connected to correct ebod port
    SUCCESS : Overall Cable check for controller 1
    INFO    : Check for overall status of cable validation on Node
    SUCCESS : Overall Cable Validation on Node
    INFO    : Check Node Identification status 
    SUCCESS : Node Identification
    SUCCESS : Node name based on cable configuration found : NODE0
    

    エラーがレポートされていないか出力を確認し、エラーがある場合は、システムを停止して指示どおりに再配線します。次に、Oracle Database Applianceを再起動してケーブル検証テストを再実行します。

トレース・ファイル・アナライザ・コレクタ

トレース・ファイル・アナライザ(TFA)コレクタは診断収集ユーティリティで、Oracle Clusterware/Grid InfrastructureおよびRACシステムでの診断データ収集が簡単になります。TFAの動作は、Oracle Clusterwareに同梱されているdiagcollectionユーティリティと似ています。どちらのツールも診断データを収集し、パッケージ化します。しかし、TFAは診断情報の収集を一元管理して自動化しているため、diagcollectionに比べてずっと強力です。

TFAには、次の主なメリットとオプションがあります。

  • 単一ノードから実行される単一コマンドへの、すべてのクラスタ・ノード上のすべてのCRS/GIおよびRACコンポーネントに関する診断データ収集のカプセル化

  • データ・アップロード・サイズを削減するためにデータ収集時に診断ファイルを削減するオプション

  • 一定期間および特定の製品コンポーネント(ASM、RDBMS、Clusterware)に対する診断データ収集を分離するオプション

  • クラスタ内の単一サーバーに対する収集された診断出力の一元管理(必要な場合)

  • すべてのログ・ファイルおよびトレース・ファイルでの問題を示す状態のオンデマンド・スキャン

  • 問題を示す状態に関するリアルタイム・スキャン・アラート・ログ(DBアラート・ログ、ASMアラート・ログ、Clusterwareアラート・ログなど)


関連項目:

詳細は、My Oracle SupportのドキュメントID 1513912.1『TFA Collector- The Preferred Tool for Automatic or Ad Hoc Diagnostic Gathering Across All Cluster Nodes』を参照してください。

Oracle Cluster Health MonitorおよびOracle OSWatcherによる常時監視

提供される監視ツールを使用して、停止やその他のパフォーマンス問題を引き起こす問題を回避できることがあります。Oracle Cluster Health Monitor (CHM)およびOracle OSWatcher (OSW)の2つは、Oracle Database Applianceで使用できる非常に便利なツールです。

CHMは、クラスタウェアのパフォーマンスに関するリアルタイム・メトリックをリポジトリに格納します。CHMの詳細は、『Oracle Clusterware管理およびデプロイメント・ガイド』の付録H「Oracle Clusterwareのトラブルシューティング」を参照してください。

OSWは、オペレーティング・システムからパフォーマンス・メトリックを取得します。特定タイプの問題の診断に役立てるためにOSWレポートを提供するようにOracleサポートから依頼されることがあります。OSWの詳細は、Oracleサポート・ノート301137.1 (https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=301137.1)を参照してください。

Oracle Database Appliance Serverハードウェア監視ツールについて

Oracle Database Appliance Serverハードウェア監視ツールでは、Oracle Database Applianceサーバー・ノードのハードウェアで、使用可能なセンサーを問い合せてハードウェア・コンポーネントの状態を監視します。このツールは、ベア・メタル・システムおよび仮想化システムでサポートされています。

監視対象コンポーネントは、oakcli show -hコマンドの出力にリストされますが、便宜上、次の監視されるサブシステム・タイプのリストを使用します。

  • サーバー

  • プロセッサ

  • メモリー

  • 電源装置

  • 冷却装置

  • ネットワーク


関連項目:

oakcli showなど、すべてのOracle Appliance Managerのコマンドの詳細は、付録Dを参照してください。

Oracle Database Appliance Serverハードウェア監視ツールによってレポートされるデータの性質は、問合せ対象のコンポーネントによって異なります。次の例は、電源サブシステムに関する出力を示しています。

oakcli show power

NAME            HEALTH HEALTH DETAILS PART_NO. SERIAL_NO.          LOCATION 
INPUT POWER OUTPUT POWER INLET TEMP      EXHAUST TEMP

Power Supply_0  OK     -              7047410   476856F+1242CE0020 PS0      Present     88 watts     31.250 degree C 34.188 degree C
Power Supply_1  OK     -              7047410   476856F+1242CE004J PS1      Present     66 watts     31.250 degree C 34.188 degree C

注意:

Oracle Database Appliance仮想化プラットフォームでのODA_BASEの初回起動時、Oracle Database Appliance Serverハードウェア監視ツールは有効になっており、基本的な統計を約5分間収集します。その際に、「Gathering Statistics…」というメッセージが表示されます。