この章では、Oracle Database Applianceの問題のトラブルシューティング方法に関する情報について説明します。この章は次の項で構成されています:
Oracle Database ApplianceのOAKCLI validate
コマンド・オプションは、サポートの問題を解決するための診断および検証機能を提供します。Oracle Database Applianceに問題が発生した場合、validate
オプションを使用して、環境が適切に構成されていること、およびベスト・プラクティスが有効であることを確認します。サービス・リクエストを送信する場合、この章の説明どおりにOAKCLIも使用して、Oracleサポート・サービスに送信するためのログ・ファイルを用意します。
この項では、Oracle Database Applianceの検証ツールのリファレンスを示します。このツールは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。
コマンドoakcli validate
を使用して、Oracle Database Applianceのステータスを検証します。
コマンドは次の構文を使用します。checklist
は1回のチェックまたはカンマ区切りリストのチェック、output_file_name
は検証出力ファイルに指定する名前です。
oakcli validate -h oakcli validate [-V | -l | -h] oakcli validate [-v] [-f output_file_name] [-a | -d | -c checklist]
表8-1 Oracle Database Applianceの検証ツール・オプション
オプション | 目的 |
---|---|
|
|
|
カンマ区切りのチェックのリストを実行します。このコマンドを使用して、特定のチェックまたはチェックのリストを実行します。 |
|
デフォルトのシステム・チェックを実行します。デフォルトのシステム・チェックは、 |
|
出力ファイルを作成します。 |
|
ヘルプ情報を出力します。 |
|
すべてのシステム・チェック・オプションをリストし、オプションについて説明します。 |
|
詳細出力を行います。 |
|
検証ツール・バージョンを出力します。 |
表8-2 Oracle Database Applianceのシステム・チェック
チェック | 目的 |
---|---|
asr |
Oracle Auto Service Request (Oracle ASR)構成ファイルおよびOracle Integrated Lights Out Manager (Oracle ILOM)センサー・データに基づいて、Oracle ASRコンポーネントを検証します。 |
|
デプロイ済のシステム上で |
|
パブリックおよびプライベートのネットワーク・ハードウェア接続を検証します。注意: このオプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。 |
|
オペレーティング・システム・ディスクおよびファイル・システム情報を検証します。 |
|
共有ストレージおよびマルチパス情報を検証します。 |
|
外部JBOD (ストレージ・シェルフ)の接続を検証します。 |
|
Oracle ILOMセンサー・データの読取りに基づいて、システム・コンポーネントを検証します。 |
次の項ではすべての検証コマンド・オプションとその説明を示します。
$ ./oakcli validate -l
すべてのシステム・チェックを実行します。
$ ./oakcli validate -a
ディスク測定のシステム・チェックを実行します。
$ ./oakcli validate -c DiskCalibration
ハードウェア・システム・コンポーネントおよびOracle Database Applianceネットワーク・コンポーネントを検証するシステム・チェックを実行します。
$ ./oakcli validate -c SystemComponents,NetworkComponents
注意: NetworkComponents オプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。 |
Oracle Database Applianceの構成中にエラーが発生した場合、次のメッセージおよび処置を確認してください。
Oracle Database Appliance 2.2へのアップグレードには、—infra
、—gi
および—database
という3つのオプションがあります。—infra
オプションには、Oracle Enterprise LinuxからOracle UEKへのアップグレードが含まれます。—infra
で2.2にアップグレードする前、オペレーティング・システムは11.2.0.2.x Grid Infrastructureを備えたOracle Enterprise Linuxです。—infra
でのアップグレード後、オペレーティング・システムは、Oracle UEK、およびOracle UEKと互換性のない11.2.0.2.x ACFSです。
たとえば、Oracle Linux 2.6.32-300.11.1.el5uekにアップグレードすると、reco.acfsvol.acfs
およびora.registry.acfs
が一時的にOFFLINE状態になります。これは、2.6.32-300.11.1.el5uekがOracle 11.2.0.2.x ACFSをサポートしていないためです。ただし、Oracle Grid Infrastructureを11.2.0.3.2にアップグレードすると、これらのコンポーネントは再度オンラインになります。
—gi
オプションを使用してOracle Database Appliance 2.2にアップグレードします。このバージョンのソフトウェアには、Oracle UEKと連携して動作するOracle ACFSモジュールが含まれるOracle Grid Infrastructure 11.2.0.3.2が含まれます。
詳細は、My Oracle Supportのノート1369107.1を参照してください。
https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=1369107.1
この項では、インストール中に発生する可能性があるOracle Integrated Lights Out Manager (Oracle ILOM)のトラブルシューティング問題について説明します。
Oracle ILOMの構成でエラーが発生した場合、次のタスクを最初に実行してください。
必要なJDKバージョンがサーバーにインストールされていることを確認します。jdk-6u24-linux-i586.rpmなどの32ビットJDKが必要です。JDKをダウンロードするには、次の場所にアクセスしてください: http://www.oracle.com/technetwork/java/javase/downloads/index.html
。
環境をチェックして、リモート・コンソールが起動できるように、必要なJavaアプリケション(たとえば、Java Web Start、javaws
)がインストールされていることを確認します。
次に、Oracle Integrated Lights Out Managerリモート・コンソールの使用時に発生するメッセージを示します。
http://www.oracle.com/technetwork/java/javase/downloads/index.html
.
システム・フォルトが発生した場合、ディレクトリ/opt/oracle/oak/bin
でコマンドoakcli manage diagcollect
を使用して、Oracle Database Applianceからログ・ファイル情報を収集します。このコマンドではOracle Database Applianceに格納されたログ・ファイル情報が収集され、Oracleサポート・サービスに送信可能な単一のログ・ファイルに情報がパッケージ化されます。ファイルの場所は、コマンド出力で指定されます。
この項では、Oracle Database Applianceの問題の診断およびトラブルシューティングに使用できるその他のツールおよびコマンドを示します。Oracle Database Applianceに固有のものもあれば、クラスタ・システムの管理支援を目的とした汎用ツールもあります。この項では、使用可能な次のリソースについて説明します。
Oracle Appliance Managerでは、様々な高性能の監視ツールやレポート作成ツールにアクセスできますが、これらのツールには、独自の構文およびコマンド・セットを必要としたスタンドアロン・ツールから派生したものがあります。この項では、次に示すコマンドについて簡単に説明します。各コマンドの詳細は、付録D「Oracle Appliance Manager (OAKCLI)リファレンス」を参照してください。
ODAchk
ODAchk構成監査ツールは、次のようなカテゴリでOracle RAC 2ノード・デプロイ用の重要な構成設定を監査します。
オペレーティング・システムのカーネル・パラメータ、パッケージなど
RDBMDS
データベース・パラメータおよびその他のデータベース構成設定
CRS/Grid Infrastructure
ASM
関連項目: ODAchkのダウンロード、インストールおよび使用の詳細は、My Oracle SupportのドキュメントID 1485630.1『ODAchk- Oracle Database Appliance (ODA) Configuration Audit Tool』(https://support.us.oracle.com/oip/faces/secure/km/DocumentDisplay.jspx?id=1485630.1 )を参照してください。 |
ディスクの問題が発生した場合は、ディスク診断ツールを使用すると原因の特定に役立ちます。このツールにより、ノードごとに14のディスク・チェックのリストが生成されます。ツールを実行するには、次のコマンドを入力します。
# /opt/oracle/oak/bin/oakcli stordiag e_shelf
_pd_
unit
配線検証ツール
Oracle Database Applianceを配線または再配線している場合、Oracle Appliance Managerを使用してケーブルが正しく構成されているかどうかをチェックできます。(注意: このツールは、Oracle Database Appliance X3-2より前のハードウェアに適用できません。)新しく配線したOracle Appliance Managerを起動した後、次のようにoakcli validate -c storagetopology
コマンドを実行して、ケーブルが正しく敷設されていることを検証します。
# /opt/oracle/oak/bin/oakcli validate -c storagetopology INFO : ODA Topology Verification Utility v0.1 INFO : Check hardware type SUCCESS : Type of hardware found : V2 INFO : Check for Environment(Bare Metal or Virtual Machine) SUCCESS : Type of environment found : Bare Metal INFO : Check number of Controllers SUCCESS : Number of Internal LSI SAS controller found : 1 SUCCESS : Number of External LSI SAS controller found : 2 INFO : Check for Controllers correct PCIe slot address SUCCESS : Internal LSI SAS controller : 50:00.0 SUCCESS : External LSI SAS controller 0 : 30:00.0 SUCCESS : External LSI SAS controller 1 : 40:00.0 INFO : Check if JBOD powered on SUCCESS : 1JBOD : Powered-on INFO : Check for correct number of EBODS(2 or 4) SUCCESS : EBOD found : 2 INFO : Check for External Controller 0 SUCCESS : Controller connected to correct ebod number SUCCESS : Controller port connected to correct ebod port SUCCESS : Overall Cable check for controller 0 INFO : Check for External Controller 1 SUCCESS : Controller connected to correct ebod number SUCCESS : Controller port connected to correct ebod port SUCCESS : Overall Cable check for controller 1 INFO : Check for overall status of cable validation on Node SUCCESS : Overall Cable Validation on Node INFO : Check Node Identification status SUCCESS : Node Identification SUCCESS : Node name based on cable configuration found : NODE0
エラーがレポートされていないか出力を確認し、エラーがある場合は、システムを停止して指示どおりに再配線します。次に、Oracle Database Applianceを再起動してケーブル検証テストを再実行します。
トレース・ファイル・アナライザ(TFA)コレクタは診断収集ユーティリティで、Oracle Clusterware/Grid InfrastructureおよびRACシステムでの診断データ収集が簡単になります。TFAの動作は、Oracle Clusterwareに同梱されているdiagcollectionユーティリティと似ています。どちらのツールも診断データを収集し、パッケージ化します。しかし、TFAは診断情報の収集を一元管理して自動化しているため、diagcollectionに比べてずっと強力です。
TFAには、次の主なメリットとオプションがあります。
単一ノードから実行される単一コマンドへの、すべてのクラスタ・ノード上のすべてのCRS/GIおよびRACコンポーネントに関する診断データ収集のカプセル化
データ・アップロード・サイズを削減するためにデータ収集時に診断ファイルを削減するオプション
一定期間および特定の製品コンポーネント(ASM、RDBMS、Clusterware)に対する診断データ収集を分離するオプション
クラスタ内の単一サーバーに対する収集された診断出力の一元管理(必要な場合)
すべてのログ・ファイルおよびトレース・ファイルでの問題を示す状態のオンデマンド・スキャン
問題を示す状態に関するリアルタイム・スキャン・アラート・ログ(DBアラート・ログ、ASMアラート・ログ、Clusterwareアラート・ログなど)
関連項目: 詳細は、My Oracle SupportのドキュメントID 1513912.1『TFA Collector- The Preferred Tool for Automatic or Ad Hoc Diagnostic Gathering Across All Cluster Nodes』を参照してください。 |
提供される監視ツールを使用して、停止やその他のパフォーマンス問題を引き起こす問題を回避できることがあります。Oracle Cluster Health Monitor (CHM)およびOracle OSWatcher (OSW)の2つは、Oracle Database Applianceで使用できる非常に便利なツールです。
CHMは、クラスタウェアのパフォーマンスに関するリアルタイム・メトリックをリポジトリに格納します。CHMの詳細は、『Oracle Clusterware管理およびデプロイメント・ガイド』の付録H「Oracle Clusterwareのトラブルシューティング」を参照してください。
OSWは、オペレーティング・システムからパフォーマンス・メトリックを取得します。特定タイプの問題の診断に役立てるためにOSWレポートを提供するようにOracleサポートから依頼されることがあります。OSWの詳細は、Oracleサポート・ノート301137.1 (https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=301137.1
)を参照してください。
Oracle Database Appliance Serverハードウェア監視ツールでは、Oracle Database Applianceサーバー・ノードのハードウェアで、使用可能なセンサーを問い合せてハードウェア・コンポーネントの状態を監視します。このツールは、ベア・メタル・システムおよび仮想化システムでサポートされています。
監視対象コンポーネントは、oakcli show -h
コマンドの出力にリストされますが、便宜上、次の監視されるサブシステム・タイプのリストを使用します。
サーバー
プロセッサ
メモリー
電源装置
冷却装置
ネットワーク
Oracle Database Appliance Serverハードウェア監視ツールによってレポートされるデータの性質は、問合せ対象のコンポーネントによって異なります。次の例は、電源サブシステムに関する出力を示しています。
oakcli show power NAME HEALTH HEALTH DETAILS PART_NO. SERIAL_NO. LOCATION INPUT POWER OUTPUT POWER INLET TEMP EXHAUST TEMP Power Supply_0 OK - 7047410 476856F+1242CE0020 PS0 Present 88 watts 31.250 degree C 34.188 degree C Power Supply_1 OK - 7047410 476856F+1242CE004J PS1 Present 66 watts 31.250 degree C 34.188 degree C
注意: Oracle Database Appliance仮想化プラットフォームでのODA_BASEの初回起動時、Oracle Database Appliance Serverハードウェア監視ツールは有効になっており、基本的な統計を約5分間収集します。その際に、「Gathering Statistics…」というメッセージが表示されます。 |