この章では、Oracle Database Applianceの問題のトラブルシューティング方法に関する情報について説明します。この章は次の項で構成されています:
Oracle Database ApplianceのOAKCLI validate
コマンド・オプションは、サポートの問題を解決するための診断および検証機能を提供します。Oracle Database Applianceに問題が発生した場合、validate
オプションを使用して、環境が適切に構成されていること、およびベスト・プラクティスが有効であることを確認します。サービス・リクエストを送信する場合、この章の説明どおりにOAKCLIも使用して、Oracleサポート・サービスに送信するためのログ・ファイルを用意します。
この項では、Oracle Database Applianceの検証ツールのリファレンスを示します。このツールは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。
コマンドoakcli validate
を使用して、Oracle Database Applianceのステータスを検証します。
コマンドは次の構文を使用します。checklist
は1回のチェックまたはカンマ区切りリストのチェック、output_file_name
は検証出力ファイルに指定する名前です。
oakcli validate -h oakcli validate [-V | -l | -h] oakcli validate [-v] [-f output_file_name] [-a | -d | -c checklist]
表8-1 Oracle Database Applianceの検証ツール・オプション
オプション | 目的 |
---|---|
|
|
|
カンマ区切りのチェックのリストを実行します。このコマンドを使用して、特定のチェックまたはチェックのリストを実行します。 |
|
デフォルトのシステム・チェックを実行します。デフォルトのシステム・チェックは、 |
|
出力ファイルを作成します。 |
|
ヘルプ情報を出力します。 |
|
すべてのシステム・チェック・オプションをリストし、オプションについて説明します。 |
|
詳細出力を行います。 |
|
検証ツール・バージョンを出力します。 |
表8-2 Oracle Database Applianceのシステム・チェック
チェック | 目的 |
---|---|
asr |
Oracle Auto Service Request (Oracle ASR)構成ファイルおよびOracle Integrated Lights Out Manager (Oracle ILOM)センサー・データに基づいて、Oracle ASRコンポーネントを検証します。 |
|
デプロイ済のシステム上で |
|
パブリックおよびプライベートのネットワーク・ハードウェア接続を検証します。注意: このオプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。 |
|
オペレーティング・システム・ディスクおよびファイル・システム情報を検証します。 |
|
共有ストレージおよびマルチパス情報を検証します。 |
|
外部JBOD (ストレージ・シェルフ)の接続を検証します。 |
|
Oracle ILOMセンサー・データの読取りに基づいて、システム・コンポーネントを検証します。 |
次の項ではすべての検証コマンド・オプションとその説明を示します。
$ ./oakcli validate -l
すべてのシステム・チェックを実行します。
$ ./oakcli validate -a
ディスク測定のシステム・チェックを実行します。
$ ./oakcli validate -c DiskCalibration
ハードウェア・システム・コンポーネントおよびOracle Database Applianceネットワーク・コンポーネントを検証するシステム・チェックを実行します。
$ ./oakcli validate -c SystemComponents,NetworkComponents
注意: NetworkComponents オプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。 |
Oracle Database Applianceの構成中にエラーが発生した場合、次のメッセージおよび処置を確認してください。
Oracle Database Appliance 2.2へのアップグレードには、—infra
、—gi
および—database
という3つのオプションがあります。—infra
オプションには、Oracle Enterprise LinuxからOracle UEKへのアップグレードが含まれます。—infra
で2.2にアップグレードする前、オペレーティング・システムは11.2.0.2.x Grid Infrastructureを備えたOracle Enterprise Linuxです。—infra
でのアップグレード後、オペレーティング・システムは、Oracle UEK、およびOracle UEKと互換性のない11.2.0.2.x ACFSです。
たとえば、Oracle Linux 2.6.32-300.11.1.el5uekにアップグレードすると、reco.acfsvol.acfs
およびora.registry.acfs
が一時的にOFFLINE状態になります。これは、2.6.32-300.11.1.el5uekがOracle 11.2.0.2.x ACFSをサポートしていないためです。ただし、Oracle Grid Infrastructureを11.2.0.3.2にアップグレードすると、これらのコンポーネントは再度オンラインになります。
—gi
オプションを使用してOracle Database Appliance 2.2にアップグレードします。このバージョンのソフトウェアには、Oracle UEKと連携して動作するOracle ACFSモジュールが含まれるOracle Grid Infrastructure 11.2.0.3.2が含まれます。
詳細は、My Oracle Supportのノート1369107.1を参照してください。
https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=1369107.1
この項では、インストール中に発生する可能性があるOracle Integrated Lights Out Manager (Oracle ILOM)のトラブルシューティング問題について説明します。
Oracle ILOMの構成でエラーが発生した場合、次のタスクを最初に実行してください。
必要なJDKバージョンがサーバーにインストールされていることを確認します。jdk-6u24-linux-i586.rpmなどの32ビットJDKが必要です。JDKをダウンロードするには、次の場所にアクセスしてください: http://www.oracle.com/technetwork/java/javase/downloads/index.html
。
環境をチェックして、リモート・コンソールが起動できるように、必要なJavaアプリケション(たとえば、Java Web Start、javaws
)がインストールされていることを確認します。
次に、Oracle Integrated Lights Out Managerリモート・コンソールの使用時に発生するメッセージを示します。
http://www.oracle.com/technetwork/java/javase/downloads/index.html
.
システム・フォルトが発生した場合、ディレクトリ/opt/oracle/oak/bin
でコマンドoakcli manage diagcollect
を使用して、Oracle Database Applianceからログ・ファイル情報を収集します。このコマンドではOracle Database Applianceに格納されたログ・ファイル情報が収集され、Oracleサポート・サービスによって使用される単一のログ・ファイルに情報がパッケージ化されます。ファイルの場所は、コマンド出力で指定されます。
この項では、Oracle Database Applianceの問題の診断およびトラブルシューティングに使用できるその他のツールおよびコマンドを示します。Oracle Database Applianceに固有のものもあれば、クラスタ・システムの管理支援を目的とした汎用ツールもあります。この項では、使用可能な次のリソースについて説明します。
Oracle Appliance Managerでは、様々な高性能の監視ツールやレポート作成ツールにアクセスできますが、これらのツールには、独自の構文およびコマンド・セットを必要としたスタンドアロン・ツールから派生したものがあります。この項では、次に示すコマンドについて簡単に説明します。各コマンドの詳細は、付録D「Oracle Appliance Manager (OAKCLI)リファレンス」を参照してください。
ODAchk
ODAchk構成監査ツールは、次のようなカテゴリでOracle RAC 2ノード・デプロイ用の重要な構成設定を監査します。
オペレーティング・システムのカーネル・パラメータ、パッケージなど
RDBMDS
データベース・パラメータおよびその他のデータベース構成設定
CRS/Grid Infrastructure
ASM
関連項目: ODAchkのダウンロード、インストールおよび使用の詳細は、My Oracle SupportのドキュメントID 1485630.1『ODAchk- Oracle Database Appliance (ODA) Configuration Audit Tool』(https://support.us.oracle.com/oip/faces/secure/km/DocumentDisplay.jspx?id=1485630.1 )を参照してください。 |
ディスクの問題が発生した場合は、ディスク診断ツールを使用すると原因の特定に役立ちます。このツールにより、ノードごとに14のディスク・チェックのリストが生成されます。ツールを実行するには、次のコマンドを入力します。
# /opt/oracle/oak/bin/oakcli stordiag e_shelf
_pd_
unit
配線検証ツール
Oracle Database Applianceを配線または再配線している場合、Oracle Appliance Managerを使用してケーブルが正しく構成されているかどうかをチェックします。(注意: このツールは、Oracle Database Appliance X3-2より前のハードウェアに適用できません。)新しく配線したOracle Appliance Managerを起動した後、仮想化プラットフォームをデプロイ済の場合は、ODA_BASEにログインした際に、次のようにoakcli validate -c storagetopology
コマンドをroot
ユーザーとして実行して、ケーブルが正しく敷設されていることを検証します。ここで表示されている例に類似したコマンドから出力します。
# /opt/oracle/oak/bin/oakcli validate -c storagetopology INFO : ODA Topology Verification Utility v0.1 INFO : Check hardware type SUCCESS : Type of hardware found : V2 INFO : Check for Environment(Bare Metal or Virtual Machine) SUCCESS : Type of environment found : Bare Metal INFO : Check number of Controllers SUCCESS : Number of Internal LSI SAS controller found : 1 SUCCESS : Number of External LSI SAS controller found : 2 INFO : Check for Controllers correct PCIe slot address SUCCESS : Internal LSI SAS controller : 50:00.0 SUCCESS : External LSI SAS controller 0 : 30:00.0 SUCCESS : External LSI SAS controller 1 : 40:00.0 INFO : Check if JBOD powered on SUCCESS : 1JBOD : Powered-on INFO : Check for correct number of EBODS(2 or 4) SUCCESS : EBOD found : 2 INFO : Check for External Controller 0 SUCCESS : Controller connected to correct ebod number SUCCESS : Controller port connected to correct ebod port SUCCESS : Overall Cable check for controller 0 INFO : Check for External Controller 1 SUCCESS : Controller connected to correct ebod number SUCCESS : Controller port connected to correct ebod port SUCCESS : Overall Cable check for controller 1 INFO : Check for overall status of cable validation on Node SUCCESS : Overall Cable Validation on Node INFO : Check Node Identification status SUCCESS : Node Identification SUCCESS : Node name based on cable configuration found : NODE0
エラーがレポートされていないか出力を確認し、エラーがある場合は、システムを停止して指示どおりに再配線します。完了後に、Oracle Database Applianceを再起動してケーブル検証テストを再実行します。
トレース・ファイル・アナライザ(TFA)コレクタは診断収集ユーティリティで、Oracle Clusterware/Grid InfrastructureおよびRACシステムでの診断データ収集が簡単になります。TFAの動作は、Oracle Clusterwareに同梱されているdiagcollectionユーティリティと似ています。どちらのツールも診断データを収集し、パッケージ化します。しかし、TFAは診断情報の収集を一元管理して自動化しているため、diagcollectionに比べてずっと強力です。
TFAには、次の主なメリットとオプションがあります。
単一ノードから実行される単一コマンドへの、すべてのクラスタ・ノード上のすべてのCRS/GIおよびRACコンポーネントに関する診断データ収集のカプセル化
データ・アップロード・サイズを削減するためにデータ収集時に診断ファイルを削減するオプション
一定期間および特定の製品コンポーネント(ASM、RDBMS、Clusterware)に対する診断データ収集を分離するオプション
クラスタ内の単一サーバーに対する収集された診断出力の一元管理(必要な場合)
すべてのログ・ファイルおよびトレース・ファイルでの問題を示す状態のオンデマンド・スキャン
問題を示す状態に関するリアルタイム・スキャン・アラート・ログ(DBアラート・ログ、ASMアラート・ログ、Clusterwareアラート・ログなど)
関連項目: 詳細は、My Oracle SupportのドキュメントID 1513912.1『TFA Collector- The Preferred Tool for Automatic or Ad Hoc Diagnostic Gathering Across All Cluster Nodes』を参照してください。 |
提供される監視ツールを使用して、停止やその他のパフォーマンス問題を引き起こす問題を回避できることがあります。Oracle Cluster Health Monitor (CHM)およびOracle OSWatcher (OSW)の2つは、Oracle Database Applianceで使用できる非常に便利なツールです。
CHMは、クラスタウェアのパフォーマンスに関するリアルタイム・メトリックをリポジトリに格納します。CHMの詳細は、『Oracle Clusterware管理およびデプロイメント・ガイド』の付録H「Oracle Clusterwareのトラブルシューティング」を参照してください。
OSWは、オペレーティング・システムからパフォーマンス・メトリックを取得します。特定タイプの問題の診断に役立てるためにOSWレポートを提供するようにOracleサポートから依頼されることがあります。OSWの詳細は、Oracleサポート・ノート301137.1 (https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=301137.1
)を参照してください。
Oracle Database Applianceハードウェア監視ツールでは必要に応じて、Oracle Database Applianceサーバー・ノードで、ハードウェア・コンポーネントの状態を監視します。ハードウェア監視は、サーバー・ノードのすべてのハードウェア・コンポーネントの状態を問い合わせます。ベア・メタル・システムおよび仮想化システムで、このツールを使用します。
oakcli show -h
コマンドの出力で、監視対象のコンポーネントの一覧を参照してください(便宜上、次の一覧に表示されています)。
サーバー
プロセッサ
メモリー
電源装置
冷却装置
ネットワーク
ストレージ・エンクロージャ
Oracle Database Applianceハードウェア監視ツールでレポートされた情報は、コマンドを実行したノードに関するのみであり、出力の詳細は表示しているコンポーネントによって異なります。次の例は、現行ノードにおける電源装置サブシステムの出力を表示しています。
oakcli show power NAME HEALTH HEALTH DETAILS PART_NO. SERIAL_NO. LOCATION INPUT POWER OUTPUT POWER INLET TEMP EXHAUST TEMP Power Supply_0 OK - 7047410 476856F+1242CE0020 PS0 Present 88 watts 31.250 degree C 34.188 degree C Power Supply_1 OK - 7047410 476856F+1242CE004J PS1 Present 66 watts 31.250 degree C 34.188 degree C
注意: Oracle Database Appliance仮想化プラットフォームでのODA_BASEの初回起動時、Oracle Database Appliance Serverハードウェア監視ツールは有効になっており、基本的な統計を約5分間収集します。その際に、「Gathering Statistics…」というメッセージが表示されます。 |
この項では、シリアル・コンソールを構成して起動プログラムを解決するようにOracleサポートからアドバイスされた場合に使用する手順を説明しています。ご使用のシステム構成(ベア・メタルまたはインストール済のOracle Virtual Imageのいずれか)に基づいて、この項の手順を使用します。
注意: この項の内容は、Oracle Database Appliance X3-2およびOracle Database Appliance X4-2に関するものです。 |
ベア・メタル・システムに必要なシリアル・コンソールを設定するために、次のアクションを完了します。
これらの手順に従って、Basic Input/Output Section (BIOS)のボー・レートを変更します。
ILOMへのログイン
「Host Management」をクリックします。
「Host Control」をクリックします。
「Next Boot Device」オプションにBIOSを選択します。
「Save」をクリックします。
「Host Management」で「Power Control」をクリックします。
マシンを再起動します。
リモート・コンソールを起動します。
マシンの再起動後に、「Advance」タブを選択します。
「Serial Port Console Redirection」で「Enter」をクリックします。
「bits per second」値を115200に変更します。
終了して変更を保存してから、自動再起動の完了を待ちます。
次の手順によって、ILOMの設定を変更します。
ILOMへのログイン
「ILOM Administration」をクリックします。
「Connectivity」をクリックします。
「Serial port」タブをクリックします。
「Host Serial Port 」の「Baud Rate」値を115200に変更します。
「External Serial Port 」の「Baud Rate」値を115200に変更します。
「Save」をクリックします。
次の手順によってgrub.conf
ファイルを更新します。
編集のために、/boot/grub/grub.conf
ファイルを開きます。
kernel
で始まる行の最後に、次のテキストを追加します。
console=ttyS0,115200n8 console=tty1
編集される行に入力する例として、次を使用します。
kernel /vmlinuz-2.6.39-400.126.1.el5uek ro root=/dev/VolGroupSys/LogVolRoot rhgb pci=noaer crashkernel=256M@64M loglevel=7 panic=60 ipv6.disable=1 debug audit=1 intel_idle.max_cstate=1 nomce numa=off rhgb console=ttyS0,115200n8 console=tty1
変更をインスタンス化するために、編集済ファイルを保存してシステムを再起動します。
次の手順はオプションです。ILOMからコンソールを表示する場合は、次の手順を完了します。
ssh
で、ご使用のILOM IPアドレスのSSH接続を確立します。
root
ユーザーとしてログインします。
コマンドstart /SP/console
を実行します。
Are you sure you want to start /SP/console (y/n)?
プロンプトへの返答にy
を入力します。
コンソールを終了するには、[Esc]をクリックしてから、[Shift]キーを押しながら[9]
キーを押します。
仮想化システムで必要なシリアル・コンソールを設定するために、次のアクションを完了します。
これらの手順に従って、Basic Input/Output Section (BIOS)のボー・レートを変更します。
ILOMへのログイン
「Host Management」をクリックします。
「Host Control」をクリックします。
「Next Boot Device」オプションにBIOSを選択します。
「Save」をクリックします。
「Host Management」で「Power Control」をクリックします。
マシンを再起動します。
リモート・コンソールを起動します。
マシンの再起動後に、「Advance」タブを選択します。
「Serial Port Console Redirection」で「Enter」をクリックします。
「bits per second」値を115200に変更します。
終了して変更を保存してから、自動再起動の完了を待ちます。
次の手順によって、ILOMの設定を変更します。
ILOMへのログイン
「ILOM Administration」をクリックします。
「Connectivity」をクリックします。
「Serial port」タブをクリックします。
「Host Serial Port 」の「Baud Rate」値を115200に変更します。
「External Serial Port 」の「Baud Rate」値を115200に変更します。
「Save」をクリックします。
次の手順によってgrub.conf
ファイルを更新します。
編集のために、/boot/grub/grub.conf
ファイルを開きます。
kernel
で始まる行の最後に、次のテキストを追加します。
console=com1,vga com1=9600,8n1
編集される行に入力する例として、次を使用します。
kernel /xen.gz dom0_mem=4096M crashkernel=256M@64M console=com1,vga com1=9600,8n1
module
で始まる行の最後に、次のテキストを追加します。
console=hvc0
編集される行に入力する例として、次を使用します。
module /vmlinuz-2.6.39-400.126.1.el5uek ro root=UUID=6a9a3989-0aab-47b8-822e-0bdb43aba334 nohz=off intel_idle.max_cstate=1 pci=noaer loglevel=7 nomce panic=60 numa=off console=hvc0
変更をインスタンス化するために、編集済ファイルを保存してシステムを再起動します。
次の手順はオプションです。ILOMからコンソールを表示する場合は、次の手順を完了します。
ssh
で、ご使用のILOM IPアドレスのSSH接続を確立します。
root
ユーザーとしてログインします。
コマンドstart /SP/console
を実行します。
Are you sure you want to start /SP/console (y/n)?
プロンプトへの返答にy
を入力します。
コンソールを終了するには、[Esc]をクリックしてから、[Shift]キーを押しながら[9]
キーを押します。