この章には、変更の検証方法およびOracle Database Applianceの問題のトラブルシューティング方法に関する情報が記載されています。次の各項では、これらのタスクの一方または両方を実行する様々なツールについて説明します。
Oracle Appliance Managerの診断および検証ツールは、Oracle Appliance Managerのoakcli validate
コマンドで管理します。このツールは、サポートの問題を解決するための診断および検証機能を提供します。Oracle Database Applianceに問題が発生した場合、oakcli validate
コマンドを使用して、環境が適切に構成されていること、およびベスト・プラクティスが有効であることを確認します。サービス・リクエストを行う場合も、この章で説明している手順に従ってOracle Appliance Managerを使用し、Oracleサポート・サービスに送信するためのログ・ファイルを用意します。
注意: Oracle Appliance Managerの診断および検証ツールは、Oracle Database Appliance X3-2より前のハードウェアでは使用できません。 |
コマンドoakcli validate
を使用して、Oracle Database Applianceのステータスを検証します。oakcli validate
コマンドはroot
ユーザーとして実行する必要があります。
コマンドは次の構文を使用します。checklist
は1回のチェックまたはカンマ区切りリストのチェック、output_file_name
は検証出力ファイルに指定する名前です。
oakcli validate -h oakcli validate [-V | -l | -h] oakcli validate [-v] [-f output_file_name] [-a | -d | -c checklist]
検証ツール・オプションおよびシステム・チェックのサマリーは、次の2つの表を参照してください。
表7-1 Oracle Database Applianceの検証ツール・オプション
オプション | 目的 |
---|---|
|
|
|
カンマ区切りのチェックのリストを実行します。このコマンドを使用して、特定のチェックまたはチェックのリストを実行します。 |
|
デフォルトのシステム・チェックを実行します。デフォルトのシステム・チェックは、 |
|
出力ファイルを作成します。 |
|
ヘルプ情報を出力します。 |
|
すべてのシステム・チェック・オプションをリストし、オプションについて説明します。 |
|
詳細出力を行います。 |
|
検証ツール・バージョンを出力します。 |
表7-2 Oracle Database Applianceのシステム・チェック
チェック | 目的 |
---|---|
asr |
Oracle Auto Service Request (Oracle ASR)構成ファイルおよびOracle Integrated Lights Out Manager (Oracle ILOM)センサー・データに基づいて、Oracle ASRコンポーネントを検証します。 |
|
デプロイ済のシステム上で |
|
パブリックおよびプライベートのネットワーク・ハードウェア接続を検証します。注意: このオプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。 |
|
オペレーティング・システム・ディスクおよびファイル・システム情報を検証します。 |
|
共有ストレージおよびマルチパス情報を検証します。 |
|
外部JBOD (ストレージ・シェルフ)の接続を検証します。 |
|
Oracle ILOMセンサー・データの読取りに基づいて、システム・コンポーネントを検証します。 |
次のコマンドを実行すると、すべての検証コマンド・オプションとその説明が表示されます。
$ ./oakcli validate -l
次のコマンドでは、すべてのシステム・チェックを実行します。
$ ./oakcli validate -a
次のコマンドでは、ディスク測定のシステム・チェックを実行します。
$ ./oakcli validate -c DiskCalibration
次のコマンドでは、ハードウェア・システム・コンポーネントおよびOracle Database Applianceネットワーク・コンポーネントを検証するシステム・チェックを実行します。
$ ./oakcli validate -c SystemComponents,NetworkComponents
注意: NetworkComponents オプションは、Oracle Database Appliance X3-2より前のハードウェアで使用できません。 |
Oracle Database Applianceの構成中にエラーが発生した場合、次のメッセージおよび処置を確認してください。
Oracle Database Appliance 2.2へのアップグレードには、—infra
、—gi
および—database
という3つのオプションがあります。—infra
オプションには、Oracle Enterprise LinuxからOracle UEKへのアップグレードが含まれます。—infra
で2.2にアップグレードする前、オペレーティング・システムは11.2.0.2.x Grid Infrastructureを備えたOracle Enterprise Linuxです。—infra
でのアップグレード後、オペレーティング・システムは、Oracle UEK、およびOracle UEKと互換性のない11.2.0.2.x ACFSです。
たとえば、Oracle Linux 2.6.32-300.11.1.el5uekにアップグレードすると、reco.acfsvol.acfs
およびora.registry.acfs
が一時的にOFFLINE状態になります。これは、2.6.32-300.11.1.el5uekがOracle 11.2.0.2.x ACFSをサポートしていないためです。ただし、Oracle Grid Infrastructureを11.2.0.3.2にアップグレードすると、これらのコンポーネントは再度オンラインになります。
—gi
オプションを使用してOracle Database Appliance 2.2にアップグレードします。このバージョンのソフトウェアには、Oracle UEKと連携して動作するOracle ACFSモジュールが含まれるOracle Grid Infrastructure 11.2.0.3.2が含まれます。
詳細は、My Oracle Supportのノート1369107.1を参照してください。
https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=1369107.1
この項では、インストール中に発生する可能性があるOracle Integrated Lights Out Manager (Oracle ILOM)のトラブルシューティング問題について説明します。
Oracle ILOMの構成でエラーが発生した場合、次のタスクを最初に実行してください。
必要なJava Development Kit (JDK)バージョンがサーバーにインストールされていることを確認します。jdk-6u24-linux-i586.rpmなどの32ビットJDKが必要です。JDKをダウンロードするには、次のURLにアクセスしてください。http://www.oracle.com/technetwork/java/javase/downloads/index.html
.
環境をチェックして、リモート・コンソールが起動できるように、必要なJavaアプリケション(たとえば、Java Web Start、javaws
)がインストールされていることを確認します。
次に、Oracle Integrated Lights Out Managerリモート・コンソールの使用時に発生するメッセージを示します。
http://www.oracle.com/technetwork/java/javase/downloads/index.html
.
Oracleサポート・サービスのサポートが必要なシステム・フォルトが発生すると、ログ・レコードの提出が必要になる場合があります。oakcli manage diagcollect
コマンドを実行して、ログ・ファイル情報を収集します。このコマンドでは、Oracle Database Applianceに格納された複数のログ・ファイルの情報を、Oracleサポート・サービスが使用する単一のログ・ファイルに統合します。ファイルの場所は、コマンド出力で指定されます。
この項では、Oracle Database Applianceの問題の診断およびトラブルシューティングに使用するその他のツールおよびコマンドについて説明します(一部はOracle Database Appliance固有、それ以外のツールはすべてのクラスタ・システムに対応)。この項では、次のリソースについて説明します。
Oracle Appliance Managerでは、様々な高性能の監視ツールやレポート作成ツールにアクセスできますが、これらのツールには、独自の構文およびコマンド・セットを必要とするスタンドアロン・ツールから派生したものがあります。この項では、次に示すコマンドについて簡単に説明します(詳細は付録D「Oracle Appliance Managerコマンドライン・インタフェース」を参照)。
ORAchk
ORAchk構成監査ツールは、次のようなカテゴリでOracle RAC 2ノード・デプロイ用の重要な構成設定を監査します。
ディスク診断ツールを使用すると、ディスクの問題の原因を特定するのに役立ちます。このツールにより、ノードごとに14のディスク・チェックのリストが生成されます。ツールを実行するには、次のコマンドを入力します。
# /opt/oracle/oak/bin/oakcli stordiag e_shelf
_pd_
unit
配線検証ツール
Oracle Database Applianceのストレージを配線または再配線した後、Oracle Appliance Managerを使用してケーブルが正しく構成されていることをチェックします。(注意: このツールは、Oracle Database Appliance X3-2より前のハードウェアに適用できません。)新しく配線したOracle Database Applianceを起動した後、oakcli validate -c storagetopology
コマンドをroot
として実行します。仮想プラットフォームをデプロイした場合は、ODA_BASEからコマンドを実行します。ここで表示されている例に類似したコマンドから出力します。
# /opt/oracle/oak/bin/oakcli validate -c storagetopology INFO : ODA Topology Verification Utility v0.1 INFO : Check hardware type SUCCESS : Type of hardware found : V2 INFO : Check for Environment(Bare Metal or Virtual Machine) SUCCESS : Type of environment found : Bare Metal INFO : Check number of Controllers SUCCESS : Number of Internal LSI SAS controller found : 1 SUCCESS : Number of External LSI SAS controller found : 2 INFO : Check for Controllers correct PCIe slot address SUCCESS : Internal LSI SAS controller : 50:00.0 SUCCESS : External LSI SAS controller 0 : 30:00.0 SUCCESS : External LSI SAS controller 1 : 40:00.0 INFO : Check if JBOD powered on SUCCESS : 1JBOD : Powered-on INFO : Check for correct number of EBODS(2 or 4) SUCCESS : EBOD found : 2 INFO : Check for External Controller 0 SUCCESS : Controller connected to correct ebod number SUCCESS : Controller port connected to correct ebod port SUCCESS : Overall Cable check for controller 0 INFO : Check for External Controller 1 SUCCESS : Controller connected to correct ebod number SUCCESS : Controller port connected to correct ebod port SUCCESS : Overall Cable check for controller 1 INFO : Check for overall status of cable validation on Node SUCCESS : Overall Cable Validation on Node INFO : Check Node Identification status SUCCESS : Node Identification SUCCESS : Node name based on cable configuration found : NODE0
エラーがレポートされていないか出力を確認し、エラーがある場合は、システムを停止して指示どおりに再配線します。ケーブルの再配線後、Oracle Database Applianceを再起動してケーブル検証テストを再実行します。
トレース・ファイル・アナライザ(TFA)コレクタを使用すると、Oracle Clusterware/Grid InfrastructureおよびRACシステムでの診断データ収集が簡単になります。TFAの動作は、Oracle Clusterwareに同梱されているdiagcollectionユーティリティと似ています。どちらのツールも診断データを収集し、パッケージ化します。しかし、TFAは診断情報の収集を一元管理して自動化しているため、diagcollectionに比べてずっと強力です。
TFAには、次の主なメリットとオプションがあります。
単一ノードから実行される単一コマンドへの、すべてのクラスタ・ノード上のすべてのCRS/GIおよびRACコンポーネントに関する診断データ収集のカプセル化
データ・アップロード・サイズを削減するためにデータ収集時に診断ファイルを削減するオプション
一定期間および特定の製品コンポーネント(ASM、RDBMS、Clusterware)に対する診断データ収集を分離するオプション
Oracle Database Appliance内の単一ノードに対する収集された診断出力の一元管理(必要な場合)
すべてのログ・ファイルおよびトレース・ファイルでの問題を示す状態のオンデマンド・スキャン
問題を示す状態に関するリアルタイム・スキャン・アラート・ログ(DBアラート・ログ、ASMアラート・ログ、Clusterwareアラート・ログなど)
関連項目: 詳細は、My Oracle SupportのドキュメントID 1513912.1『TFA Collector- The Preferred Tool for Automatic or Ad Hoc Diagnostic Gathering Across All Cluster Nodes』を参照してください。 |
定期的な監視を行うことで、停止などのパフォーマンス問題を引き起こす問題を回避できることがあります。クラスタ状態モニター(CHM)および(OSWatcher)の2つは、Oracle Database Applianceでこの目的に使用できる非常に便利なツールです。
CHMは、クラスタウェアのパフォーマンスに関するリアルタイム・メトリックをリポジトリに格納します。CHMの詳細は、『Oracle Clusterware管理およびデプロイメント・ガイド』の付録H「Oracle Clusterwareのトラブルシューティング」を参照してください。
クラスタ状態モニター(CHM)データベースが大きくなりすぎると、次のようなエラーがコマンドの実行時に表示される場合があります。
CRS-9011-Error manage: Failed to initialize connection to the Cluster Logger Service
この問題を解決するには、次の手順を実行する必要があります。
両方のノードでコマンドdf -h /u01
をgrid
ユーザーとして実行します(次の例では、1つのノードについて例示)。
# df -h /u01 Filesystem Size Used Avail Use% Mounted on /dev/mapper/VolGroupSys-LogVolU01 97G 61G 32G 67% /u01
前の例のように、結果から/u01
パーティションがフル(60%)を超えていることがわかった場合は、両方のノードでls -lrth
コマンドを使用してGRID_HOMEのサイズをチェックし、crfclust.bdb
エントリの行の出力内容を調べます(次の例では、1つのノードについて例示)。
# cd /u01/app/11.2.0.3/grid/crf/db/oda1 # ls -lrth grep crfclust.bdb -rw-r----- 1 root root 31G Jan 13 08:28 crfclust.bdb
両方のノードで、crfclust.bdb
のサイズ(ステップ2を参照)がdf -h
コマンドの出力結果に示されたサイズ(ステップ1を参照)よりも大きい場合は、次の2つの手順を実行します。
いずれかのノードにgrid
ユーザーとしてログインした状態で、CHMリポジトリ・データベースのサイズを変更します(次の例を参照)。
# oclumon manage -repos resize 259200 oda1 --> retention check successful oda2 --> retention check successful New retention is 259200 and will use 4516300800 bytes of disk space CRS-9115-Cluster Health Monitor repository size change completed on all nodes.
grid
ユーザーとして各ノードに順にログインし、ora.crf
リソースを再起動します(次の例では、1つのノードについてのみ例示)。
# crsctl stop res ora.crf -init CRS-2673: Attempting to stop 'ora.crf' on 'oda1' CRS-2677: Stop of 'ora.crf' on 'oda1' succeeded # crsctl start res ora.crf
(最初にステップ1で実行したように)両方のノードでコマンドdf -h /u01
をgrid
ユーザーとして再実行し、問題が解決したことを確認します。問題が解決されない場合は、My Oracle Supportノート1574492.1および1343105.1を参照してください。
OSWatcherは、オペレーティング・システムからパフォーマンス・メトリックを取得します。特定タイプの問題の診断に役立てるためにOSWatcherレポートを提供するようにOracleサポートから依頼されることがあります。OSWatcherの詳細は、Oracleサポート・ノート301137.1 (https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&id=301137.1
)を参照してください。
Oracle Database Applianceハードウェア監視ツールでは必要に応じて、Oracle Database Applianceサーバー・ノードで、ハードウェア・コンポーネントの状態を監視します。ハードウェア監視は、サーバー・ノードのすべてのハードウェア・コンポーネントの状態を問い合わせます。ベア・メタル・システムおよび仮想化システムで、このツールを使用します。
oakcli show -h
コマンドの出力で、監視対象のコンポーネントの一覧を参照してください(便宜上、次の一覧に表示されています)。
サーバー
プロセッサ
メモリー
電源装置
冷却装置
ネットワーク
ストレージ・エンクロージャ
Oracle Database Applianceハードウェア監視ツールでレポートされた情報は、コマンドを実行したノードのみを対象としています。出力の詳細は、表示するように選択したコンポーネントによって異なります。次の例は、現行ノードにおける電源装置サブシステムの出力を表示しています。
oakcli show power NAME HEALTH HEALTH DETAILS PART_NO. SERIAL_NO. LOCATION INPUT POWER OUTPUT POWER INLET TEMP EXHAUST TEMP Power Supply_0 OK - 7047410 476856F+1242CE0020 PS0 Present 88 watts 31.250 degree C 34.188 degree C Power Supply_1 OK - 7047410 476856F+1242CE004J PS1 Present 66 watts 31.250 degree C 34.188 degree C
注意: Oracle Database Appliance仮想化プラットフォームでのODA_BASEの初回起動時、Oracle Database Appliance Serverハードウェア監視ツールは有効になっており、基本的な統計を約5分間収集します。その際に、「Gathering Statistics…」というメッセージが表示されます。 |
この項の手順は、シリアル・コンソールを構成して起動に関する問題を解決するようにOracleサポートからアドバイスされた場合にのみ実行してください。ご使用のシステム構成(ベア・メタルまたはOracle Database Appliance仮想化プラットフォーム)に基づいて、この項の手順を使用します。
注意: この項の内容は、Oracle Database Appliance X3-2およびOracle Database Appliance X4-2に関するものです。 |
ベア・メタル・システムに必要なシリアル・コンソールを設定するために、次のアクションを完了します。
これらの手順に従って、Basic Input/Output Section (BIOS)のボー・レートを変更します。
ILOMへのログイン
「Host Management」をクリックします。
「Host Control」をクリックします。
「Next Boot Device」オプションにBIOSを選択します。
「Save」をクリックします。
「Host Management」で「Power Control」をクリックします。
マシンを再起動します。
リモート・コンソールを起動します。
マシンの再起動後に、「Advance」タブを選択します。
「Serial Port Console Redirection」で「Enter」をクリックします。
「bits per second」値を115200に変更します。
終了して変更を保存してから、自動再起動の完了を待ちます。
次の手順によって、ILOMの設定を変更します。
ILOMへのログイン
「ILOM Administration」をクリックします。
「Connectivity」をクリックします。
「Serial port」タブをクリックします。
「Host Serial Port 」の「Baud Rate」値を115200に変更します。
「External Serial Port 」の「Baud Rate」値を115200に変更します。
「Save」をクリックします。
次の手順によってgrub.conf
ファイルを更新します。
編集のために、/boot/grub/grub.conf
ファイルを開きます。
kernel
で始まる行の最後に、次のテキストを追加します。
console=ttyS0,115200n8 console=tty1
編集される行に入力する例として、次を使用します。
kernel /vmlinuz-2.6.39-400.126.1.el5uek ro root=/dev/VolGroupSys/LogVolRoot rhgb pci=noaer crashkernel=256M@64M loglevel=7 panic=60 ipv6.disable=1 debug audit=1 intel_idle.max_cstate=1 nomce numa=off rhgb console=ttyS0,115200n8 console=tty1
変更をインスタンス化するために、編集済ファイルを保存してシステムを再起動します。
次の手順はオプションです。ILOMからコンソールを表示する場合は、次の手順を完了します。
ssh
で、ご使用のILOM IPアドレスのSSH接続を確立します。
root
ユーザーとしてログインします。
コマンドstart /SP/console
を実行します。
Are you sure you want to start /SP/console (y/n)?
プロンプトへの返答にy
を入力します。
コンソールを終了するには、[Esc]をクリックし、次に[Shift]を押しながら[9]キーをクリックします。
仮想化システムで必要なシリアル・コンソールを設定するために、次のアクションを完了します。
これらの手順に従って、Basic Input/Output Section (BIOS)のボー・レートを変更します。
ILOMへのログイン
「Host Management」をクリックします。
「Host Control」をクリックします。
「Next Boot Device」オプションにBIOSを選択します。
「Save」をクリックします。
「Host Management」で「Power Control」をクリックします。
マシンを再起動します。
リモート・コンソールを起動します。
マシンの再起動後に、「Advance」タブを選択します。
「Serial Port Console Redirection」で「Enter」をクリックします。
「bits per second」値を115200に変更します。
終了して変更を保存してから、自動再起動の完了を待ちます。
次の手順によって、ILOMの設定を変更します。
ILOMへのログイン
「ILOM Administration」をクリックします。
「Connectivity」をクリックします。
「Serial port」タブをクリックします。
「Host Serial Port 」の「Baud Rate」値を115200に変更します。
「External Serial Port 」の「Baud Rate」値を115200に変更します。
「Save」をクリックします。
次の手順によってgrub.conf
ファイルを更新します。
編集のために、/boot/grub/grub.conf
ファイルを開きます。
kernel
で始まる行の最後に、次のテキストを追加します。
console=com1,vga com1=9600,8n1
編集される行に入力する例として、次を使用します。
kernel /xen.gz dom0_mem=4096M crashkernel=256M@64M console=com1,vga com1=9600,8n1
module
で始まる行の最後に、次のテキストを追加します。
console=hvc0
編集される行に入力する例として、次を使用します。
module /vmlinuz-2.6.39-400.126.1.el5uek ro root=UUID=6a9a3989-0aab-47b8-822e-0bdb43aba334 nohz=off intel_idle.max_cstate=1 pci=noaer loglevel=7 nomce panic=60 numa=off console=hvc0
変更をインスタンス化するために、編集済ファイルを保存してシステムを再起動します。
次の手順はオプションです。ILOMからコンソールを表示する場合は、次の手順を完了します。
ssh
で、ご使用のILOM IPアドレスのSSH接続を確立します。
root
ユーザーとしてログインします。
コマンドstart /SP/console
を実行します。
Are you sure you want to start /SP/console (y/n)?
プロンプトへの返答にy
を入力します。
コンソールを終了するには、[Esc]をクリックし、次に[Shift]を押しながら[9]キーをクリックします。