プライマリ・コンテンツに移動
Oracle® Grid Infrastructureインストレーション・ガイド
12cリリース1 (12.1) for Linux
B71324-15
  目次へ移動
目次
索引へ移動
索引

前
 
次
 

A Oracle Grid Infrastructureのインストール・プロセスに関するトラブルシューティング

この付録では、Oracle Grid Infrastructureのインストールに関するトラブルシューティング情報について説明します。


関連項目:

ドキュメント・ディレクトリに含まれるOracle Database 12cリリース1 (12.1) Oracle RACのドキュメントを参照してください。
  • 『Oracle Clusterware管理およびデプロイメント・ガイド』

  • 『Oracle Real Application Clusters管理およびデプロイメント・ガイド』


この付録の内容は次のとおりです。

A.1 Oracleサポートに連絡する際のベスト・プラクティス

Oracleサポートに連絡して問題を報告する必要がある場合は、サービス・リクエストを入力するときに次のガイドラインに従うことをお薦めします。

  • 問題の明確な説明(正確なエラー・メッセージを含む)を提供します。

  • 問題のトラブルシューティングを行うために実行した手順と、この手順の結果の説明を提供します。

  • 影響を受けたソフトウェアの正確なバージョン(メジャー・リリースとパッチ・リリース)を提供します。

  • Oracleサポートが問題を再現できるように、問題が発生したときに実行した処置の段階ごとの手順を提供します。

  • 問題の影響の評価(影響を受けた最終期限およびコストを含む)を提供します。

  • スクリーンショット、ログ、Remote Diagnostic Agent (RDA)出力などの関連情報を提供します。

A.2 一般的なインストールの問題

次に、インストール中に発生する可能性のある様々なエラーの例を示します。内容は次のとおりです。

root.shが途中で異常終了し、「リソース'ora.cluster_interconnect.haip'の起動に失敗しました」などのエラー・メッセージが表示される
原因: Oracle RAC用のパブリックおよびプライベートのネットワーク・インタフェースを構成するときは、ARPを有効にする必要があります。高可用性IP (HAIP)アドレスはパブリック・ネットワーク上のARPを必要としませんが、VIPフェイルオーバーを行うにはARPの有効化が必要になります。NOARPを構成しないでください。
処置: hsi0 (またはeth)デバイスがARPプロトコルを使用するように、次のコマンドを実行して構成します。
# ifconfig hsi0 arp
Oracle Clusterwareのインストール中に、Oracle ASMディスクの有無のチェックに失敗して「PRVF-5150 : パス/dev/mapper/<alias>は、すべてのノードで有効なパスではありません。」というエラーが発生する
原因: このエラーはRed Hat Enterprise Linux 6.3で発生することがあり、その原因は/etc/multipath.confファイルに対する読取りアクセス権が設定されていないことです。
処置: これを解決するには、rootとして次のとおりに+rを/etc/multipath.confに追加します。
#chmod +r /etc/multipath.conf
ディスクの取得中にエラーが発生する
原因: 存在しないOracleホームを指しているエントリが/etc/oratabにあります。OUIのログ・ファイルには、エラーが「java.io.IOException: /home/oracle/OraHome//bin/kfod: 見つかりませんでした」のように出力されます。
処置: 存在しないOracleホームを指しているエントリを/etc/oratabから削除してください。
CRS-5018:(: CLSN00037:)未使用のHAIPルートが削除された
原因: 通常、HAIPコードと競合しているルートがなんらか(通常、ゼロ構成ネットワークzeroconf)によって作成されたことを示します。適切なスタックが機能していることを確認するためにOracleソフトウェアがルートを削除したことを示します。
処置: ゼロ構成ネットワーク機能によってクラスタ・メンバー・ノード間で通信の問題が発生する可能性があるため、Oracle Clusterwareの使用時にはこの機能を無効にする必要があります。

ゼロ構成ネットワークを無効にするには、次の手順を実行します。

  1. rootとしてログインします。

  2. /etc/sysconfigに移動します。

  3. /etc/sysconfig/networkのコピーを作成します。次に例を示します。

    # cp network network_old
    
  4. テキスト・エディタを使用してファイル/etc/sysconfig/networkを開きます。

  5. ファイルのNOZEROCONFの値がyesに設定されていることを確認します。ファイルにこのパラメータが見つからない場合は、次のエントリをファイルに追加します。

    NOZEROCONF=yes
    

    この設定を更新した後、ファイルを保存します。

  6. ネットワーク・サービスを再起動します。次に例を示します。

    # service network restart
    
  7. 各クラスタ・ノード・メンバーに対してこの手順を繰り返します。

/usr/X11R6/bin/xdpyinfoコマンドを使用して表示色の自動チェックを実行できない
原因: DISPLAY変数が設定されていないか、インストールを実行しているユーザーにX Windowを開く権限がありません。これは、リモート端末からインストールを実行している場合や、ディスプレイ上でX Windowを開く権限のあるユーザーからX Windowを開く権限のないユーザー・アカウントへsuコマンドを使用して変更している場合(rootユーザーのコンソール・ディスプレイで低い権限のユーザーがウィンドウを開いている場合など)に起こります。
処置: echo $DISPLAYコマンドを使用して、環境変数に正しいディスプレイ、つまり正しいホストが設定されていることを確認してください。DISPLAY変数が正しく設定されていたら、X Windowを開く権限のあるユーザーでログインしていることを確認するか、またはxhost +コマンドを実行してすべてのユーザーにX Windowを開く許可を与えてください。

サーバー・コンソール上でrootとしてローカルでログインし、su -コマンドを使用してOracle Grid Infrastructureのインストール所有者に変更した場合は、サーバーからログアウトし、Gridのインストール所有者としてログインしなおしてください。

CRS-5823: エージェント・フレームワークを初期化できない
原因: root.shを実行したとき、Oracle Grid Infrastructureのインストールが失敗しました。ローカル・ホスト・エントリがhostsファイルから欠落しているため、Oracle Grid Infrastructureは起動に失敗しました。

Oracle Grid Infrastructureのalert.logファイルには、次のように示されます。

[/oracle/app/grid/bin/orarootagent.bin(11392)]CRS-5823:Could not initialize
agent framework. Details at (:CRSAGF00120:) in
/oracle/app/grid/log/node01/agent/crsd/orarootagent_root/orarootagent_root.log
2010-10-04 12:46:25.857
[ohasd(2401)]CRS-2765:Resource 'ora.crsd' has failed on server 'node01'.

crsdOUT.logファイルを確認し、次を見つけることで、これが原因であることを検証できます。

Unable to resolve address for localhost:2016
ONS runtime exiting
Fatal error: eONS: eonsapi.c: Aug 6 2009 02:53:02
処置: hostsファイルにローカル・ホスト・エントリを追加します。
サーバーに接続できない(サーバーによって接続を拒否されたか、または表示を開くことができない)
原因: これらは、xhostが適切に構成されていない場合か、Xサーバーを起動するためにstartxコマンドで使用したアカウントとは異なるユーザー・アカウントで実行している場合の、WindowsまたはUNIXシステムに特有のX Window表示エラーです。
処置: ローカル端末ウィンドウで、X Windowセッションを開始したユーザーとしてログインし、次のコマンドを入力してください。

$ xhost fullyqualifiedRemoteHostname

次に例を示します。

$ xhost somehost.example.com

その後、次のコマンドを入力してください。workstationnameはワークステーションのホスト名またはIPアドレスです。

Bourne、BashまたはKornシェル:

$ DISPLAY=workstationname:0.0
$ export DISPLAY

X Windowアプリケーションがローカル・システムで適切に表示されるかどうかを確認するには、次のコマンドを入力します。

$ xclock

モニターにXクロックが表示されます。xclockを使用できない場合、これをシステムにインストールし、テストを繰り返します。xclockがシステムにインストールされているにもかかわらず、ディスプレイ上にXクロックを表示できない場合、xhostコマンドの使用は制限される可能性があります。

VNCクライアントを使用してサーバーにアクセスしている場合は、インストールに使用しようとしているユーザーに割り当てられているビジュアルにアクセスしていることを確認します。たとえば、suコマンドを使用して、別のユーザー・ビジュアルでインストール所有者になった場合、xhostコマンドの使用は制限され、xhostコマンドを使用して表示を変更することはできません。インストール所有者に割り当てられたビジュアルを使用すると、正しく表示でき、xclockコマンドの入力によってxclockがディスプレイに表示されます。

Xクロックが表示されたら、Xクロックを閉じてインストーラを再度起動します。

ocrconfigを初期化できない
原因: /etc/fstabファイル内のNFS用に構成されたオプションが間違っています。

これを確認するには、Grid_home/log/nodenumber/clientパスにあるocrconfig.logファイルをチェックし、次の行を検索します。

/u02/app/crs/clusterregistry, ret -1, errno 75, os err string Value too large
for defined data type
2007-10-30 11:23:52.101: [ OCROSD][3085960896]utopen:6'': OCR location
処置: NFSにマウントされたファイル・システムの場合は、NFSマウントの正しいマウント構成を/etc/fstabファイル内で指定します。
rw,sync,bg,hard,nointr,tcp,vers=3,timeo=300,rsize=32768,wsize=32768,actimeo=0

注意:

マウントの指定にnetdevvers=2を含めないでください。netdevオプションを必要とするのは、OCFSファイル・システムを対象とした場合のみであり、vers=2を指定すると、カーネルによって強制的にNFSがマウントされます(この場合、以前のバージョン2のプロトコルが使用されます)。

NFSマウント情報を修正した後にNFSマウント・ポイントを再マウントし、root.shスクリプトを再度実行します。たとえば、マウント・ポイント/u02の場合は次のようになります。

#umount /u02
#mount -a -t nfs
#cd $GRID_HOME
#sh root.sh
INS-32026 INSTALL_COMMON_HINT_DATABASE_LOCATION_ERROR
原因: クラスタ用のインストールでGridホームに選択した場所が、Oracleベース・ディレクトリの下にあります。
処置: クラスタ用Oracle Grid Infrastructureのインストールでは、Gridホームを、Oracleベース・ディレクトリ、Oracle Databaseインストール所有者のOracleホーム・ディレクトリ、インストール所有者のホーム・ディレクトリのいずれの下にも配置しないでください。インストール中に、Gridホームへのパスの所有権がrootに変更されます。この変更により、他のインストールで権限エラーが発生します。また、Oracle Clusterwareソフトウェア・スタックも、Oracleベース・パスの下に配置しないでください。
CLSRSC-444: ノードのOUIセッションでroot.shコマンドを実行します
原因: このメッセージが表示され、OUIを実行していないノードがリストされる場合、root.shスクリプトの実行が完了する間または前に、示されたノードシャットダウンされた可能性があります。
処置: クラスタの他のすべてのメンバー・ノードでroot.shスクリプトの実行を完了させ、エラー・メッセージに示されたノードではrootスクリプトを実行しないようにします。Oracle Grid Infrastructureが計画しているクラスタ・メンバー・ノードのセットですべてまたは一部完了したら、OUIを起動し、エラーに示されているノードで、失敗したOracle Grid Infrastructureのインストールをアンインストールします。そのノードから失敗したインストールをアンインストール後、そのノードを手動でクラスタに追加します。

関連項目:

ノードを追加する方法の詳細は、『Oracle Clusterware管理およびデプロイメント・ガイド』を参照してください。

MEMORY_TARGETはこのシステムではサポートされていない
原因: Linuxシステムでは、PGAおよびSGA用の/dev/shmのサイズが不十分です。

Linuxシステムにインストールする場合は、初期化パラメータMEMORY_TARGETまたはMEMORY_MAX_TARGETを設定する「メモリー・サイズ(SGAおよびPGA)」をオペレーティング・システムの共有メモリー・ファイル・システム(/dev/shm)より大きい値にはできません。

処置: /dev/shmマウント・ポイントのサイズを大きくしてください。次に例を示します。
# mount -t tmpfs shmfs -o size=4g /dev/shm

また、システムを再起動してもこの変更が保持されるようにするには、/etc/fstabに次のようなエントリを追加します。

shmfs /dev/shm tmpfs size=7g 0 0 
OUIのノードの選択画面で選択可能なノードがない
原因: Oracle Grid Infrastructureがインストールされていないか、またはOracle Grid Infrastructureサービスが起動および実行されていません。
処置: Oracle Grid Infrastructureをインストールするか、またはインストールの状態を確認してください。また、ノードを再起動すると問題を解決できる場合があります。
ノードnodenameに到達できない
原因: IPホストが使用不可能です。
処置: 次の手順を実行してください。
  1. シェル・コマンドifconfig -aを実行します。このコマンドの出力と/etc/hostsファイルの内容を比較して、ノードIPがリストされていることを確認します。

  2. シェル・コマンドnslookupを実行して、ホストが到達可能であるかどうかを確認します。

PROT-8: 指定したファイルからクラスタ・レジストリにデータをインポートできない
原因: 既存のOracle Cluster Registryデバイスのパーティションに十分な領域がないため、rootupgrade.shの実行中に移行障害が発生します。確認するには、ログ・ファイル$GRID_HOME/log/hostname/client/ocrconfig_pid.logでエラー「utopen:12:Not enough space in the backing store」を検索してください。pidはプロセスIDです。
処置: 400MB以上の使用可能な領域があるストレージ・デバイスを指定します。ディスク全体をOracle ASMに割り当てることをお薦めします。
PRVE-0038: SSH LoginGraceTime設定(致命的: 認証前にタイムアウトした)
原因: PRVE-0038: ノードnodenameのSSH LoginGraceTime設定では、ユーザーがログイン完了前に切断される可能性があります。このエラーは、SSH接続のデフォルトのタイムアウト値が低すぎるか、LoginGraceTimeパラメータがコメント・アウトされているために発生します。
処置: OpenSSH構成ファイル/etc/ssh/sshd_configのLoginGraceTimeパラメータのコメントを解除し、値に0(無制限)を設定することをお薦めします。
CRSスタックの起動の待機中にタイムアウトした
原因: 構成の問題によってOracle Grid Infrastructureソフトウェアをすべてのノードに正常にインストールできない場合は、CRSスタックの起動の待機中にタイムアウトしたことを示すエラー・メッセージが表示される場合があります。または、インストーラを終了した後、Oracle Clusterwareで管理するリソースが一部のノードで作成されなかったことに気がつく場合があります。リソースのステータスがONLINE以外であることに気がつく場合もあります。
処置: バイナリを削除せずにOracle Grid Infrastructureインストールの構成を解除し、構成の問題の原因を判断するためにログ・ファイルを確認します。構成の問題を解決した後、インストール時に使用するスクリプトを再実行し、Oracle Clusterwareを構成します。
YPBINDPROC_DOMAIN: ドメインがバインドされない
原因: このエラーは、インストール後のテスト時に、ノードのパブリック・ネットワーク・インターコネクトが取り外され、VIPによるフェイルオーバーが行われない場合に発生する可能性があります。このエラーでは、ノードがハングし、ユーザーはシステムにログインできなくなります。このエラーは、Oracleホーム、listener.ora、Oracleログ・ファイルまたはアクション・スクリプトがNASデバイスまたはNFSマウントに格納されていて、ネーム・サービス・キャッシュ・デーモンnscdがアクティブになっていない場合に発生します。
処置: クラスタ内のすべてのノードで次のコマンドを入力して、nscdサービスを起動してください。
/sbin/service  nscd start

A.2.1 その他のインストールの問題およびエラー

エラー・メッセージの解決に関するその他のヘルプについては、My Oracle Supportを参照してください。たとえば、Doc ID 1367631.1のNoteには、Oracle Grid InfrastructureおよびOracle Clusterwareの最も一般的なインストールの問題の一部が含まれています。

A.3 詳細モードによるCVUの「不明」出力メッセージの解釈

-verbose引数を使用してクラスタ検証ユーティリティを実行し、特定のノードに対するクラスタ検証ユーティリティ・コマンドの結果がUNKNOWNになる場合、その原因は、検証時に問題が検出されたかどうかをクラスタ検証ユーティリティで判断できないことにあります。結果が「不明」になる場合の、考えられる原因を次に示します。

  • ノードが停止している。

  • クラスタ検証ユーティリティで必要な、オペレーティング・システムの共通コマンド・バイナリが、Oracle Grid Infrastructureホームの/binディレクトリまたはOracleホーム・ディレクトリで不足している。

  • クラスタ検証ユーティリティを起動したユーザー・アカウントには、ノードでオペレーティング・システムの共通コマンドを実行する権限がない。

  • ノードで、オペレーティング・システム・パッチ、または必須パッケージが不足している。

  • ノードの最大プロセス数または最大オープン・ファイル数を超えているか、共有メモリー、セマフォなど、IPCセグメントに問題が発生している。

A.4 Oracle Grid Infrastructureの設定に関するCVUメッセージの解釈

Oracle Grid Infrastructureをインストールするための要件をシステムが満たしていないことがクラスタ検証ユーティリティ(CVU)のレポートに示された場合は、この項の説明に従ってレポートに示されている問題を解決し、CVUを再実行します。

「ユーザーのユーザー等価チェックが失敗しました。」
原因: すべてのノード間でユーザー等価関係の設定に失敗しました。必要なユーザーが作成されていないか、またはセキュア・シェル(SSH)構成が適切に完了していないことが原因である可能性があります。
処置: クラスタ検証ユーティリティによって、ユーザー等価関係の設定に失敗したノードのリストが表示されます。

失敗したノードと示されている各ノードに対して、ユーザー構成およびSSH構成が正常に完了していることをインストール所有者のユーザー構成で確認してください。Oracle Clusterwareのインストールを実行するユーザーには、SSH接続を作成する権限が必要です。

SSHの構成は、OUIのSSH構成オプションで行うことをお薦めします。手動でSSHの構成を行う場合はインストール前に、インストールのためにSSHが構成済の場合はインストール後に、クラスタ検証ユーティリティを使用できます。

たとえば、ユーザー・アカウントoracleのユーザー等価関係を確認するには、su - oracleコマンドを使用し、dateコマンド引数を指定したsshコマンドを次の構文を使用してローカル・ノードで実行し、ユーザー等価関係を手動で確認します。

$ ssh nodename date

このコマンドによって、nodenameに指定した値で指定されたリモート・ノードのタイムスタンプが出力されます。パスワードを求められた場合、SSHの構成を行う必要があります。デフォルトの場所(/usr/binディレクトリ)にsshがある場合は、sshを使用してユーザー等価関係を構成します。ユーザー等価関係は、rshを使用しても確認できます。

SSHを使用してdateコマンドを入力した際に次のメッセージが表示された場合、この問題はユーザー等価関係エラーが原因である可能性があります。

The authenticity of host 'node1 (140.87.152.153)' can't be established.
RSA key fingerprint is 7z:ez:e7:f6:f4:f2:4f:8f:9z:79:85:62:20:90:92:z9.
Are you sure you want to continue connecting (yes/no)?

「yes」と入力してクラスタ検証ユーティリティを実行し、ユーザー等価関係エラーが解決されたかどうかを確認します。

sshがデフォルト(/usr/bin)以外の場所にある場合は、クラスタ検証ユーティリティによって、ユーザー等価関係の検証に失敗したことがレポートされます。このエラーを回避するには、Grid_home/cv/adminディレクトリに移動し、テキスト・エディタでcvu_configファイルを開き、ORACLE_SRVM_REMOTESHELLキーを追加または更新してシステム上のsshパスの位置を指定します。次に例を示します。

# Locations for ssh and scp commands
ORACLE_SRVM_REMOTESHELL=/usr/local/bin/ssh
ORACLE_SRVM_REMOTECOPY=/usr/local/bin/scp

cvu_configファイルを変更する場合は、次の規則に注意します。

  • キー・エントリはname=value構文で指定する。

  • キーに割り当てる各キー・エントリおよび値は適切なものを1のみ定義する。

  • シャープ記号(#)で始まる行はコメント行であり、無視される。

  • name=valueという構文に従っていない行は無視される。

パス設定の変更後、再度クラスタ検証ユーティリティを実行します。また、sshがデフォルト以外の場所にある場合は、リモート・シェルおよびリモート・コピー・コマンドに別の場所を指定するために引数を追加してOUIを起動する必要があります。これらの引数の使用方法の詳細を表示するには、runInstaller -helpを入力してください。


注意:

ユーザーまたはOUIがsshまたはrshコマンド(ログインや起動するその他のシェル・スクリプトを含む)を実行し、それらのスクリプトによって出力が行われると、無効な引数または標準の入力に関するエラーが表示されます。これらのエラーの原因を解決する必要があります。

エラーを回避するには、sshまたはrshコマンドを実行すると出力を生成する、oracleユーザーのログイン・スクリプトからすべてのコマンドを削除してください。

X11転送についてのメッセージが表示された場合は、第6.2.4項「リモート表示およびX11転送の構成の設定」のタスクを完了し、この問題を解決します。

次のようなエラーが出力される場合もあります。

stty: standard input: Invalid argument
stty: standard input: Invalid argument

これらのエラーは、システム上の隠しファイル(.bashrc.cshrcなど)にsttyコマンドが含まれている場合に発生します。このエラーが表示された場合は、第6.2.5項「端末出力コマンドが原因のインストール・エラーの回避」を参照してこれらの問題の原因を解決してください。


「ノードからのノード到達可能性チェックが失敗しました。」または「ノード接続性チェックが失敗しました。」
原因: クラスタ内に、TCP/IPプロトコルを使用したパブリックまたはプライベート・インターコネクトで到達できない1つ以上のノードがあります。
処置: /bin/ping addressコマンドを使用して、各ノードのアドレスを確認してください。到達できないアドレスを発見した場合は、パブリックおよびプライベート・アドレスのリストを確認して、それらを正しく構成してください。サード・パーティ・ベンダーのクラスタウェアを使用する場合に役立つ情報については、そのベンダーのドキュメントを参照してください。パブリック・ネットワーク・インタフェースおよびプライベート・ネットワーク・インタフェースのインタフェース名は、クラスタ内の各ノードで同じである必要があります。
「ユーザーの存在チェックが失敗しました。」または「ユーザーとグループの関係チェックが失敗しました」
原因: インストールに必要なユーザーおよびグループの管理権限が付与されていないか、または正しくありません。
処置: 各ノードでidコマンドを使用して、インストール所有者ユーザー(gridoracleなど)が正しいグループ・メンバーシップで作成されていることを確認してください。必要なグループを作成していることを確認し、影響のあるノードでユーザー・アカウントを作成または変更して、必要なグループ・メンバーシップを設定してください。

関連項目:

必要なグループの作成方法およびインストール所有者ユーザーの構成方法については、6.1項「Oracle Grid Infrastructureのグループ、ユーザーおよびパスの作成」を参照してください。

A.5 Oracle Clusterwareアラート・ログについて

Oracle Clusterwareは、Oracle Database障害診断インフラストラクチャを使用して診断データとアラート・ログを管理します。このため、ほとんどの診断データは自動診断リポジトリ(ADR)(インストール時に指定したベース・ディレクトリ内のディレクトリとファイルのコレクション)に含まれます。Oracle Clusterware 12cリリース1 (12.1.0.2)以降、Oracle Clusterwareプログラムによって書き込まれる診断データ・ファイルは、トレース・ファイルと呼ばれ、.trcファイル拡張子が付けられて、ADRホームのtraceサブディレクトリにまとめられます。トレース・ファイルの他に、Oracle Clusterware ADRホームのtraceサブディレクトリには単純なテキストのOracle Clusterwareアラート・ログが含まれます。名前は常にalert.logです。アラート・ログは、ADRホームのalertサブディレクトリにXMLファイルとしても書き込まれますが、テキスト・アラート・ログは簡単に読むことができます。

深刻なエラーを見つけるには、まずOracle Clusterwareのアラート・ログを見ます。エラーが発生すると、エラーの原因に関する具体的な情報がある診断ログのパス情報が含まれていることがあります。

重要なイベントが発生した場合には、インストール後に、Oracle Clusterwareがアラート・メッセージを書き込みます。たとえば、クラスタ・レディ・サービス・デーモン・プロセス(CRSD)が起動した場合、中断された場合、フェイルオーバー・プロセスが失敗した場合、またはOracle Clusterwareリソースの自動再起動が失敗した場合などに、CRSデーモン・プロセスからのアラート・メッセージが表示されます。

Oracle Enterprise ManagerはOracle Clusterwareのログ・ファイルを監視し、エラーが検出されると「クラスタ・ホーム」ページにアラートを書き込みます。たとえば、投票ファイルが利用できない場合はCRS-1604エラーが発生し、「クラスタ・ホーム」ページにクリティカル・アラートが書き込まれます。「メトリックとポリシー設定」ページで、エラー検出とアラートの設定をカスタマイズできます。

Oracle Clusterwareのログ・ファイルの場所は、ORACLE_BASE/diag/crs/hostname/crs/trace/alert.logです(ORACLE_BASEはOracle Grid Infrastructureのインストール時に指定したOracleベース・パス、hostnameはホストの名前です)。


関連項目:

  • Oracle Clusterwareのトラブルシューティングの詳細は、『Oracle Clusterware管理およびデプロイメント・ガイド』を参照してください。

  • Oracle Database診断データを管理する自動診断リポジトリ・コマンド・インタプリタ(ADRCI)ユーティリティの詳細は、Oracle Databaseユーティリティ・ガイドを参照してください。

  • 診断データの管理の詳細は、『Oracle Database管理者ガイド』を参照してください。


A.6 Linuxでのオペレーティング・システム・パッケージの不足

Oracle Grid Infrastructure、Oracle RACまたはOracle Databaseのインストール時に次のようなエラー・メッセージが表示された場合は、システムのオペレーティング・システム・パッケージが不足しています。

libstdc++.so.5: cannot open shared object file: No such file or directory
libXp.so.6: cannot open shared object file: No such file or directory

不足しているパッケージはインストール中に見つかり、このようなエラーは発生しないはずです。動作保証されていないオペレーティング・システムのディストリビューションを使用しているか、以前のバージョンのクラスタ検証ユーティリティを使用していることを示している可能性があります。

Red Hatネットワーク、Oracle Unbreakable LinuxサポートなどのLinuxサポート・ネットワークが構成されている場合は、up2dateコマンドを使用してパッケージの名前を確認できます。次に例を示します。

# up2date --whatprovides libstdc++.so.5
compat-libstdc++-33.3.2.3-47.3

また、クラスタ検証ユーティリティの最新バージョンをダウンロードして、必要なパッケージの最新リストを入手してください。最新バージョンは、次のURLから入手できます。

http://www.oracle.com/technetwork/database/options/clustering/downloads/cvu-download-homepage-099973.html

A.7 Oracle Grid Infrastructureのインストール中のクラスタ診断の実行

インストーラで「ノードの選択」ページが表示されない場合は、次のコマンド構文を使用してクラスタ・マネージャの整合性を検証します。

cluvfy comp clumgr -n node_list -verbose

前述の構文例で、node_list変数は、クラスタ内のノードのカンマ区切りリストです。


注意:

cronジョブの実行中または実行後に予期しないインストール・エラーが発生した場合は、インストールが完了する前にcronジョブによって一時ファイルが削除されている可能性があります。日常のcronジョブを実行する前にインストールを完了するか、インストールが完了するまで、クリーンアップを行う日常のcronジョブを無効にすることをお薦めします。

A.8 インストール後のCVUのクラスタ・ヘルス・チェックの使用について

Oracle Grid Infrastructure 11gリリース2(11.2.0.3)以上では、クラスタ検証ユーティリティ(CVU)のhealthcheckコマンド・オプションを使用してOracle ClusterwareおよびOracle Databaseインストールをチェックし、必須要件およびベスト・プラクティス・ガイドラインへの適合性を調べたり、正しく動作していることを確認できます。

次の構文を使用してhealthcheckコマンド・オプションを実行します。

cluvfy comp healthcheck [-collect {cluster|database}] [-db db_unique_name] [-bestpractice|-mandatory] [-deviations] [-html] [-save [-savedir directory_path]

次に例を示します。

$ cd /home/grid/cvu_home/bin
$ ./cluvfy comp healthcheck -collect cluster -bestpractice -deviations -html

オプションは次のとおりです。

  • -collect [cluster|database]

    このフラグは、Oracle Clusterware (-cluster)またはOracle Database (-database)に対するチェックの実行を指定するために使用します。healthcheckオプションで-collectフラグを使用しない場合は、cluvfy comp healthcheckではOracle ClusterwareおよびOracle Databaseの両方に対するチェックが実行されます。

  • -db db_unique_name

    このフラグを使用して、-dbフラグの後に入力した一意のデータベース名に対するチェックを指定します。

    CVUでは、JDBCを使用してcvusysユーザーとしてデータベースに接続し、様々なデータベース・パラメータが検証されます。このため、-dbフラグで指定したデータベースに対してチェックを実行する場合は、最初にそのデータベースでcvusysユーザーを作成し、このユーザーにCVU固有の役割であるcvusappを付与する必要があります。cvusappの役割のメンバーに、システム表に対するselect権限を付与する必要もあります。

    SQLスクリプトがCVU_home/cv/admin/cvusys.sqlに含まれており、このユーザーの作成を容易にします。このSQLスクリプトを使用して、CVUにより検証するすべてのデータベースでcvusysユーザーを作成します。

    -dbフラグを使用し、一意のデータベース名を指定しない場合、CVUではクラスタのすべてのOracle Databaseが検出されます。これらのデータベースでベスト・プラクティス・チェックを実行する場合は、各データベースでcvusysユーザーを作成し、ベスト・プラクティス・チェックを実行するのに必要なcvusappの役割とselect権限をこのユーザーに付与する必要があります。

  • [-bestpractice | -mandatory] [-deviations]

    ベスト・プラクティス・チェックを指定するには-bestpracticeフラグを使用し、必須チェックを指定するにはmandatoryフラグを使用します。ベスト・プラクティスの推奨事項または必須要件からの差異のみを確認することを指定するには、-deviationsフラグを追加します。-bestpracticeまたは-mandatoryのいずれかのフラグを指定できますが、両方のフラグを指定することはできません。-bestpracticeまたは-mandatoryのいずれも指定しない場合は、ベスト・プラクティスと必須要件の両方が表示されます。

  • -html

    -htmlフラグを使用すると、詳細レポートがHTML形式で生成されます。

    -htmlフラグを指定し、CVUで認識されるブラウザがシステムで使用可能な場合は、チェックの完了時にブラウザが起動されてレポートがブラウザに表示されます。

    htmlフラグを指定しない場合、詳細レポートはテキスト・ファイルで生成されます。

  • -save [-savedir dir_path]

    検証レポート(cvuchecdkreport_timestamp.txtおよびcvucheckreport_timestamp.htm)を保存するには、-saveフラグまたは-save -savedirフラグを使用します(timestampは検証レポートの日時)。

    -saveフラグを単独で使用すると、レポートはパスCVU_home/cv/reportに保存されます(CVU_homeはCVUバイナリの場所)。

    -save -savedirフラグを使用し、CVUレポートを保存するパスを入力すると、指定したパスにCVUレポートが保存されます。

A.9 インターコネクト構成の問題

インターコネクトに複数のネットワーク・インタフェース・カード(NIC)を使用する場合で、それらを冗長インターコネクトを使用してインストール時またはインストール後に構成していない場合は、サード・パーティのソリューションを使用して、オペレーティング・システム・レベルでインタフェースをボンディングする必要があります。そうしない場合、1つのNICの障害が、クラスタ・ノードの可用性に影響します。

Oracle Grid InfrastructureおよびOracle RACをインストールする場合は、インターコネクトに同じNICカードまたはボンディングされたNICカードを使用する必要があります。

ボンディングされたNICカードを使用し、Oracle Clusterware冗長インターコネクト機能を使用する場合、それらのカードは異なるサブネット上に存在する必要があります。サード・パーティ・ベンダーの集約方法(ボンディングやIPMPなど)を使用する場合は、そのベンダーの製品に対する指示に従います。

エラーが発生したら、次のシステム検証を実行してください。

  • スイッチに適切なケーブル(長さやタイプ)やソフトウェアが使用されていることを、ネットワーク・プロバイダに確認してください。場合によっては、負荷によって切断を起こす不具合を回避するため、またはジャンボ・フレームなどの追加機能をサポートするために、インターコネクト・スイッチのファームウェアのアップグレードや、新しいNICドライバ、オペレーティング・システム・レベルの新しいファームウェアが必要になることがあります。こうした修正を行わずに実行すると、初めのインストールは正常に見えても、後でOracle RACデータベースが不安定になることがあります。

  • ベンダーおよびOracleの推奨事項に従って、VLAN構成、二重化設定、自動ネゴシエーションを確認してください。

A.10 SCAN VIPおよびSCANリスナーの問題

インストール時の最終チェックでSCAN VIPアドレスまたはリスナーに関連するエラーが報告された場合、次の項目をチェックして、ネットワークが正しく構成されていることを確認します。

  • ファイル/etc/resolv.confをチェックし、それぞれのノード上で内容が同じであることを確認します。

  • SCANに対してDNSエントリが存在しており、SCANが3つの有効なIPアドレスに解決されることを確認します。nslookup scan-nameコマンドを使用します。このコマンドを実行すると、SCANに構成されているDNSサーバー名および3つのIPアドレスが返されます。

  • pingコマンドを使用して、SCANに割り当てられたIPアドレスをテストします(IPアドレスごとにレスポンスを受信する必要があります)。


    注意:

    クラスタ環境用にDNSが構成されていない場合は、各ノードの/etc/hostsファイルでSCANのエントリを作成できます。ただし、/etc/hostsファイルを使用してSCANを解決すると、クラスタ全体に対して使用可能なSCANは3つではなく1つのみとなります。hostsファイルにおけるSCAN用の最初のエントリのみが使用されます。

  • パブリック・インタフェースと同じサブネットがSCAN VIPで使用されていることを確認してください。

SCAN、SCAN VIPまたはリスナーに関連するエラーのトラブルシューティングについてさらに支援が必要な場合は、My Oracle Supportを参照してください。たとえば、Doc ID 1373350.1のNoteにはSCAN VIPおよびリスナーの最も一般的ないくつかの問題が含まれます。

A.11 ストレージ構成の問題

次にストレージ構成の問題を示します。

A.11.1 ノード・ファイル・システムまたはGridホーム損失からのリカバリ

誤ってファイル・システムを削除したり、Oracle Local Registryを失うことになる別のストレージ構成の問題が発生したり、ノードが破損した場合は、次のいずれかの方法でノードをリカバリできます。

  • オペレーティング・システム・レベルのバックアップからノードをリストアする。

  • Gridホームの/addnode/addnode.shを使用して、ノードを削除した後、ノードを追加する。プロファイル情報はノードにコピーされ、ノードがリストアされます。

addnode.shを使用するとクラスタ・ノードを削除して再度追加でき、クラスタ内の残りのノードからリストアできるようになります。GNS構成でノードを追加した場合は、グリッドのプラグ・アンド・プレイ(GPnP)と呼ばれます。GPnPではプロファイルを使用してノードが構成されるため、ノードの構成データ要件がなくなり、明示的にノードを追加したり削除する必要性がなくなります。GPnPによって、システム管理者は、テンプレートのシステム・イメージを取得するだけで、それ以上の構成を行わなくても、新しいノードでそのイメージを実行できます。GPnPにより、多くの手動操作が不要になり、エラーの発生する可能性が減るだけでなく、構成の変更をより簡単に行えるようになります。個々のノードの構成が排除されると、個々の状態をノードで保持して管理する必要がなくなるため、ノードの交換が容易になります。

GPnPにより、ノードの状態が使い捨て可能になることで、データベース・ノードのインストール、構成および管理のコストが削減されます。これによって、再生成された状態でノードを簡単に交換できるようになります。


関連項目:

手動でまたはGNSでノードを追加する方法の詳細は、『Oracle Clusterware管理およびデプロイメント・ガイド』を参照してください。

A.11.2 Oracle ASMライブラリ・ドライバの問題

次に、Oracle ASMドライバ・ライブラリのエラー・メッセージとその対処方法を示します。

Asmtool: デバイス"devicepath"を消去できません: 入出力エラー
原因: いくつかの原因がある書込みアクセスエラーです。
処置: ディスクがマウントされている場合は解除します。たとえばumount /dev/sdb1です。デバイスを所有するグループとユーザーがoraInventoryグループとOracle Grid Infrastructureインストールの所有者であることを確認します。たとえばchown grid:oinstallです。
ASMLibを開くことができません; 候補ディスク'ORCL:*'が見つかりません
原因: ディスクを作成しても、OUIから候補ディスクを検出できない場合は、Oracle ASMストレージへのアクセスができなくなる様々な構成エラーが原因である可能性があります。
処置: Oracle Grid Infrastructureインストール所有者が、ASMディスクのパスasm_diskstringを使用して、コマンド/usr/sbin/oracleasm-discoverを入力してください。次に例を示します。
[grid@node1]$ /usr/sbin/oracleasm-discover 'ORCL:*'

/usr/sbin/oracleasm-discoverがない場合は、oracleasmlibがインストールされていません。コマンドがある場合は、ASMLibが有効かどうか、ディスクが作成されているか、候補ディスクを作成するその他のタスクが完了しているかどうかを判定できます。

問題を解決済の場合は、コマンドを入力すると次のように出力されます。

[grid@node1]$ /usr/sbin/oracleasm-discover 'ORCL:*'
 
Using ASMLib from /opt/oracle/extapi/64/asm/orcl/1/libasm.so
 
[ASM Library - Generic Linux, version 2.0.4 (KABI_V2)]
Discovered disk: ORCL:DISK1 [78140097 blocks (40007729664 bytes), maxio 512]
Discovered disk: ORCL:DISK2 [78140097 blocks (40007729664 bytes), maxio 512]
Discovered disk: ORCL:DISK3 [78140097 blocks (40007729664 bytes), maxio 512]

A.11.3 Oracle Grid Infrastructureをアップグレードした後のOracle ASMの問題

次の項では、Oracle Grid Infrastructureをアップグレードする場合に発生する可能性のあるエラーとその対処方法について説明します。

CRS-0219: リソースora.node1.asm1.instを更新できません
原因: Oracle Grid Infrastructureをアップグレードすると、Oracle Database 12c以前のOracle ASMクライアント・データベースは、ALIAS_NAME属性を使用してora.asmリソースでOracle ASMインスタンスのエイリアスを取得できなくなります。
処置: ローカルのASMを使用するか、Flex ASMのカーディナリティをデフォルトの3ではなくALLに設定します。次のコマンドを使用し、Oracle ASMリソース(ora.asm)を変更します。

$ srvctl modify asm -count ALL

この設定によりカーディナリティが変更されるので、Flex ASMインスタンスはすべてのノードで実行されるようになります。


関連項目:

12cリリース1以前のOracle DatabaseリリースでOracle ASMを利用できるようにする方法の詳細は、第9.3.3項「以前のOracle DatabaseリリースでのOracle ASMの有効化」を参照してください。

A.11.4 スタンドアロン・サーバー(Oracle Restart)用にOracle Grid Infrastructureをダウングレードした後のOracle ASMの問題点

次の項では、スタンドアロン・サーバー(Oracle Restart)用にOracle Grid Infrastructureをダウングレードしたとき発生する可能性があるエラーと、その対処方法について説明します。

CRS-2529:: 'ora.asm'の停止または移動が必要であるため、'ora.cssd'は処理できません
原因: スタンドアロン・サーバー(Oracle Restart)用にOracle Grid Infrastructureを12.1.0.2から12.1.0.1にダウングレードした後で、ora.asmリソースにサーバー・パラメータ・ファイル(SPFILE)パラメータが含まれていません。
処置: スタンドアロン・サーバー(Oracle Restart)用にOracle Grid Infrastructureを12.1.0.2から12.1.0.1にダウングレードした場合は、12.1.0.1用にOracle ASMリソースを追加するとき、ora.asmリソースからServer Parameter File (SPFILE)を明示的に追加する必要があります。

Oracle Restartを12.1.0.2から12.1.0.1にダウングレードするとき、次の手順に従います。

  1. 12.1.0.2 Oracle Restartのインストール構成で、Oracle ASMリソース(ora.asm)からSPFILEパラメータを問い合せて、それを覚えておきます。

     srvctl config asm
    
  2. リリース12.1.0.2のOracle Restartを構成解除します。

    Grid_home/crs/install/roothas.pl -deconfig -force
    
  3. root.shを実行して、リリース12.1.0.1のOracle Restartをインストールします。

    $ Grid_home/root.sh
    
  4. リスナー・リソースを追加します。

    $ Grid_home/bin/srvctl add LISTENER
    
  5. Oracle ASMリソースを追加し、ステップ1で取得した12.1.0.2 Oracle Restartの構成のSPFILEパラメータを指定します。

    $ Grid_home/bin/srvctl add asm
    [-spfile <spfile>]  [-diskstring <asm_diskstring>])
    

関連項目:

Oracle Restartのインストールと構成解除の詳細は、『Oracle Databaseインストレーション・ガイド』

A.12 失敗したまたは不完全なインストールおよびアップグレード

Oracle Grid Infrastructureのインストールまたはアップグレード中に、次のアクションが起こります。

  1. システムにOracle Grid Infrastructureソフトウェアを設定するために、Oracle Universal Installer (OUI)により入力が求められます。

  2. orainstRoot.shまたはroot.shのスクリプトの片方または両方を実行するよう指示されます。

  3. 手動またはルート自動化のいずれかでスクリプトを実行します。

  4. OUIによりコンフィギュレーション・アシスタントが実行されます。Oracle Grid Infrastructureソフトウェアのインストールが正常に完了します。

OUIがroot.shまたはrootupgrade.shのスクリプトの実行前に終了した場合、またはOUIがインストールまたはアップグレード・セッションが正常に完了する前に終了した場合、Oracle Grid Infrastructureのインストールまたはアップグレードは不完全になります。インストールまたはアップグレードが完了しない場合、Oracle Clusterwareは正常には機能しません。アップグレードを行い、それが正常に完了しない場合、一部のノードは最新のソフトウェアにアップグレードされ、その他のノードはまったくアップグレードされないということになります。インストールを行い、それが不完全であると、一部のノードがクラスタに参加しない状態が発生します。

また、Oracle Grid Infrastructureリリース11.2.0.3以上では、インストールまたはアップグレード中に次のメッセージが表示される場合があります。

ACFS-9427 ADVM/ACFSドライバのアンロードに失敗しました。システムの再起動をお薦めします。

ACFS-9428 ADVM/ACFSドライバのロードに失敗しました。システムの再起動をお薦めします。

CLSRSC-400: インストールを続行するにはシステムの再起動が必要です。

このエラーを解決するには、サーバーを再起動し、次の項で説明する不完全なインストールまたはアップグレードを完了する手順を実行します。

A.12.1 失敗した、または中断されたアップグレードの完了

アップグレードを開始したノードでOUIが終了する場合、またはrootupgrade.shスクリプトがすべてのノードで実行されたことを確認する前にノードが再起動された場合、アップグレードは不完全のままです。アップグレードが不完全な場合でも、構成アシスタントを実行し、中央のOracleインベントリで新しいGridホームをアクティブにマークする必要があります。影響を受けたノードでは、アップグレードを手動で完了する必要があります。

この項の内容は次のとおりです。

A.12.1.1 ローリング・アップグレード・モードで強制アップグレードが失敗した場合のアップグレードの続行

ローリング・アップグレード・モードでクラスタ・ノードの強制アップグレードを試みた場合に、次のようなエラーが発生することがあります。

CRS-1137 - クラスタが強制的にアップグレードされたため、ローリング・アップグレード・モードの変更を拒否しています。
原因: クラスタが強制的にアップグレードされたため、ローリング・アップグレード・モードの変更が拒否されました。
処置: 『Oracle Clusterware管理およびデプロイメント・ガイド』に記載されている手順を使用してアップグレードされなかったノードを削除します。第B.8項「Oracle Grid Infrastructureのローリング・アップグレードの実行」に記載されているように、crsctl start rollingupgradeコマンドを使用してローリング・アップグレードのプロセスを再試行できます。

A.12.1.2 最初のノードでアップグレードが失敗した場合のアップグレードの続行

最初のノードをアップグレードできなかった場合は、次の作業を実行します。

  1. rootスクリプトの失敗で、CLSRSC-400メッセージにより再起動が必要であることが示される場合、最初のノードを再起動します(アップグレードを開始したノード)。または、エラー出力でレポートされているエラー状態を手動で修正するかクリアします。そのノードで再度rootupgrade.shスクリプトを実行します。

  2. クラスタ内の他のすべてのノードでアップグレードを完了します。

  3. レスポンス・ファイルを構成し、インストール用のパスワードを指定します。レスポンス・ファイルの作成方法の詳細は、第C.5項「レスポンス・ファイルを使用したインストール後の構成」を参照してください。

  4. アップグレードを完了するには、Gridインストール所有者としてログインしてから、Gridhome/cfgtoollogs/configToolAllCommandsのパスにあるconfigToolAllCommandsスクリプトを、作成したレスポンス・ファイルを指定して実行します。たとえば、レスポンス・ファイルがgridinstall.rspの場合は次のとおりです。

    [grid@node1]$ cd /u01/app/12.1.0/grid/cfgtoollogs
    [grid@node1]$ ./configToolAllCommands RESPONSE_FILE=gridinstall.rsp
    

A.12.1.3 最初以外のノードでアップグレードが失敗した場合のアップグレードの続行

最初のノード(アップグレードを開始したノード)以外のノードで、次の手順を実行します。

  1. rootスクリプトの失敗で、CLSRSC-400メッセージにより再起動が必要であることが示される場合、最初のノードを再起動します(アップグレードを開始したノード)。または、エラー出力でレポートされているエラー状態を手動で修正するかクリアします。

  2. ルート自動化を使用している場合、最初のノードのOUIインスタンスで「再試行」をクリックします。

  3. ルート自動化を使用していない場合、影響を受けるノードにrootとしてログインします。Gridホームのディレクトリに移動し、そのノードでrootupgrade.shスクリプトを実行します。次に例を示します。

    [root@node6]# cd /u01/app/12.1.0/grid
    [root@node6]# ./rootupgrade.sh
    

A.12.2 失敗したまたは中断されたインストールの完了

インストールを開始したノードでOUIが終了する場合、またはorainstRoot.shまたはroot.shスクリプトがすべてのノードで実行されたことを確認する前にノードが再起動された場合、インストールは不完全となります。インストールが不完全な場合でも、構成アシスタントを実行して中央のOracleインベントリで新しいGridホームをアクティブにマークする必要があります。影響を受けるノードでは、インストールを手動で完了する必要があります。

この項の内容は次のとおりです。

A.12.2.1 最初のノードでの不完全なインストールの続行

最初のノードのインストールは、クラスタ内の他のノードの前に完了している必要があります。最初のノードでの不完全なアップグレードを続行するには、次の手順を実行します。

  1. rootスクリプトの失敗で、CLSRSC-400メッセージにより再起動が必要であることが示される場合、最初のノードを再起動します(アップグレードを開始したノード)。または、エラー出力でレポートされているエラー状態を手動で修正するかクリアします。

  2. 必要に応じて最初のノードでrootとしてログインします。そのノードで再度orainstRoot.shスクリプトを実行します。次に例を示します。

    $ sudo -s
    [root@node1]# cd /u01/app/oraInventory
    [root@node1]# ./orainstRoot.sh
    
  3. 最初のノードでGridホームのディレクトリに移動し、そのノードで再度rootスクリプトを実行します。次に例を示します。

    [root@node1]# cd /u01/app/12.1.0/grid
    [root@node1]# ./root.sh
    
  4. 他のすべてのノードでインストールを完了します。

  5. レスポンス・ファイルを構成し、インストール用のパスワードを指定します。レスポンス・ファイルの作成方法の詳細は、第C.5項「レスポンス・ファイルを使用したインストール後の構成」を参照してください。

  6. インストールを完了するには、Gridインストール所有者としてログインしてから、Gridhome/cfgtoollogs/configToolAllCommandsのパスにあるスクリプトconfigToolAllCommandsを実行して、作成したレスポンス・ファイルを指定します。たとえば、レスポンス・ファイルがgridinstall.rspの場合は次のとおりです。

    [grid@node1]$ cd /u01/app/12.1.0/grid/cfgtoollogs
    [grid@node1]$ ./configToolAllCommands RESPONSE_FILE=gridinstall.rsp
    

A.12.2.2 最初のノード以外でのインストールの続行

最初のノード(インストールを開始したノード)以外のノードで、次の手順を実行します。

  1. rootスクリプトの失敗で、CLSRSC-400メッセージにより再起動が必要であることが示される場合、影響を受けるノードを再起動します。または、エラー出力でレポートされているエラー状態を手動で修正するかクリアします。

  2. ルート自動化を使用している場合、最初のノードのOUIインスタンスで「再試行」をクリックします。

  3. ルート自動化を使用していない場合、次の手順に従います。

    1. rootとして影響を受けるノードにログインし、そのノードでorainstRoot.shスクリプトを実行します。次に例を示します。

      $ sudo -s
      [root@node6]# cd /u01/app/oraInventory
      [root@node6]# ./orainstRoot.sh
      
    2. Gridホームのディレクトリに変更し、影響を受けるノードでroot.shスクリプトを実行します。次に例を示します。

      [root@node6]# cd /u01/app/12.1.0/grid
      [root@node6]# ./root.sh
      
  4. 最初のノードのOUIインスタンスからインストールを続行します。