3.1.11 Oracle Big Data ApplianceでのOracle Exachkの使用

Oracle Big Data ApplianceでのOracle Exachk固有の機能について理解し、タスクの実行方法について学習します。

3.1.11.1 Oracle Big Data ApplianceでのOracle Exachkの実行に関する範囲およびサポートされているプラットフォーム

Oracle Big Data ApplianceのOracle Exachkでは、2.0.1より後のすべてのOracle Big Data Applianceバージョンがサポートされています。

Oracle Big Data ApplianceのOracle Exachkは、Oracle Big Data Appliance内の重要な構成設定を監査します。Oracle Exachkは、次のコンポーネントを調べます:

  • CPU
  • ハードウェア、ファームウェアおよびBIOS
  • オペレーティング・システムのカーネル・パラメータ、システム・パッケージ
  • イーサネット・ネットワーク、InfiniBandスイッチ
  • RAM、ハード・ディスク
  • インストール済のソフトウェア

Oracle Big Data Applianceのヘルス・チェックの目標

  1. Oracle Big Data Applianceのヘルス全体を事前および事後にチェックするメカニズムを提供します。
  2. Oracle Big Data Applianceの既知の問題を修正するためのベスト・プラクティスやヒントのためのレコメンデーション・エンジンを提供します。

推奨される検証頻度

初期デプロイメント直後、変更の前後、および計画メンテナンス操作の一部として少なくとも四半期に1回、Oracle Big Data Applianceを検証することをお薦めします。Oracle Autonomous Health Frameworkの実行時間は、チェックするノードの数、CPU負荷、ネットワーク・レイテンシなどによって異なります。

ノート:

Oracle Big Data Applianceの負荷が少ないときにOracle Exachkを実行することを計画します。 これにより、ヘルス・チェック中の実行時タイムアウトを回避できます。

3.1.11.2 Oracle Exachkを使用したOracle Big Dataでのコンプライアンス・チェックの実行

exachk compliance -hコマンドを実行して、Oracle Big Data Applianceでサポートされているオプションのリストを表示します。

ノート:

Oracle Big Data Applianceクラスタのnode1からrootとしてOracle Exachkを実行します。

ほとんどのデータ収集オプションでは、InfiniBandスイッチごとにパスワードが必要です。これは、実行中の計算ノードからスイッチへのSSHユーザー等価がない場合にのみ必要です。

  1. コマンド・オプションを表示するには、rootユーザーまたはroot以外のユーザーとして次のコマンドを実行します。
    exachk -h
    

ノート:

サポートされていない他のプロファイルを実行すると、Oracle Exachkによって次のようなエラーが返されます:

<profile_name> is not supported component. EXAchk will run generic checks for components identified from environment
たとえば、ベスト・プラクティスのチェックや推奨を含むすべてのチェックを実行するには、次を実行します。
# exachk -a

ノート:

オプションを指定しない場合、Oracle Exachkはデフォルトで-aで実行されます。

3.1.11.3 Oracle Big Dataのコンプライアンス・チェックの出力の確認

修正するためにすぐに行う必要があるチェックを識別するか、パフォーマンスまたは安定性の問題を引き起こす可能性のあるチェックを評価するためにさらに調査します。

次のメッセージ・ステータスは、Oracle Big Data上のOracle Exachkに固有です:

Oracle Big DataでのOracle Exachkのメッセージ定義

表3-9 Oracle Big DataでのOracle Exachkのメッセージ定義

メッセージ・ステータス 説明または考えられる影響 必要なアクション

FAIL

問題があって合格しなかったチェックが表示されます。

ただちに問題に対処します。

WARNING

対処しないと、パフォーマンスまたは安定性の問題を引き起こす可能性のあるチェックが表示されます。

問題をさらに調査します。

INFO

システムに関する情報が表示されます。

これらのチェックで表示された情報を確認し、指示があればそれに従います。

3.1.11.4 Oracle BigData ApplianceでのOracle Exachkのトラブルシューティング

基本的なトラブルシューティングに加えて、Oracle BigDataでのOracle Exachkには次の項目も適用されます。

Oracle Exachkの実行に問題がある場合は、My Oracle Supportを通じてサービス・リクエストを作成します。

Oracle BigData ApplianceでのOracle Exachkに固有の最新の既知の問題については、My Oracle Supportノート1643715.1を参照してください:

3.1.11.4.1 スイッチのチェック中のタイムアウト

特定のスイッチでSSHが遅い場合、Oracle EXAchkによってエラーがスローされます。

Starting to run root privileged commands in background on INFINIBAND SWITCH <cluster>sw-ib1.

Timed out
Unable to create temp directory on <cluster>sw-ib1

Skipping root privileged commands on INFINIBAND SWITCH <cluster> sw-ib1 is 
available but SSH is blocked.

解決するには、Oracle EXAchk環境変数を使用してSSHタイムアウトを増やします。

  1. 環境変数RAT_PASSWORDCHECK_TIMEOUTをリセットします。
    # set RAT_PASSWORDCHECK_TIMEOUT=40
  2. Oracle EXAchkを再実行します。
    # exachk -a