AHFリリース24.7

ベスト・プラクティス・チェックのためのExadataインフラストラクチャ詳細の格納

ahf CLIは、ExadataのDom0s、ストレージ・サーバーおよびスイッチの詳細を格納できるようになりました。これらの格納された詳細は、後でベスト・プラクティス・チェックに使用されます。

AHFは、Dom0で実行すると、すべてのExadataインフラストラクチャを検出できない場合があります。その結果、ベスト・プラクティス・チェックでは、ピアDom0s、ストレージ・サーバーおよびスイッチが欠落する可能性があります。

ahf CLIでは、ahf configuration set --type cell --node {nodename} --passwordコマンドを使用して、ExadataのDom0s、ストレージ・サーバーおよびスイッチの詳細を保存できるようになりました。ベスト・プラクティス・チェックでは、この保存された構成を使用してインフラストラクチャを完全に分析します。

AHFは、Oracle Cluster RegistryからピアDomUsを検出します。DomUおよびDom0からのOracle Exachkレポートをマージすると、Exadataラック全体の包括的なレポートが提供されます。

Oracle Exachkレポートをマージするには、exachk -merge report_1,report_2を実行します。

セル構成の管理

ノート:

AHF CLIで設定された構成は、AHFウォレットに安全に格納されます。
  • セル・ノードごとに異なるパスワードを入力するように選択できます。
  • ahf configuration setコマンドの実行中に指定されたパスワードによって、すでに格納されているパスワードがオーバーライドされます。
  • 指定したセルの構成を設定するには:
    ahf configuration set --type cell --node <nodename> --password
  • すべてのセルの構成を設定するには:
    ahf configuration set --type cell  --all-nodes
  • 指定したセルの構成を削除するには:
    ahf configuration unset --type cell --node <nodename>
  • すべてのセルの構成を削除するには:
    ahf configuration unset --type cell --all-nodes
  • 指定したセルの構成ステータスを取得するには:
    ahf configuration get --type cell --node <nodename>
  • すべてのセルの構成ステータスを取得するには:
    ahf configuration get --type cell --all-nodes
  • 指定したセルの構成を検証するには:
    ahf configuration check --type cell --node <nodename>

    構成ステータスをJSON形式で取得するには、--to-jsonフラグを使用します。

  • すべてのセルの構成を検証するには:
    ahf configuration check --type cell --all-nodes

    構成ステータスをJSON形式で取得するには、--to-jsonフラグを使用します。

関連トピック

コンプライアンス・チェック時のリソース使用率の向上

Oracle Orachk/Oracle Exachkでは、コンプライアンス・チェックにデータベース接続プーリングが使用され、リソース使用量が最適化されるようになりました。

デフォルトでは、Oracle OrachkおよびOracle Exachkは、SQLエージェントと呼ばれる専用のデーモン・プロセスを使用してDB接続プーリングを維持し、問合せを効率的で継続的に実行できるようにします。Oracle OrachkおよびOracle ExachkのSQLエージェントで問題が発生した場合、どちらもSQL*Plusにフォールバックし、問合せ実行ごとに新しいDB接続を確立します。

Oracle OrachkおよびOracle Exachkのログまたは画面出力にバグまたは偽陽性/偽陰性が見つかった場合は、-use_sqlplusオプションを使用します。このオプションは、SQLエージェントを使用した検出またはチェック実行の処理中に、DB接続の問題またはエラーに対処し、サービスの中断を防止するために特に役立ちます。
# orachk -use_sqlplus
# exachk -use_sqlplus

永続的な問題については、My Oracle Supportに連絡して、誤った動作を報告して解決してください。

コンプライアンス・チェックの詳細は、「コンプライアンス・チェックの実行」を参照してください。

AHFを更新しないJavaの更新

この機能拡張により、AHFを更新せずにJREを更新できます。

  1. Autonomous Health Framework、Oracle Trace File Analyzer、Oracle OrachkおよびJavaのバージョンを確認します。
    たとえば:
    # ahfctl version -all
    AHF version: 24.7.0
    TFA version: 24.7.0
    ORACHK  VERSION: 24.7.0_20240714
    JAVA VERSION: 11.0.22
  2. Javaの更新を適用します。
    ahfctl applyupdate -updatefile <patch_zip>

    ここで、updatefileは、生成されたJava更新ファイルを指定します。

    たとえば:
    # ahfctl applyupdate -updatefile ahf_36840033_java_JDK11_MAIN_LINUX.X64_240318.11.0.23.B7.zip 
    This is a Java patch. Requires Java version comparison before proceeding.
    Java patch validation passed.
    Stopping TFA before applying JAVA Patch.
    
    Updated file /opt/oracle.ahf/jre
    Java patch applied successfully.
    Starting TFA post JAVA patch completion.
    
    .---------------------------------------------------------------------------------------------------------.
    | Host            | Status of TFA | PID   | Port  | Version    | Build ID              | Inventory Status |
    +-----------------+---------------+-------+-------+------------+-----------------------+------------------+
    | test-node       | RUNNING       | 15719 | 29063 | 24.7.0.0.0 | 240600020240715093016 | COMPLETE         |
    '-----------------+---------------+-------+-------+------------+-----------------------+------------------'
  3. 更新後、Javaのバージョンを確認します。
    たとえば:
    $ /opt/oracle.ahf/jre/bin/java --version
    java 11.0.23 2024-04-16 LTS
    Java(TM) SE Runtime Environment 18.9 (build 11.0.23+7-LTS-222)
  4. 更新後、AHF、TFA、Oracle OrachkおよびJavaのバージョンを確認します。
    たとえば:
    # ahfctl version -all
    AHF version: 24.7.0
    TFA version: 24.7.0
    ORACHK  VERSION: 24.7.0_20240714
    JAVA VERSION: 11.0.23
  • 以前のJavaバージョンにロールバックするには、ahfctl rollbackupdate -updateid <update_id>コマンドを実行します。
    たとえば:
    $ /opt/oracle.ahf/jre/bin/java --version
    java 11.0.23 2024-04-16 LTS
    # ahfctl rollbackupdate -updateid JDK11_MAIN_LINUX.X64_240318.11.0.23.B7
    Java rollback started.
    Rollback files includes JRE directory. TFA needs to stop first.
    ===== ===== ===== ===== ===== ===== ===== ===== ===== ===== =====
    Stopping TFA before rolling back to original.
    Rolled-back file /opt/oracle.ahf
    Starting TFA post rollback completion.
    Java rollback completed.
    $ /opt/oracle.ahf/jre/bin/java -version
    java version "11.0.21" 2023-10-17 LTS
  • Javaにパッチが適用されたタイミングを問い合せるには、ahfctl queryupdate -allコマンドを実行します。
    たとえば:
    # ahfctl queryupdate -all
    Java Update
    Label: JDK11_MAIN_LINUX.X64_240318.11.0.23.B7
    Status: Applied
    Applied on: Wed Jul 24 19:36:24 2024
  • Java更新がロールバックされたタイミングを問い合せるには、ahfctl queryupdate -allコマンドを実行します。
    たとえば:
    # ahfctl queryupdate -all
    No AHF framework updates applied
    TFA version: 24.7.0
    ORACHK  VERSION: 24.7.0_20240714
    AHF version: 24.7.0
    JAVA VERSION: 11.0.22

tfactl managelogsを使用したHAMIトレース・ファイルの管理

HAMIトレース・ファイルを管理するために、tfactl managelogsコマンドに新しいコマンド・オプション-hamiが追加されました。

Oracle HAMI: Oracle High Availability Metadata Infrastructureサービスは、クラスタ内の構成詳細のロックおよび同期など、DCSに必要な分散サービスを提供します。

ログおよびトレース・ファイルの管理の詳細は、tfactl managelogsを参照してください。

Platinumの監視およびパッチ適用の改善

AHFでは、Platinumでdom0、ストレージ・サーバーおよびスイッチからのデータの問合せが可能になりました。

Platinumは、AHFのExadata構成データに依存して、Exadataのお客様に障害監視およびパッチ適用サービスを提供します。

この機能拡張により、AHFはExadata dom0、ストレージ・サーバーおよびスイッチで次の機能を提供します:
  • 自動アップグレード
  • 自動ベスト・プラクティス・チェック
  • 自動診断収集
  • SRへの診断収集の自動アップロード

これらの機能により、コンポーネントの関係を利用して、Platinumの障害検出およびパッチ適用サービスが強化されます。dom0から障害が検出されると、影響を受けるデータベース・ノードを識別できます。仮想化されたラックのパッチ適用計画も、これらの関係を理解してダウンタイムを短縮することでメリットが得られます。

新しい問題のサマリー

AHFでは、より多くの問題の解決を検出して提供できるようになりました。

バージョン24.4以降、AHFには問題を検出し、解決のサマリーを表示する機能があります。詳細は、「ノード除去の検出および解決」を参照してください。「Problem Summary」ページは、「Insights」「Detected Problems」パネルで使用できます。

問題のサマリーには次が含まれます:
  • Problem: 何が起こったのかを説明します。
  • Reason: 発生した理由を説明します。
  • Cause: 根本原因を特定します。
  • Evidence: これが原因である理由をサポートする証拠を提供します。
  • Resolution Steps: 問題を解決するための正確なステップを詳細に説明します。
このリリースには、次の新しい問題の原因を検出する機能が含まれています:
  • 次の原因によるノード除去:
    • リカバリ領域が不足しているため、アーカイバがブロックされた
    • ASMディスク・グループの領域が不足しているため、I/Oエラーが発生した。
    • MTUサイズの構成が間違っているため、プライベート・ネットワークのパフォーマンスが低下した。
  • 次の原因によるASMインスタンスの除去:
    • 障害が発生したネットワーク・インタフェース・カードを待機している。

詳細は、「診断インサイトの確認」を参照してください。