4.2 自動診断収集の使用
Oracle Trace File Analyzerは、ORA-00600
などの内部エラーやノードの除去などの重大な問題がないか、ログを監視します。
- 自動診断収集
この項では、自動診断収集の概念について説明します。 - 電子メール通知の詳細の構成
自動収集の完了後に、登録された電子メール・アドレスに電子メールを送信するようにOracle Trace File Analyzerを構成します。 - Oracle Cluster Health Advisorによって検出された問題の収集
異常なイベントの診断を自動的に収集し、電子メール通知を送信するようにOracle Cluster Health Advisorを構成します。 - Oracle Trace File Analyzerの収集内の機密情報のサニタイズ
診断データのコピーを収集した後、Oracle Trace File AnalyzerはAdaptive Classification and Redaction (ACR)を使用して、収集内の機密データをサニタイズします。 - 類似の問題のフラッド制御
フラッド制御メカニズムは、類似の問題に対する収集の繰返しを減らすことで、リソースを節約するのに役立ちます。
親トピック: 診断データの収集
4.2.1 自動診断収集
この項では、自動診断収集の概念について説明します。
Oracle Trace File Analyzerは問題を検出すると、次のアクションを実行します。
-
必要な診断を実行し、問題発生時の関連するすべてのログ・データを収集します
-
ログ・ファイルを切り捨て、診断に必要なデータのみを収集します
-
クラスタ内のすべてのノードから、切捨て済のすべての診断を収集してパッケージ化し、単一ノード上にすべてを統合します
-
Oracle Trace File Analyzerリポジトリに診断収集を格納します
-
問題と、Oracleサポートにアップロード可能な診断収集の詳細に関する電子メール通知を送信します
Oracle Trace File Analyzerには、過度の自動収集で、繰り返しエラーによってシステムが過負荷になるのを防ぐメカニズムがあります。
イベントが識別されると収集の開始点がトリガーされ、5分間後に、Oracle Trace File Analyzerによって診断データの収集が開始されます。5分後に開始することで、Oracle Trace File Analyzerが1つの操作で他の関連イベントを取得できるようになります。イベントが5分後にまだ発生している場合、診断収集は引き続き待機します。Oracle Trace File Analyzerは、イベントが発生しなくなるまで、さらに30秒間から5分間まで待機します。
10分後にイベントが継続している場合、Oracle Trace File Analyzerは引き続き診断収集を実行します。
診断収集が完了すると、Oracle Trace File Analyzerは指定された受信者に、収集場所を含む電子メール通知を送信します。
ご使用の環境でoracleに接続できる場合、Oracle Trace File Analyzerを使用して、サービス・リクエストに収集をアップロードできます。
$ tfactl set autodiagcollect=ON|OFF
デフォルトでは、自動収集はON
です。
表4-3 自動収集をトリガーするログ・エントリ
文字列パターン | 監視対象ログ |
---|---|
System State dumped |
アラート・ログ - Oracle Database アラート・ログ - Oracle Database/Oracle ASM アラート・ログ - Oracle Database/Oracle ASMプロキシ アラート・ログ - Oracle Database |
|
アラート・ログ - Oracle Clusterware |
また、Oracle Cluster Health Advisorが問題イベントを検出すると、Oracle Trace File Analyzerによって、関連する診断収集が自動的にトリガーされます。
親トピック: 自動診断収集の使用
4.2.2 電子メール通知の詳細の構成
自動収集の完了後に、登録された電子メール・アドレスに電子メールを送信するようにOracle Trace File Analyzerを構成します。
電子メール通知の詳細を構成するには:
親トピック: 自動診断収集の使用
4.2.3 Oracle Cluster Health Advisorによって検出された問題の収集
異常なイベントの診断を自動的に収集し、電子メール通知を送信するようにOracle Cluster Health Advisorを構成します。
親トピック: 自動診断収集の使用
4.2.4 Oracle Trace File Analyzerの収集内の機密情報のサニタイズ
診断データのコピーを収集した後、Oracle Trace File AnalyzerはAdaptive Classification and Redaction (ACR)を使用して、収集内の機密データをサニタイズします。
ノート:
Oracle Autonomous Health Framework 24.1以降、Oracle Trace File Analyzerマスキング機能は非推奨になり、将来のリリースでサポートされなくなる可能性があります。tfactl set redact=mask|sanitize|none
mask
: すべての収集内の機密データを見えなくします。たとえば、myhost1を*******に置き換えます
sanitize
: すべての収集内の機密データをランダムな文字に置き換えます。たとえば、myhost1をorzhmv1に置き換えます
none
(デフォルト): 収集内の機密データをマスクまたはサニタイズしません
diagcollect
コマンドで-sanitize
オプションと-mask
オプションを使用して、特定の収集内の機密データをサニタイズまたはマスクできます。
機密データをマスクするには:
親トピック: 自動診断収集の使用
4.2.5 類似の問題のフラッド制御
フラッド制御メカニズムは、類似の問題に対する収集の繰返しを減らすことで、リソースを節約するのに役立ちます。
- フラッド制御を有効または無効にします。
- イベントに対して収集する回数。
- フラッド制御を一時停止します。
フラッド制御データは、Berkeleyデータベースに格納され、Oracle Trace File Analyzerの再起動後も保持されます。
例4-1 フラッド制御の例
# tfactl get floodcontrol
.----------------------------------------.
| testhost |
+--------------------------------+-------+
| Configuration Parameter | Value |
+--------------------------------+-------+
| Flood Control ( floodcontrol ) | ON |
'--------------------------------+-------'
# tfactl get fc.limit
.------------------------------------------------.
| testhost |
+----------------------------------------+-------+
| Configuration Parameter | Value |
+----------------------------------------+-------+
| Flood Control Limit Count ( fc.limit ) | 3 |
'----------------------------------------+-------'
# tfactl get fc.limittime
.-------------------------------------------------------------.
| testhost |
+-----------------------------------------------------+-------+
| Configuration Parameter | Value |
+-----------------------------------------------------+-------+
| Flood Control Limit Time (minutes) ( fc.limitTime ) | 60 |
'-----------------------------------------------------+-------'
# tfactl get fc.pausetime
.-------------------------------------------------------------.
| testhost |
+-----------------------------------------------------+-------+
| Configuration Parameter | Value |
+-----------------------------------------------------+-------+
| Flood Control Pause Time (minutes) ( fc.pauseTime ) | 120 |
'-----------------------------------------------------+-------'
# tfactl floodcontrol print
.----------------------------------------------------------------------------------------------------------------------------------------------------------.
| Event | Count | Start Date | Last Date | Limit | Limit Time | Pause Time | Coll Count | Skip Count |
+------------------------+-------+------------------------------+------------------------------+-------+------------+------------+------------+------------+
| orcl:ORA-00600:user1 | 1 | Thu May 21 09:18:56 UTC 2020 | Thu May 21 09:18:56 UTC 2020 | 3 | 60 | 120 | 1 | 0 |
+------------------------+-------+------------------------------+------------------------------+-------+------------+------------+------------+------------+
| orcl:ORA-00600:user2 | 1 | Thu May 21 09:18:25 UTC 2020 | Thu May 21 09:18:25 UTC 2020 | 3 | 60 | 120 | 4 | 2 |
'------------------------+-------+------------------------------+------------------------------+-------+------------+------------+------------+------------'
# tfactl floodcontrol clear -event orcl:ORA-00600:user1
Successfully cleared Event orcl:ORA-00600:user1
# tfactl floodcontrol print
.---------------------------------------------------------------------------------------------------------------------.
| Event | Count | Start Date | Last Date | Limit | Limit Time | Pause Time | Coll Count | Skip Count |
+------------------------+-------+------------+-----------+-------+------------+------------+------------+------------+
| orcl:ORA-00600:user1 | 0 | null | null | 3 | 60 | 120 | 3 | 2 |
'------------------------+-------+------------+-----------+-------+------------+------------+------------+------------'
# tfactl floodcontrol update -event orcl:ORA-00600:user1 -limit 10 -limittime 90 -pausetime 180
Successfully updated Flood Control Event
# tfactl floodcontrol print -event orcl:ORA-00600:user1
.----------------------------------------------------------------------------------------------------------------------------------------------------------.
| Event | Count | Start Date | Last Date | Limit | Limit Time | Pause Time | Coll Count | Skip Count |
+------------------------+-------+------------------------------+------------------------------+-------+------------+------------+------------+------------+
| orcl:ORA-00600:user1 | 1 | Thu May 21 09:18:25 UTC 2020 | Thu May 21 09:18:25 UTC 2020 | 10 | 90 | 180 | 4 | 2 |
'------------------------+-------+------------------------------+------------------------------+-------+------------+------------+------------+------------'
関連トピック
親トピック: 自動診断収集の使用