Oracle Private Cloud Appliance 2.4.3の場合、既存のヘルス・チェッカは、ovca-daemon
によってアクティブ管理ノードで起動されるサービスになります。 チェックは、コマンドラインから手動で実行することも、スケジューラの定義を使用して実行することもできます。 チェック定義に応じて、PCAヘルス・チェッカ、Oracle VMヘルス・チェックおよびPCAアップグレード前チェックを起動できます。
pca_healthcheck
は、システム・ハードウェア・コンポーネントのヘルスを監視します。 詳細は、「ヘルス・モニタリング」を参照してください。ovm_monitor
は、Oracle VMマネージャ・オブジェクトおよびその他の環境ファクタを監視します。pca_upgrader
は、アップグレード中にシステムを監視します。
ヘルス・チェックをZFS Phone Homeサービスと統合して、レポートを週単位でOracleに送信できます。 Phone Home機能はお客様がアクティブにする必要があり、アプライアンスがASRに登録されている必要があります。 個別のインストールは必要ありません。すべての機能は、Oracle Private Cloud Appliance 2.4.3のコントローラ・ソフトウェアに付属しています。 構成の詳細は、第2.11.2項、「フォン・ホーム・サービス」を参照してください。
アプライアンス管理者は、Oracle Private Cloud Appliance Fault Monitoringユーティリティを使用して、マスター管理ノードのOracle Linuxコマンド行から現在のコンポーネントの健全性ステータス情報にアクセスできます。 フォルト・モニタリング・ユーティリティはovca
サービスに含まれており、マスター管理ノードのOracle Private Cloud Applianceコマンドラインを使用してアクセスできます。 また、チェックを自動的に実行するようにスケジュールすることもできます。 ユーティリティはアプライアンスネットワークアーキテクチャを検出し、そのシステムに定義されている一連の健全性検査を実行します。
障害モニター・テストの手動実行
フォルト・モニタリング・ユーティリティには、個々のチェック、特定のモニタリング・サービスのすべてのチェックまたは使用可能なすべてのチェックの実行を選択できる柔軟性があります。
SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。
# ssh root@10.100.1.101 root@10.100.1.101's password: root@ovcamn05r1 ~]#
使用可能なチェックをリストします。
[root@ovcamn05r1 ~]# pca-faultmonitor --help usage: pca-faultmonitor [-h] [--list_all_monitors][--list_ovm_monitors] [--list_pca_healthcheck_monitors] [--list_pca_upgrader_monitors] [--run_all_monitors] [--run_ovm_monitors] [--run_pca_healthcheck_monitors] [--run_pca_upgrader_monitors][-m MONITOR_LIST] [--print_report] optional arguments: -h, --help show this help message and exit --list_all_monitors List all Fault Monitors(Oracle VM, pca_healthcheck and pca_upgrader) --list_ovm_monitors List Oracle VM Fault Monitors --list_pca_healthcheck_monitors List pca_healthcheck Fault Monitors --list_pca_upgrader_monitors List pca_upgrader Fault Monitors --run_all_monitors Run all Fault Monitors --run_ovm_monitors Run Oracle VM Fault Monitors --run_pca_healthcheck_monitors Run pca_healthcheck Fault Monitors --run_pca_upgrader_monitors Run pca_upgrader Fault Monitors -m MONITOR_LIST Runs a list of Fault Monitors. Each Fault Monitor must be specified with -m option --print_report Prints the report on console None PCA Rack type: hardware_orange Please refer the log file in /var/log/ovca-faultmonitor.log Please look at fault report in /nfs/shared_storage/faultmonitor/20200512/ Note: Reports will not be created for success status
[root@ovcamn05r1 faultmonitor]# pca-faultmonitor --list_pca_upgrader_monitors PCA Rack type: hardware_orange Please refer the log file in /var/log/faultmonitor/ovca-faultmonitor.log Please look at fault report in /nfs/shared_storage/faultmonitor/20200221/ Note: Reports will not be created for success status Listing all PCA upgrader faultmonitors check_ib_symbol_errors verify_inventory_cns check_hardware_faults check_server_name validate_image check_available_space check_ovs_version check_ovm_warning_error check_max_paths_iscsi check_serverUpdateConfiguration check_uptime check_ovmm_default_networks check_onf_error verify_password verify_ntp_server verify_no_upstream_proxies check_rpm_db verify_network_config check_custom_multipath check_ovmm check_yum_proxy check_motd verify_ovmm_cache check_keystore_loc check_yum_repo connect_mysql check_os check_multiple_tenant_groups check_osa_disabled check_xsigo_configs verify_ntp_xsigo check_ilom_version check_pca_services check_mysql_desync_passwords check_max_paths_fc check_dir_mounted check_storage_space verify_xms_cards
目的のチェックを実行します。
すべてのチェックを実行します。
[root@ovcamn05r1 ~]# pca_faultmonitor --run_all_monitors
特定のチェックまたは特定のチェックのリストを実行します。
-m
で事前に追加されている1つ以上のチェックをリストします。[root@ovcamn05r1 ~]# pca_faultmonitor -m event_monitor -m check_storage_space
特定のモニターのチェックを実行します。
[root@ovcamn05r1 ~]# pca_faultmonitor --run_pca_upgrader_monitors [root@ovcamn05r1 faultmonitor]# pca_faultmonitor --run_ovm_monitors PCA Rack type: hardware_orange Please refer the log file in /var/log/faultmonitor/ovca-faultmonitor.log Please look at fault report in /nfs/shared_storage/faultmonitor/20200220/ Note: Reports will not be created for success status Beginning OVM Fault monitor checks ... event_monitor 1/13 repository_utilization_monitor 2/13 storage_utilization_monitor 3/13 db_size_monitor 4/13 onf_monitor 5/13 db_backup_monitor 6/13 firewall_monitor 7/13 server_connectivity_monitor 8/13 network_monitor 9/13 port_flapping_monitor 10/13 storage_path_flapping_monitor 11/13 repository_mount_monitor 12/13 server_pool_monitor 13/13 -------------------------------------------------- Fault Monitor Report Summary -------------------------------------------------- OVM_Event_Monitor Success OVM_Repository_Utilization_Monitor Success OVM_Storage_Utilization_Monitor Success DB_Size_Monitor Success ONF_Monitor Success DB_Backup_Monitor Success Firewall_Monitor Success Server_Connectivity_Monitor Success Network_Monitor Warning Port_Flapping_Monitor Success Storage_Path_Flapping_Monitor Success Repository_Mount_Monitor Warning Server_Pool_Monitor Success -------------------------------------------------- Overall Failure -------------------------------------------------- PCA Rack type: hardware_orange Please refer the log file in /var/log/faultmonitor/ovca-faultmonitor.log Please look at fault report in /nfs/shared_storage/faultmonitor/20200220/ Note: Reports will not be created for success status Monitor execution completed after 5 minutes
特定のチェックが失敗した場合は、コンソールまたはログ・ファイルで追加の診断情報を確認します。
検出された問題を調査し、すべて修正します。 システムがすべてのチェックに合格するまでチェックを繰り返します。
障害モニター・テストのスケジューリング
デフォルトでは、run_ovm_monitors
、run_pca_healthcheck_monitors
およびrun_pca_upgrader_monitors
のチェックは毎週実行されるようにスケジュールされています。 これらのチェックの頻度を変更したり、スケジューラに個別のチェックを追加できます。 スケジュールの変更を実装するには、ovca
サービスを再起動する必要があります。
SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。
# ssh root@10.100.1.101 root@10.100.1.101's password: root@ovcamn05r1 ~]#
ovca-system.conf
ファイルのスケジュール・プロパティを変更します。次に説明するスケジューリング形式を使用します。
* * * * * command - - - - - | | | | | | | | | –--- day of week (0-7, Sunday= 0 or 7) | | | –----- month (1-12) | | –------- day of month (1-31) | –--------- hour (0-23) –----------- minute (0-59)
[root@ovcamn05r1 ~]# cat /var/lib/ovca/ovca-system.conf [faultmonitor] report_path: /nfs/shared_storage/faultmonitor/ report_format: json report_dir_cleanup_days: 10 disabled_check_list: validate_image enable_phonehome: 0 collect_report: 1 [faultmonitor_scheduler] run_ovm_monitors: 0 2 * * * run_pca_healthcheck_monitors: 0 1 * * * run_pca_upgrader_monitors: 0 0 * * * repository_utilization_monitor: 0 */2 * * * check_ovmm_version: */30 * * * *
フォルト・モニタリング・オプションの変更
SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。
# ssh root@10.100.1.101 root@10.100.1.101's password: root@ovcamn05r1 ~]#
ovca-system.conf
ファイルの適切なプロパティを変更します。report_format
のオプションは、json
、text
またはhtml
です。[root@ovcamn05r1 ~]# cat /var/lib/ovca/ovca-system.conf [faultmonitor] report_path: /nfs/shared_storage/faultmonitor/ report_format: json report_dir_cleanup_days: 10 disabled_check_list: validate_image enable_phonehome: 1 collect_report: 1
障害管理ユーティリティは、管理ノードが障害データ・レポートを収集し、それらのレポートをZFSストレージ・アプライアンスにコピーするように設計されています。 Oracle Serviceでこれらの障害レポートをモニターする場合は、Phone Homeサービスを構成して、これらのレポートをOracleに週単位でプッシュできます。
Oracle Private Cloud Applianceは、ZFSストレージ・アプライアンスの既存のPhone Homeサービスを使用します。
Oracle Private Cloud Applianceのフォン・ホーム・サービスのアクティブ化
ASRをOracle Private Cloud Applianceにインストールします。 「Private Cloud Appliance (PCA) X8にAuto Service Request (ASR)をインストールする方法(ドキュメントID 25609 88.1)」を参照してください。
ASRがPCAにインストールされたら、My Oracle Serviceアカウントにログインし、新しいアセットとしてOracle Private Cloud Applianceを承認する必要があります。 「My Oracle Supportで保留中のOracle Auto Service Request (ASR)アセットを管理および承認する方法(ドキュメントID 13292 00.1)」を参照してください。
SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。
ノートデフォルトの
root
パスワードは、Welcome1です。 セキュリティ上の理由により、ただちに新しいパスワードを設定する必要があります。# ssh root@10.100.1.101 root@10.100.1.101's password: root@ovcamn05r1 ~]#
障害モニタリング・サービスでPhone Homeを有効にするには、両方の管理ノードの
ovca-system.conf
ファイルでenable_phonehome
プロパティを1
に設定します。デフォルトでは、Phone HomeはOracle Private Cloud Applianceで無効になっています。
[root@ovcamn05r1 ~]# edit /var/lib/ovca/ovca-system.conf [faultmonitor] report_path: /nfs/shared_storage/faultmonitor/ report_format: json report_dir_cleanup_days: 10 disabled_check_list: validate_image enable_phonehome: 1 collect_report: 1
ZFSストレージ・アプライアンスのブラウザ・インタフェースにログインし、フォン・ホームを有効にします。 「構成>サービス>フォン・ホームに移動」で、電源アイコンをクリックしてサービスをオンラインにします。
これで、自動サービス・レスポンスのためにフォルト・レポートをOracleに送信するようにシステムが構成されました。