機械翻訳について

2.11 障害モニタリング

Oracle Private Cloud Appliance 2.4.3の場合、既存のヘルス・チェッカは、ovca-daemonによってアクティブ管理ノードで起動されるサービスになります。 チェックは、コマンドラインから手動で実行することも、スケジューラの定義を使用して実行することもできます。 チェック定義に応じて、PCAヘルス・チェッカ、Oracle VMヘルス・チェックおよびPCAアップグレード前チェックを起動できます。

  • pca_healthcheckは、システム・ハードウェア・コンポーネントのヘルスを監視します。 詳細は、「ヘルス・モニタリング」を参照してください。

  • ovm_monitorは、Oracle VMマネージャ・オブジェクトおよびその他の環境ファクタを監視します。

  • pca_upgraderは、アップグレード中にシステムを監視します。

ヘルス・チェックをZFS Phone Homeサービスと統合して、レポートを週単位でOracleに送信できます。 Phone Home機能はお客様がアクティブにする必要があり、アプライアンスがASRに登録されている必要があります。 個別のインストールは必要ありません。すべての機能は、Oracle Private Cloud Appliance 2.4.3のコントローラ・ソフトウェアに付属しています。 構成の詳細は、第2.11.2項、「フォン・ホーム・サービス」を参照してください。

2.11.1 障害モニタリング・チェックの使用

アプライアンス管理者は、Oracle Private Cloud Appliance Fault Monitoringユーティリティを使用して、マスター管理ノードのOracle Linuxコマンド行から現在のコンポーネントの健全性ステータス情報にアクセスできます。 フォルト・モニタリング・ユーティリティはovcaサービスに含まれており、マスター管理ノードのOracle Private Cloud Applianceコマンドラインを使用してアクセスできます。 また、チェックを自動的に実行するようにスケジュールすることもできます。 ユーティリティはアプライアンスネットワークアーキテクチャを検出し、そのシステムに定義されている一連の健全性検査を実行します。

障害モニター・テストの手動実行

フォルト・モニタリング・ユーティリティには、個々のチェック、特定のモニタリング・サービスのすべてのチェックまたは使用可能なすべてのチェックの実行を選択できる柔軟性があります。

  1. SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。

    # ssh root@10.100.1.101
    root@10.100.1.101's password:
    root@ovcamn05r1 ~]#
  2. 使用可能なチェックをリストします。

    [root@ovcamn05r1 ~]# pca-faultmonitor --help
    usage: pca-faultmonitor [-h] [--list_all_monitors][--list_ovm_monitors]
                            [--list_pca_healthcheck_monitors]
                            [--list_pca_upgrader_monitors]
                            [--run_all_monitors]
                            [--run_ovm_monitors]
                            [--run_pca_healthcheck_monitors]
                            [--run_pca_upgrader_monitors][-m MONITOR_LIST]
                            [--print_report]
    
    optional arguments:  
      -h, --help show this help message and exit
      --list_all_monitors List all Fault Monitors(Oracle VM, pca_healthcheck and pca_upgrader)
      --list_ovm_monitors List Oracle VM Fault Monitors
      --list_pca_healthcheck_monitors List pca_healthcheck Fault Monitors
      --list_pca_upgrader_monitors List pca_upgrader Fault Monitors
      --run_all_monitors Run all Fault Monitors
      --run_ovm_monitors Run Oracle VM Fault Monitors
      --run_pca_healthcheck_monitors Run pca_healthcheck Fault Monitors
      --run_pca_upgrader_monitors Run pca_upgrader Fault Monitors
      -m MONITOR_LIST Runs a list of Fault Monitors. Each Fault Monitor must
         be specified with -m option
      --print_report Prints the report on console
    None
    PCA Rack type:      hardware_orange
    Please refer the log file in /var/log/ovca-faultmonitor.log
    Please look at fault report in /nfs/shared_storage/faultmonitor/20200512/
    Note: Reports will not be created for success status
    [root@ovcamn05r1 faultmonitor]# pca-faultmonitor --list_pca_upgrader_monitors
    PCA Rack type:	hardware_orange
    Please refer the log file in   /var/log/faultmonitor/ovca-faultmonitor.log
    Please look at fault report in /nfs/shared_storage/faultmonitor/20200221/
    Note: Reports will not be created for success status
    
    Listing all PCA upgrader faultmonitors
    
    check_ib_symbol_errors             	verify_inventory_cns               	check_hardware_faults              	check_server_name                  
    validate_image                     	check_available_space              	check_ovs_version                  	check_ovm_warning_error            
    check_max_paths_iscsi              	check_serverUpdateConfiguration    	check_uptime                       	check_ovmm_default_networks        
    check_onf_error                    	verify_password                    	verify_ntp_server                  	verify_no_upstream_proxies         
    check_rpm_db                       	verify_network_config              	check_custom_multipath             	check_ovmm                         	
    check_yum_proxy                    	check_motd                         	verify_ovmm_cache                  	check_keystore_loc                 
    check_yum_repo                     	connect_mysql                      	check_os                           	check_multiple_tenant_groups       
    check_osa_disabled                 	check_xsigo_configs                	verify_ntp_xsigo                   	check_ilom_version                 
    check_pca_services                 	check_mysql_desync_passwords       	check_max_paths_fc                 	check_dir_mounted                  
    check_storage_space                	verify_xms_cards 
  3. 目的のチェックを実行します。

    • すべてのチェックを実行します。

      [root@ovcamn05r1 ~]# pca_faultmonitor --run_all_monitors
    • 特定のチェックまたは特定のチェックのリストを実行します。 -mで事前に追加されている1つ以上のチェックをリストします。

      [root@ovcamn05r1 ~]# pca_faultmonitor -m event_monitor -m check_storage_space 
    • 特定のモニターのチェックを実行します。

      [root@ovcamn05r1 ~]# pca_faultmonitor --run_pca_upgrader_monitors
      [root@ovcamn05r1 faultmonitor]# pca_faultmonitor --run_ovm_monitors
      PCA Rack type:	hardware_orange
      Please refer the log file in   /var/log/faultmonitor/ovca-faultmonitor.log
      Please look at fault report in /nfs/shared_storage/faultmonitor/20200220/
      Note: Reports will not be created for success status
      
      Beginning OVM Fault monitor checks ...
      
      event_monitor                      	1/13                
      repository_utilization_monitor     	2/13                
      storage_utilization_monitor        	3/13                
      db_size_monitor                    	4/13                
      onf_monitor                        	5/13                
      db_backup_monitor                  	6/13                
      firewall_monitor                   	7/13                
      server_connectivity_monitor        	8/13                
      network_monitor                    	9/13                
      port_flapping_monitor              	10/13               
      storage_path_flapping_monitor      	11/13               
      repository_mount_monitor           	12/13               
      server_pool_monitor                	13/13               
      --------------------------------------------------
      Fault Monitor Report Summary
      --------------------------------------------------
      OVM_Event_Monitor                   	Success             
      OVM_Repository_Utilization_Monitor  	Success             
      OVM_Storage_Utilization_Monitor     	Success             
      DB_Size_Monitor                     	Success             
      ONF_Monitor                         	Success             
      DB_Backup_Monitor                   	Success             
      Firewall_Monitor                    	Success             
      Server_Connectivity_Monitor         	Success             
      Network_Monitor                     	Warning             
      Port_Flapping_Monitor               	Success             
      Storage_Path_Flapping_Monitor       	Success             
      Repository_Mount_Monitor            	Warning             
      Server_Pool_Monitor                 	Success             
      --------------------------------------------------
      Overall                            	Failure             
      --------------------------------------------------
      
      PCA Rack type:	hardware_orange
      Please refer the log file in   /var/log/faultmonitor/ovca-faultmonitor.log
      Please look at fault report in /nfs/shared_storage/faultmonitor/20200220/
      Note: Reports will not be created for success status
      Monitor execution completed after 5 minutes 	
  4. 特定のチェックが失敗した場合は、コンソールまたはログ・ファイルで追加の診断情報を確認します。

  5. 検出された問題を調査し、すべて修正します。 システムがすべてのチェックに合格するまでチェックを繰り返します。

障害モニター・テストのスケジューリング

デフォルトでは、run_ovm_monitorsrun_pca_healthcheck_monitorsおよびrun_pca_upgrader_monitorsのチェックは毎週実行されるようにスケジュールされています。 これらのチェックの頻度を変更したり、スケジューラに個別のチェックを追加できます。 スケジュールの変更を実装するには、ovcaサービスを再起動する必要があります。

  1. SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。

    # ssh root@10.100.1.101
    root@10.100.1.101's password:
    root@ovcamn05r1 ~]#
  2. ovca-system.confファイルのスケジュール・プロパティを変更します。

    次に説明するスケジューリング形式を使用します。

    * * * * *  command
    - - - - -
    | | | | |
    | | | | –---  day of week (0-7, Sunday= 0 or 7)
    | | | –-----  month (1-12)
    | | –-------  day of month (1-31)
    | –---------  hour (0-23)
    –-----------  minute (0-59)    
    [root@ovcamn05r1 ~]# cat /var/lib/ovca/ovca-system.conf
    
    [faultmonitor]
    report_path: /nfs/shared_storage/faultmonitor/
    report_format: json
    report_dir_cleanup_days: 10
    disabled_check_list: validate_image
    enable_phonehome: 0
    collect_report: 1
    
    [faultmonitor_scheduler]
    run_ovm_monitors: 0 2 * * *
    run_pca_healthcheck_monitors: 0 1 * * *
    run_pca_upgrader_monitors: 0 0 * * *
    repository_utilization_monitor: 0 */2 * * *
    check_ovmm_version: */30 * * * *

フォルト・モニタリング・オプションの変更

  1. SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。

    # ssh root@10.100.1.101
    root@10.100.1.101's password:
    root@ovcamn05r1 ~]#
  2. ovca-system.confファイルの適切なプロパティを変更します。

    report_formatのオプションは、jsontextまたはhtmlです。

    [root@ovcamn05r1 ~]# cat /var/lib/ovca/ovca-system.conf
    
    [faultmonitor]
    report_path: /nfs/shared_storage/faultmonitor/
    report_format: json
    report_dir_cleanup_days: 10
    disabled_check_list: validate_image
    enable_phonehome: 1
    collect_report: 1

2.11.2 フォンホームサービス

障害管理ユーティリティは、管理ノードが障害データ・レポートを収集し、それらのレポートをZFSストレージ・アプライアンスにコピーするように設計されています。 Oracle Serviceでこれらの障害レポートをモニターする場合は、Phone Homeサービスを構成して、これらのレポートをOracleに週単位でプッシュできます。

Oracle Private Cloud Applianceは、ZFSストレージ・アプライアンスの既存のPhone Homeサービスを使用します。

Oracle Private Cloud Applianceのフォン・ホーム・サービスのアクティブ化

  1. ASRをOracle Private Cloud Applianceにインストールします。 「Private Cloud Appliance (PCA) X8にAuto Service Request (ASR)をインストールする方法(ドキュメントID 25609 88.1)」を参照してください。

  2. ASRがPCAにインストールされたら、My Oracle Serviceアカウントにログインし、新しいアセットとしてOracle Private Cloud Applianceを承認する必要があります。 「My Oracle Supportで保留中のOracle Auto Service Request (ASR)アセットを管理および承認する方法(ドキュメントID 13292 00.1)」を参照してください。

  3. SSHおよびスーパーユーザー権限のあるアカウントを使用して、アクティブ管理ノードにログインします。

    ノート

    デフォルトのrootパスワードは、Welcome1です。 セキュリティ上の理由により、ただちに新しいパスワードを設定する必要があります。

    # ssh root@10.100.1.101
    root@10.100.1.101's password:
    root@ovcamn05r1 ~]#
  4. 障害モニタリング・サービスでPhone Homeを有効にするには、両方の管理ノードのovca-system.confファイルでenable_phonehomeプロパティを1に設定します。

    デフォルトでは、Phone HomeはOracle Private Cloud Applianceで無効になっています。

    [root@ovcamn05r1 ~]# edit /var/lib/ovca/ovca-system.conf
    
    [faultmonitor]
    report_path: /nfs/shared_storage/faultmonitor/
    report_format: json
    report_dir_cleanup_days: 10
    disabled_check_list: validate_image
    enable_phonehome: 1
    collect_report: 1
  5. ZFSストレージ・アプライアンスのブラウザ・インタフェースにログインし、フォン・ホームを有効にします。 構成>サービス>フォン・ホームに移動で、電源アイコンをクリックしてサービスをオンラインにします。

    これで、自動サービス・レスポンスのためにフォルト・レポートをOracleに送信するようにシステムが構成されました。