ノート:

スタック・モニタリングを使用したVMディスク使用率の管理

イントロダクション

クラウド管理者の主な責任の1つは、組織環境にデプロイされたリソースを管理および監視することです。すべての種類のワークロードについて、リソースの状態および変化をときどき監視し、すべてのワークロードが健全で稼働中であるようにする必要があります。

コンピュート・インスタンスでは、アプリケーションの安定性、アプリケーション・データの実行と格納、データベース・ファイルへのユーザーなどに関して、ストレージが重要な役割を果たします。管理者は、コンピュート・インスタンスにアタッチされている各ボリュームまたはディスクのストレージを監視および管理して、アプリケーション・クラッシュ、ダウンタイムおよびユーザーや組織のデータ損失を緩和することが重要です。

スタック・モニタリングは、OCIテナンシの下にデプロイされたインフラストラクチャの可観測性と管理の下で、Oracle Cloud Infrastructure (OCI)のコンピュート・インスタンスをモニタリングするために提供されるサービスの1つです。スタック・モニタリングでは、各ディスクのストレージだけでなく、コンピュート・インスタンスにアタッチされた各ボリュームに作成されたファイルシステムも許可されます。ストレージ、スタック監視に加えて、可用性、CPU、メモリーおよびディスク・アクティビティ+コンピュート・インスタンスのページングのメトリックが提供されます。

スタック・モニタリング機能

スタック・モニタリングは、ディスク領域が不足しているファイルシステムや高CPU使用率などの問題を迅速に警告および識別するためのツールを提供します。Stack Monitoringは、コンピュート・インスタンスの状態と可用性のステータスをより可視化します。また、モニターされているすべてのリソースのコンパイル済ビュー・ダッシュボードも提供します。スタック監視では、次の操作を実行できます。

目標

スタック・モニタリングを使用してVMディスク使用率を管理する方法について学習します。

前提条件

  1. 使用するコンパートメントを作成または指定します:

    新しいコンパートメントを作成するか、既存のコンパートメントを使用して、Stack Monitoringサービスをインストールして構成できます。コンパートメントの詳細は、コンパートメントの管理を参照してください。

    モニタリング・コンパートメントを指定する場合は、エージェントとネイティブOCIリソース(データベース、コンピュート・インスタンスなど)に同じコンパートメントを使用していることを確認してください。リソースが異なるコンパートメントにある場合は、スタック・モニタリング・エージェントの同じコンパートメントにリソースを移動します。

  2. すべての管理エージェントの動的グループを作成します:

    OCIサービス・エンドポイントと対話するには、管理エージェント・サービス(MACS)との通信を許可する動的グループを明示的に作成する必要があります。動的グループを作成するステップ:

    1. 「アイデンティティとセキュリティ」で、「アイデンティティ」に移動して「動的グループ」をクリックします。

    2. 「動的グループの作成」をクリックします。

    3. 「動的グループの作成」ダイアログ・ボックスで、動的グループの名前、説明および一致ルールを入力し、「動的グループの作成」をクリックします。

      動的グループ

      たとえば、「Demo_DyanmicGroup_For_MonitoringAgent」という名前の動的グループをRULE 1の下に次の詳細で作成します:

      ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}

  3. 動的グループに対するポリシーの作成:

    管理エージェントが管理エージェント・サービスと対話できるようにし、管理エージェントがデータをアップロードできるようにするには、次のポリシーを作成する必要があります。

    • ポリシー1: ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent >TO USE METRICS IN COMPARTMENT <compartment_name> where target.metrics.namespace = 'oracle_appmgmt'

      説明: エージェントがメトリックをテレメトリに'oracle_appmgmt'ネームスペースにアップロードできるようにします。ここで、Management_Agent_Dynamic_Groupはコンパートメント内の管理エージェントの動的グループです。

    • ポリシー2: ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent> TO {STACK_MONITORING_DISCOVERY_JOB_RESULT_SUBMIT} IN COMPARTMENT <compartment_name>`

      説明: エージェントがデータを検出サービスにアップロードできるようにします。ここで、Management_Agent_Dynamic_Groupはコンパートメント内の管理エージェントの動的グループです。

    ノート:テナンシの管理者権限がある場合は、前提条件4および前提条件5をスキップできます。管理者がスタック・モニタリングのみを管理するユーザーを作成する場合は、次のステップに従います。

  4. ユーザーとグループを作成します。

    ベスト・プラクティスとして、スタック・モニタリング関連の操作を管理するために個別のユーザーおよびグループを作成します。ただし、管理者グループとそのユーザーは、デフォルトで必要な権限を持ちます。スタック・モニタリングのユーザーとグループは、Oracle Cloud InfrastructureのIdentity and Access Management (IAM)サービスを使用して作成されます。Identity and Access Management (IAM)サービスを使用したユーザーとグループの作成および管理の詳細は、ユーザーの管理およびグループの管理を参照してください。スタック・モニタリングに必要な次のユーザー・グループを作成します。

    グループ 説明
    StackMonitoringAdminGrp 管理者/オペレータ関連操作を実行するユーザーのグループ。
  5. 必要なポリシーを作成します:

    スタック・モニタリング・ポリシーは、Identity and Access Management (IAM)ポリシーを使用して作成されます。このチュートリアルでは、スタック・モニタリングを活用するようにテナンシを構成するための具体的な例を示します。OCIポリシーに関する一般情報は、ポリシーの開始を参照してください。

    管理操作のポリシーの作成

    次に、管理操作を実行できるユーザー(つまり、StackMonitoringAdminGrpグループに属するユーザー)を許可するように定義するポリシーのリストを示します。

    • ポリシー1: ALLOW GROUP StackMonitoringAdminGrp TO MANAGE stack-monitoring-family IN COMPARTMENT <compartment_name>

      説明: StackMonitoringAdminGrpグループのユーザーがコンパートメントの管理操作を実行できるようにします。

    • ポリシー2: ALLOW GROUP StackMonitoringAdminGrp TO {MGMT_AGENT_DEPLOY_PLUGIN_CREATE, MGMT_AGENT_INSPECT, MGMT_AGENT_READ} IN COMPARTMENT <compartment_name>

      説明: 管理エージェントがコンパートメントのスコープにまだプラグインを持っていない場合、リソース検出中にStackMonitoringAdminGrpグループのユーザーがエージェントをリスト/読取りし、Stack Monitoring Management Agentプラグインをデプロイできるようにします。

    • ポリシー3: ALLOW GROUP StackMonitoringAdminGrp TO READ metrics IN COMPARTMENT <compartment_name>

      説明: StackMonitoringAdminGrpグループのユーザーがコンパートメント内のメトリックを読み取れるようにします。

    • ポリシー4: ALLOW GROUP StackMonitoringAdminGrp to READ instances IN COMPARTMENT<compartment_name>

      説明: StackMonitoringAdminGrpグループのユーザーがコンパートメント内のインスタンスを読み取れるようにします。

    • ポリシー5: ALLOW GROUP StackMonitoringAdminGrp to MANAGE external-database-family IN COMPARTMENT <compartment_name>

      説明: StackMonitoringAdminGrpグループのユーザーがコンパートメント内の外部データベースを管理できるようにします。

    • ポリシー6: ALLOW GROUP StackMonitoringAdminGrp to MANAGE alarms IN COMPARTMENT<compartment_name>

      説明: StackMonitoringAdminGrpグループのユーザーがコンパートメント内のアラームを管理できるようにします。

    • ポリシー7: ALLOW GROUP StackMonitoringAdminGrp to USE ons-topics IN COMPARTMENT <compartment_name>

      説明: StackMonitoringAdminGrpのユーザーが、テナンシ内のトピックのサブスクリプションをリスト、作成、更新、削除および移動できるようにします。

タスク1: 管理エージェントのインストール

スタック・モニタリング・サービスの使用に必要なため、管理エージェント・プラグインをインストールする必要があります。

  1. Oracle Cloudコンソールにログインし、ナビゲーション・メニューから「コンピュート」をクリックし、「インスタンス」をクリックします。

  2. 目的のインスタンスをクリックします。

  3. 「Oracle Cloud Agent」タブをクリックします。プラグインのリストが表示されます。

  4. 管理エージェント・プラグインの「有効」スイッチを切り替えます。

    Oracle Agents

エージェントを有効にすると、実行中ステータスに変更するまでに約10分から15分かかります。

タスク2: モニタリング・エージェントIDの確認

  1. Oracle Cloudコンソールにログインし、ナビゲーション・メニューから「監視および管理」をクリックします。

  2. 「管理エージェント・サービス」を選択します。

  3. 「コンパートメント」ドロップダウン・リストからコンパートメントを選択すると、それぞれのコンピュート・インスタンスに対して有効になっているエージェントのリストが表示されます。

    エージェントとゲートウェイ

  4. スタック・モニタリングを有効にするコンピュート・インスタンスのエージェントを選択し、今後使用するためにモニタリングの「エージェントID」を書き留めます。

    エージェント概要

タスク3: スタック・モニタリング検出ジョブの実行

最後のステップは、OCIコンピュート・インスタンスをプロモートして検出ジョブを実行することです。コンピュート・インスタンスをより徹底的に監視し、使用しているリソースについてのインサイトを取得できます。このステップでは、OCIポータルでクラウド・シェルを開く必要があります。

  1. ホーム・ページからOCI Cloud Shellをクリックすると、次のウィンドウが表示されます。また、OCI CLIがインストールされているデバイスでステップを実行することもできます。

    クラウド・シェル

  2. コマンドoci –versionを使用して、OCI CLIのバージョンを確認します。スタック・モニタリング・コマンドは、OCI CLI 3.XX以上で実行されます。

  3. 任意のディレクトリの下のクラウド・シェルにparameters.JSONという名前のJSONファイルを作成します。次に示すJSONをコピーし、「」、「」、「」をそれぞれのパラメータに置き換えます。変更するパラメータの詳細は、表「JSON入力パラメータ」を参照してください。

    {
        "discoveryType": "ADD",
        "discoveryClient": "host-discovery",
        "compartmentId": "<Compartment-ID>",
        "discoveryDetails": {
          "agentId": "<Agent-ID>",
          "resourceType": "HOST",
          "resourceName": "<HostName or IP Address>",
          "properties": {
            "propertiesMap": {}
          }
        }
    }
    

    JSON入力パラメータ

    入力フィールド 説明
    compartmentId コンピュート・インスタンスが存在するコンパートメントOCID。
    agentId リソースをモニタリングしている管理エージェントのOCID。
    resourceName スタック・モニタリング内のホストの完全修飾ドメイン名(FQDN)。
  4. 前述のJSONファイルを保存した後、<path_to_JSON_file>パラメータを前のステップで作成したJSONファイルの実際のパスに置き換えて、次のコマンドを実行します。pwdコマンドを使用して、JSONファイル・パスを取得できます。

    oci stack-monitoring discovery-job create --compartment-id "your-compartment-id" --from-json file://< path_to_JSON_file>

    検出ジョブ"

  5. このプロセスの完了には最大5分から10分かかる場合があり、OCIポータルをリフレッシュすると、「スタック・モニタリング」ページでスタック・モニタリングが有効になり、完全なダッシュボードを表示できます。プロモーション後、コンピュート・インスタンスのリソース・タイプはホストになります。

    スタック・モニタリング・ダッシュボード

  6. 「リソース検出」でプロモーション・ジョブのステータスを確認し、リソースの検出が成功したことを確認します。

    SMエージェントリスト

  7. スタック・モニタリング・ダッシュボードで、リソース・ブロックを選択すると、モニタリングを有効にしたコンピュート・インスタンスおよびホストのリストが表示されます。

    SMリスト2

  8. リストから目的のホストを選択すると、その特定のホストについて表示されるメトリックおよび表の詳細ビューが表示されます。

    SMエージェントの概要

    ホスト情報およびメトリックは、リソース詳細ページにチャートおよび表として表示されます。

    メイン・ページ・チャート1

    メイン・ページ・チャート2

    メイン・ページ・チャート3

    「Filesystem Used (GB)」および「Filesystem Utilization (%)」を選択して、ホストに存在するストレージに関するより具体的な情報を取得できます。表ビューには、表スタイル/書式のすべてのメトリックが表示されます。

    メイン・ページ表

    インスタンスの特定の情報を選択すると、パーセントとストレージの両方(GB)で表示されます。ホスト・マシンに表示される各ファイルシステムは、マウント・ポイントを表形式で表します。

    ディスクテーブルInfor

タスク4: アラームの有効化

  1. メトリックがホストの「リソース詳細」ページに表示されたら、特定のメトリックのアラートを取得するには、「監視および管理」「モニタリング」「アラーム・ステータス」にナビゲートします。

  2. 「アラームの作成」をクリックし、アラームの名前と重大度を入力します。ホスト・コンパートメント、ネームスペース"oracle appmgmt、 resource group host"を選択し、ドロップダウン・リストからメトリック名を選択できます。

  3. 要件に基づいて、「ファイルシステムの使用」または「ファイルシステムの使用率」メトリック、間隔期間、および統計を選択します。

  4. メトリックを選択したら、メトリック・ディメンションを選択します。

    • 特定のホストを指定するには、「agentHostName」を選択し、ドロップダウン・メニューからホストのディメンション値を選択します。

    • 次に、「追加ディメンション」をクリックし、fileSystemNameを選択してから、アラートをトリガーするマウント・ポイントのディメンション値をリストから選択します。

  5. 「トリガー」セクションで、アラームを起動状態にする条件を設定します。たとえば、agentHostName - "XXXX"および"fileSystemName" - "/Dev" (統計- "mean")の場合です。ファイルシステムストレージが90%を超えると、「storage full」のアラートがトリガーされます。

  6. 「アラーム通知の定義」セクションで、この特定のアラームに関するアラートを受信する電子メールアドレスを指定した宛先サービス- 通知とトピックを選択します。通知およびトピックの作成の詳細は、ここをクリックしてください。

  7. また、「メッセージ形式」を選択して、アラートの書式設定を改善することもできます。同じメトリックに対して継続的なアラートを受信する場合は、「通知の繰返し」チェック・ボックスを選択します。

  8. アラームを保存します。

    アラーム 1

    アラーム 2

    アラーム 3

  9. 定義されたルールがメトリックに一致すると、アラームがトリガーされ、メトリック・アラームの例を次に示します:

    アラーム 5

    OCIスタック・モニタリングおよびアラーム機能で提供される高度なメトリックを使用して、コンピューティング・インフラストラクチャ(特にストレージ・セクター)を監視できます。様々なサービスのスタック・モニタリングのその他の機能を確認することもできます。

謝辞

その他の学習リソース

docs.oracle.com/learnで他のラボをご覧いただくか、Oracle Learning YouTubeチャネルでより無料のラーニング・コンテンツにアクセスしてください。また、education.oracle.com/learning-explorerにアクセスして、Oracle Learning Explorerになります。

製品ドキュメントについては、Oracle Help Centerを参照してください。