クラウドでの監視および管理

Oracle Cloud Infrastructure (OCI) Observability and Managementサービスを使用して、クラウド環境の管理に役立つ可視性や実践的なインサイトを取得します。

監視と管理に関連するOCIサービスにより、クラウド環境内の変更をモニター、監査およびアラートできます。機械学習に基づくインサイトは、スタックのすべてのレイヤーにわたって様々なテクノロジにデプロイされるリソースを管理するのに役立ちます。

最優先事項は、スケーラブルで予測可能な結果を可能にする自動化を促進することです。DevOpsモニタリングおよびIT運用管理用の統合機能および自動化を使用して、ITの問題を防止および解決します。

OCIの監視および管理サービスには、次のサービスが含まれます:

Application Performance Monitoring
Application Performance Monitoringは、アプリケーションのパフォーマンスを詳細に可視化し、一貫したレベルのサービスを提供するための迅速な診断を可能にします。これには、オンプレミスまたはクラウドのクライアント、サードパーティ・サービス、バックエンド・コンピューティング層にわたる複数のコンポーネントおよびアプリケーション・ロジックスのモニタリングが含まれています。概要は、Application Performance Monitoringの製品ページを参照してください。
Management Agent
管理エージェントは、OCIと他のターゲット間の低レイテンシの対話型通信およびデータ収集を提供するサービスです。
データベース管理
データベース管理は、Oracleデータベースをモニターおよび管理するための包括的なデータベース・パフォーマンス診断および管理機能を提供します。概要は、データベース管理の製品ページを参照してください。
ロギング
ロギングでは、テナンシ内のすべてのログを有効化、表示および管理し、OCIリソースからログにアクセスできます。これらのログには、リソースのパフォーマンスおよびアクセス方法を説明するクリティカルな診断情報が含まれます。概要は、ロギングの製品ページを参照してください。
Log Analytics
Log Analyticsは統合されたクラウド・ソリューションで、アプリケーションおよびシステム・インフラストラクチャからすべてのログ・データを監視、集計、索引付け、分析、検索、探索および関連付けすることができます。概要は、Log Analytics製品ページを参照してください。
Java管理
Java管理は、OCI内のレポートおよび管理インフラストラクチャです、これにより、企業内でのJavaの使用の監視および管理ができます。
モニタリング
モニタリングを使用して、メトリックを問い合せたり、アラームを管理します。メトリックとアラームにより、クラウド・リソースのヘルス、容量およびパフォーマンスをモニターできます。
Opsインサイト
Opsインサイトは、データベースおよびホストのリソースの使用量および容量に関する包括的な情報を提供します。このサービスを使用して、CPUおよびストレージ・リソースを分析し、容量を予測および計画し、データベース・フリート全体でSQLパフォーマンスの問題をプロアクティブに識別します。概要は、Opsインサイトの製品ページを参照してください。
サービス・コネクタ・ハブ
サービス・コネクタ・ハブは、OCIサービス間でのデータの移動時の相互作用を一体的に記述、実行および監視できるようにするクラウド・メッセージ・バス・プラットフォームである。概要は、サービス・コネクタ・ハブの製品ページを参照してください。
スタック・モニタリング

スタック・モニタリングでは、アプリケーション・サーバーやデータベースなど、アプリケーションとその基礎となるスタックをプロアクティブに監視できます。アプリケーション・トポロジを含むアプリケーションのすべてのコンポーネントを検出することで、スタック・モニタリングは、すべてのアプリケーション・コンポーネントのステータス、ロード、レスポンス、エラーおよび使用率メトリックを自動的に収集します。アプリケーション・スタックの各コンポーネントは、リソースと呼ばれます。

概要は、Stack Monitoringの製品ページを参照してください。

新規にデプロイしたクラウド環境を包括的に可視化するには、組織のニーズに合った監視および管理サービスを使用します。

モニタリング

メトリックとアラームを使用して、クラウド・リソースのヘルス、容量およびパフォーマンスをモニターします。

次の表に、組織のモニタリング戦略を定義する際に考慮すべき主要な領域を示します。

領域 モニターするデータ
アカウント

アカウント管理

他のリージョンへのサブスクリプション拡張

管理アカウントの作成および削除

割当て違反

クラウド・サービスの使用状況

インスタンスの数

ストレージ(最新、最大および平均使用など)

オブジェクト数(プロシージャおよびビューなど)

コンパートメントの数

過度に使用されている、または十分に使用されていないリソース

サービスの月次または年次使用率

メトリック

ビジネス・メトリック

セキュリティ・メトリック

パフォーマンス・メトリック

財務メトリック

請求

予算

請求

コンパートメントの割当て

運用

定期的に実行する運用アクティビティまたは共通タスクを定義します。

運用戦略には、次の推奨アクティビティを含める必要があります:

  • 運用手順の定義
  • メンテナンス・スケジュールの確立
  • 構成管理ユーティリティの使用
  • ストレージとデータベースのデータのバックアップ
  • バックアップの整合性およびプロセスの検証
  • バックアップのセキュリティと暗号化の検証
  • ディザスタ・リカバリのためにデータを複製
  • OS管理の自動化(OS Management Hubサービス)
  • パッチ適用およびメンテナンスの自動化
  • セキュリティ・パッチ、バグ修正および拡張更新の最新情報の入手
  • サービス制限の管理および固定サービス制限の認識
  • サービス制限におけるフェイルオーバー使用量の考慮
  • コンパートメント割当ての設定

監査

監査サービスを使用して、OCIリソースとテナンシに関連するアクティビティを把握します。

監査ログ・イベントをセキュリティ監査に使用して、OCIリソースの使用状況や変更点をトラッキングしたり、標準または規制へのコンプライアンスを保証できます。

監査戦略には、次の推奨アクティビティを含める必要があります:

  • 監査の構成
  • 監査の実施
  • ポリシーの監査。次に例を示します:

    • ポリシーはどこに定義され、コンパートメント使用に関する組織の標準に準拠していますか。
    • 動的グループの使用状況を監査します。これらのグループは過剰な権限を付与しますか。
    • どのサービスが構成されて、どこにありますか。特定のコンパートメントまたはグループに制限されているサービスはありますか。
    • 削除する必要がある重複した文はありますか。
    • テナンシ全体に権限を付与するポリシーはありますか。
    • 必要以上の権限を持つグループはありますか。
    • 長時間実行されているワークフローのチェック
    • システム・ログ、アプリケーション・ログおよび監査ログのメンテナンス
    • 脆弱性の継続的なスキャン

イベントおよび通知

イベント・サービスを使用して、テナンシに自動化を作成します。通知サービスを使用して、アラーム、サービス・コネクタおよびイベント・ルールがトリガーされるたびにメッセージを取得します。

イベントは、リソースの変更を示す構造化メッセージです。イベントは、通知などのアクションをトリガーします。イベントのルールは、作成したコンパートメントおよび子コンパートメント内のイベントに適用されるため、ルート・コンパートメント・レベルでルールを作成することをお薦めします。

通知サービスは、OCI内で目的のイベントが発生した場合にユーザーおよびアプリケーションにメッセージをブロードキャストするマルチチャネル・メッセージング・サービスです。電子メール、HTTPS、PagerDuty、Slack、OCIファンクション・サービスなど、様々なサブスクリプション・プロトコルにメッセージを送信できます。一部のチャネルでは、アクティブになる前にサブスクリプションの確認が必要です。

モニタリング・メトリックに関連するメッセージを受信するために、少なくとも1つの通知トピックおよびサブスクリプションを作成することをお薦めします。

次のリソースに変更がある場合も、通知がトリガーされます:

  • アイデンティティ・プロバイダ(IdP)
  • IdPグループ・マッピング
  • OCI Identity and Access Management (IAM)グループ
  • IAMポリシー
  • ユーザー
  • 仮想クラウド・ネットワーク(VCN)
  • ルート表
  • セキュリティ・リスト
  • ネットワーク・セキュリティ・グループ
  • ネットワーク・ゲートウェイ