レジリエンシ

回復性とは、アプリケーションまたはワークロードが障害から迅速にリカバリし、高可用性を維持する機能です。クラウド・コンピューティングの重要な側面は、予期しないイベントが発生した場合でも、アプリケーションとワークロードがアクセス可能で機能し続けることを保証するためです。次の情報では、Oracle Cloud Infrastructure (OCI)の回復性について説明します。この情報は、クラウド・コンピューティングにおけるレジリエンシの重要性と、OCIが提供するレジリエンシ機能を強調しています。回復力は、ビジネスの継続性を確保し、サービスの中断のリスクを最小限に抑えるため、重要な考慮事項となります。

障害からのリカバリ

OCIは、アプリケーションとワークロードに高いレベルの耐障害性と可用性を提供するように設計された一連のツールとサービスを提供します。1つの製品はPlatform as a Service (PaaS)で、障害からリカバリし、ワークロードの高い稼働時間を確保するためのいくつかのメカニズムが含まれています。

たとえば、PaaSサービスであるAutonomous AI Databaseサービスは、組込みのフォルト・トレランスと自動バックアップおよびリカバリ機能を提供します。障害が発生した場合、データベースは自動的にスタンバイ・データベースにスイッチオーバーできるため、ダウンタイムを最小限に抑え、重要なビジネス・プロセスの継続性を確保できます。

OCIは、コンピュート・インスタンスの自動バックアップおよびリカバリ機能を提供し、障害発生時にインスタンスを以前の状態にリストアできるようにします。この機能により、予期しないイベントが発生した場合にクリティカルなワークロードを機能状態にリストアできることがわかり、安心です。

OCIが提供する回復性と可用性機能(PaaSサービス、自動化されたバックアップとリカバリなど)は、アプリケーションとワークロードが常に利用可能で高性能であることを保証するのに役立ちます。これにより、ハードウェア障害やその他の中断などの予期しないイベントが発生した場合でも、顧客へのサービスの運用と提供を継続できます。

高可用性

OCIは、ダウンタイムを最小限に抑え、障害発生時でもアプリケーションにアクセスし、機能し続けるように特別に設計された、堅牢で可用性の高いアーキテクチャを提供します。このアーキテクチャは、リージョン内の複数のフォルト・ドメイン(FD)および可用性ドメイン(AD)にリソースをデプロイすることで実現されます。各フォルト・ドメイン(FD)は、単一のアベイラビリティ・ドメイン内の異なる物理ハードウェアを表し、アンチアフィニティを提供します。一方、各アベイラビリティ・ドメイン(AD)は、他のADから分離された独立したデータ・センターであり、冗長性とフォルト・トレランスを提供します。すべてのアベイラビリティ・ドメインに3つのフォールト・ドメインが含まれます。

たとえば、2つのWebサーバーとクラスタ化されたデータベースがあるアプリケーションなど、可用性の高いアプリケーションを考えてみます。このシナリオでは、各コンポーネントに最適な配置は、1つのWebサーバーと1つのデータベース・ノードを1つのフォルト・ドメインにグループ化し、もう一方のペアを別のフォルト・ドメインにグループ化することです。この配置戦略により、各コンポーネント・ペアの残りの半分が機能し続けるため、1つのフォルト・ドメインに障害が発生しても、アプリケーションの停止は発生しません。

OCIが提供する高可用性アーキテクチャ(複数のフォルト・ドメインおよび可用性ドメインにわたるリソースのデプロイメントを含む)は、ディザスタ・リカバリのペア・リージョンに加えて、予期しないイベントが発生した場合でも、アプリケーションおよびワークロードが使用可能で機能したままであることを確認します。これにより、顧客がサービスにアクセスできることが保証され、顧客満足度とビジネス継続性の維持に役立ちます。詳細は、高可用性(HA)に関するクラウド導入フレームワークの推奨事項およびベスト・プラクティスを参照してください。

また、OCIはディザスタ・リカバリに対応したリージョンを提供しています。これにより、2つのリージョンにまたがるリソースをレプリケートして、回復力を高めることができます。

ディザスタ・リカバリ

ディザスタ・リカバリ(DR)は、壊滅的な出来事の後にITシステムとインフラストラクチャをリストアするプロセスです。リージョンは他のリージョンから独立しており、複数の国または大陸をもまたがる広大な空間で分離できます。一般に、近くのリソースの使用は遠くにあるリソースの使用よりも高速であるため、アプリケーションは、それが最も頻繁に使用されるリージョンにデプロイします。ただし、様々なリージョンにアプリケーションをデプロイして、地域全体の壊滅的なイベントのリスクを軽減し、法的管轄区域、税ドメイン、その他のビジネス基準またはソーシャル基準に対する様々な要件を満たすこともできます。

OCIには、ホット・スタンバイ・ソリューション、ウォーム・スタンバイ・ソリューション、コールド・スタンバイ・ソリューションなど、複数のディザスタ・リカバリ・オプションが用意されています。ホット・スタンバイ・ソリューションは、データのリアルタイム・レプリケーションを提供し、ほぼゼロのダウンタイムを必要とするミッションクリティカルなワークロードに最適です。ウォーム・スタンバイ・ソリューションは、一定の間隔でデータをレプリケートし、ダウンタイムを許容できるワークロードに適しています。コールド・スタンバイ・ソリューションでは、バックアップからシステムを手動でリストアする必要があり、大幅なダウンタイムを許容できるワークロードに適しています。

また、OCIでは、アクティブ/パッシブ・アーキテクチャやアクティブ/アクティブ・アーキテクチャなど、いくつかのHA DRモデルをサポートしています。アクティブ/パッシブ・アーキテクチャでは、障害が発生した場合にアクティブ化されるスタンバイ環境でリソースをレプリケートします。アクティブ/アクティブ・アーキテクチャでは、複数のリージョンまたはADにリソースをレプリケートし、それらにトラフィックを分散してダウンタイムを最小限に抑えます。

最大可用性アーキテクチャ

OCIは、アクティブ/パッシブ・アーキテクチャとアクティブ/アクティブ・アーキテクチャを含む、さまざまな非常に効果的なHA DRモデルを提供し、障害やメンテナンスが発生した場合の重要なリソースのシームレスな継続性と高可用性を確保します。たとえば、アクティブ/パッシブ・アーキテクチャでは、スタンバイ環境がリソースをレプリケートし、プライマリ環境に障害が発生した場合にのみアクティブになります。一方、アクティブ/アクティブ・アーキテクチャでは、複数のリージョンまたはADにリソースをレプリケートしてトラフィックを分散し、ダウンタイムを最小限に抑えます。

OCIは、エンドツーエンドのアプリケーションおよびデータベースの可用性を最適なレベルで保証するために、本番環境の乱雑な状況に耐える能力に自信を持つシステムとの実験を行う分野であるChaos Engineeringを採用しています。Maximum Availability Architectures(MAA)は、テストおよび開発のライフ・サイクル全体でカオス・エンジニアリングを活用し、さまざまな障害や計画されたメンテナンス・イベントを積極的に注入して、アプリケーションとデータベースへの影響を評価します。この実験では、ベスト・プラクティス、不具合および知見を導出し、その知識を実践してOCIのクラウドMAAソリューションの進化と改善を行います。

OCIの自動データベース・バックアップ(ADB)は、OCI Object Storageに格納され、別の可用性ドメインにレプリケートされるため、障害発生時にデータベースをリストアできます。また、Oracle Autonomous AI Database on Exadata Cloud@Customer (ADB-C@C)では、NFSまたはZero Data Loss Recovery Appliance (ZDLRA)へのバックアップを選択できますが、これらのバックアップのレプリケーションの構成および管理はユーザーが担当します。

OCIの高度なHA DRモデル、カオス・エンジニアリング、および複数の可用性ドメインへのレプリケーションによる自動データベース・バックアップにより、潜在的なデータ損失やシステム障害に対する包括的な保護を実現し、重要なリソースの最大可用性と継続性を確保します。

復元までの平均時間

平均リストア時間(MTTR)は、障害発生後のサービスまたはシステムのリストアにかかる平均時間を測定するクリティカル・メトリックです。MTTRが長引くと、財務および評判が著しく低下し、収益の損失、顧客満足度の低下、さらには規制上の罰金につながる可能性があります。

OCIは、MTTRを削減し、サービスの最大可用性を確保するために、TerraformやAnsibleなどの複数のツールおよびサービスを提供しています。たとえば、自動バックアップおよびリカバリ・プロセスを使用すると、停止または障害発生時にデータおよびアプリケーションを迅速にリカバリできます。また、複数のアベイラビリティ・ドメインにわたるデータのリアルタイム・レプリケーションにより、サービスの迅速なリストアが可能になり、ダウンタイムを最小限に抑え、障害の影響を低減できます。

MTTRを継続的に測定して、不利な状況下でのサービスのリストアに必要な時間を理解することが不可欠です。この評価は、改善すべき領域を特定し、MTTRを長期的に削減し、最適なサービスの可用性を確保し、ダウンタイムの延長による損傷のリスクを低減するために重要です。

継続的な統合と継続的なデプロイメント

継続的インテグレーションおよび継続的デプロイメント(CI/CD)は、ソフトウェア開発プロセスの合理化、生産性の向上およびエラーの削減に役立つ重要なDevOpsプラクティスです。これらの演習では、ソフトウェアの構築、テストおよびデプロイのプロセスを自動化し、品質と一貫性の向上により、コードをより頻繁にリリースできるようにします。

OCIは、Jenkins、GitLab、GitHubなどの一般的なCI/CDツールとの統合を通じて、これらのベスト・プラクティスをサポートしています。これらのツールは、コードの変更からテストおよびデプロイメントまで、ソフトウェア開発およびデプロイメントのための効率的で自動化されたパイプラインを提供します。これらのツールをOCIに統合することで、クラウドのスケーラビリティと柔軟性を活用して、開発プロセスを加速し、全体的な生産性を向上させることができます。

たとえば、OCIでJenkinsを活用することで、構築および導入プロセスを自動化し、コードを徹底的にテストして本番環境に迅速に導入できます。同様に、OCIでGitLabを使用すると、チーム間のシームレスなコラボレーションが可能になり、効率的なコード共有と変更の追跡が容易になります。また、GitHubとOCIの統合により、コード・リポジトリの管理、バージョン制御の有効化、およびコード・レビューの容易化を行うためのプラットフォームが提供されます。

OCI DevOpsサービスは、開発者向けのCI/CDワークフローをサポートするように設計されたフルマネージド・クラウド・サービスです。このプラットフォームを使用すると、DevOpsエンジニアはOracle Cloudでソフトウェアとアプリケーションを簡単に構築、テストおよびデプロイできるため、開発プロセスを合理化するエンドツーエンドのソリューションが提供されます。

このサービスにより、変更に関連するエラーを減らし、リリースの作成とデプロイに必要な時間を最小限に抑えるDevOpsビルドおよびデプロイメント・パイプラインを作成でき、最終的にはコードの全体的な品質と一貫性が向上します。さらに、このサービスはセキュアなコード・ストレージのためのプライベートGitリポジトリを提供し、外部コード・リポジトリへの接続をサポートすることで、外部チームとのコラボレーションを合理化できます。

フルマネージド・クラウド・サービスとして、OCIのDevOpsサービスは、自動化されたスケーリングとメンテナンスを提供し、インフラストラクチャ管理を気にすることなくコードに集中できます。これにより、プラットフォームが常に最新であり、開発プロセスをサポートできることが保証され、DevOpsワークフローを合理化し、より高品質のコードでより迅速なリリース・サイクルを達成したい場合に理想的なソリューションとなります。

DevOps, SecOps, DevSecOps, IaC

DevOps、SecOpsおよびDevSecOpsは、コラボレーション、自動化およびセキュリティを重視して最新のソフトウェア開発の要求を満たすことができる重要な方法論です。Infrastructure as Code (IaC)は、インフラストラクチャをプロビジョニングおよび構成して自動デプロイメントを行う上で重要な役割を果たします。

DevOps:開発チームと運用チーム間のコラボレーションを促進し、ソフトウェアをより速く、より高品質で、より信頼性の高い方法で提供できるようにするため、不可欠です。この方法論では、自動化の重要性が強調され、チームがコードをより効率的に構築、テストおよびデプロイできるようになり、市場投入までの時間が短縮されます。OCIでは、Jenkins、GitLab、GitHubなどのツールを使用してソフトウェア開発プロセスを自動化することで、DevOpsプラクティスを使用できます。
SecOps:セキュリティを開発プロセスに統合し、セキュリティの脆弱性を早期に特定して対処し、侵害のリスクを軽減し、機密データを保護するため、重要になります。この方法では、セキュリティの重要性を強調することで、セキュアなソフトウェア・アプリケーションを確実に構築およびデプロイできます。OCIでは、Check PointやFortinetなどのサードパーティのセキュリティ・ツールとの統合を使用して、高度な脅威の検出と保護を提供できます。
DevSecOps:これらの2つの方法と、最初からDevOpsプロセスに統合されたセキュリティの組合せ。このアプローチにより、アプリケーションは安全で信頼性が高く、コンプライアンス要件を満たします。セキュリティを最初から重視することで、より高品質で信頼性の高いセキュアなアプリケーションをより迅速に構築およびデプロイできます。OCIでは、セキュリティ・ゾーンなどの組込みのセキュリティ機能を使用して、ワークロードを分離し、ネットワーク・トラフィックを制御してセキュリティと回復力を向上できます。
IaC:インフラストラクチャのデプロイメントと管理を自動化するコードを記述する重要な演習。この方法論により、インフラストラクチャの導入の一貫性と信頼性が確保され、エラーのリスクが軽減され、回復性が向上します。OCIでは、TerraformやAnsibleなどのツールを使用して、インフラストラクチャ・リソースのプロビジョニングと構成を自動化できます。

すべてを自動化

自動化は、自己回復性のあるクラウド・インフラストラクチャの構築と維持において重要な側面です。プロセスとタスクを自動化することで、エラーを減らし、効率を向上させることができます。クラウドで高可用性を維持するには、自動化と回復力を優先する文化を構築することが不可欠です。これは、インフラストラクチャのデプロイメント、構成および管理の自動化機能を提供するTerraform、Ansible、Jenkinsなどのツールやサービスを使用して実現できます。

たとえば、OCIには、Resource Managerなど、さまざまな自動化ツールが用意されており、TerraformまたはOracle Cloud InfrastructureのネイティブAPIを使用してクラウド・リソースの作成、構成、およびデプロイメントを自動化できます。また、自動化を使用してバックアップや更新などの日常的なタスクを実行することで、エラーのリスクを大幅に軽減し、クラウド・インフラストラクチャの全体的な回復力を高めることができます。

非機能要件- SLI、SLOおよびSLA

パフォーマンス、スケーラビリティ、可用性などの非機能要件は、アプリケーションおよびワークロードがビジネス・ニーズを満たすようにするために重要な役割を果たします。これを実現するには、サービスとリソースのパフォーマンスと可用性を測定するメトリックを設定することが重要です。サービス・レベル・インジケータ(SLI)、サービス・レベル目標値(SLO)およびサービス・レベル合意(SLA)は、クラウド・インフラストラクチャの有効性の測定に役立つメトリックです。

OCIは、クラウド・モニタリング、ロギング、通知など、これらのメトリックをモニターおよび管理できる様々なツールおよびサービスを提供します。Cloud Monitoringでは、OCIのリソースとサービス全体で、メトリックとログを収集、分析、アラートを送信できます。インフラストラクチャの健全性とパフォーマンスを一元的に把握できるため、SLI、SLO、SLAに影響を与える可能性のある問題を迅速に特定し、トラブルシューティングできます。ロギングを使用すると、OCIサービス、アプリケーション、インフラストラクチャ・コンポーネントなど、様々なソースからログ・データを取得および分析できます。通知を使用すると、事前定義済の条件が満たされたときにアラートおよび通知を受信できるため、SLI、SLOおよびSLAに影響を及ぼす問題の前にアクションを実行できます。

これらのツールとサービスを活用することで、クラウド・インフラストラクチャを詳細に可視化し、SLI、SLO、SLAをプロアクティブに監視および管理できます。これにより、アプリケーションとワークロードがビジネス・ニーズを満たしていることを確認し、発生した問題に迅速に対応し、ダウンタイムを最小限に抑え、全体的な回復力を向上させることができます。

たとえば、Cloud Monitoringを使用して、OCIでホストされているWebアプリケーションのレスポンス時間と可用性を監視し、Loggingを使用してエラーを追跡し、パフォーマンスの問題を診断できます。通知を使用すると、サービスの中断やパフォーマンスの問題が発生したときに管理者に警告し、問題が深刻になる前に管理者にアクションを実行させることができます。

障害および可用性ドメイン

フォルト・ドメインおよび可用性ドメインは、回復性を高め、潜在的な障害の影響を減らすクラウド・コンピューティングの重要な概念です。特定の領域でフォルトが発生した場合、フォルト・ドメインを使用して、クリティカル・リソースに影響を与えないようにし、システムへの全体的な影響を軽減できます。アベイラビリティ・ドメインは、冗長性とフォルト・トレランスを実現するためにデータ・センター間で分離します。これにより、1つの可用性ドメインで障害が発生した場合、ワークロードは別の可用性ドメインにフェイルオーバーできるため、障害が発生した場合でもサービスが使用可能になります。

OCIは、フォルト・ドメインと可用性ドメインを利用して、高可用性を実現します。たとえば、OCIでは、各リージョンは3つの可用性ドメインで構成され、これらは物理的に相互に分離され、独立した障害ドメインを提供します。OCIは、フォルト・ドメインを使用して、特定の可用性ドメイン内のインスタンスが複数のフォルト・ドメインに分散されるようにし、高可用性と障害に対する保護を確保します。

複数リージョン

OCIのリージョンは、災害発生時の回復性と継続性を確保する上で重要な要素です。リージョンは、冗長性とフォルト・トレランスを提供する地理的に分離された2つのリージョンです。自然災害、サイバー攻撃、人為的エラーなどの壊滅的な事象が発生した場合、ペア・リージョンでは、重要なリソースがレプリケートされ、代替リージョンで使用可能になります。これにより、ダウンタイムやデータ損失のリスクが軽減され、企業や顧客に安心感をもたらします。

たとえば、ある企業が米国で事業を展開し、ある地域に自然災害、政治的不安、停電などの壊滅的なイベントがある場合、もう一方の地域がシームレスに引き継ぎ、ビジネスの継続性を確保できます。プライマリ・リージョンが米国東部(アッシュバーン)で停止が発生している場合、セカンダリ・リージョンの米国西部(フェニックス)は、プライマリ・リージョンがオンラインに戻るまで、必要なサービスを引き継ぎ、提供できます。このアプローチにより、ユーザー・エクスペリエンスが中断されることはなく、停止中もデータが使用可能になります。OCIのペア・リージョン内のリソースのアクティブ/アクティブまたはアクティブ/パッシブ・レプリケーションにより、データが継続的に使用可能になるため、中断することなくバックアップ・リージョンにフェイルオーバーできます。

複数のリージョンにより、企業は効果的なディザスタ・リカバリ計画を実装し、データを保護し、サービスを常に利用できるようになります。

Data GuardおよびGoldenGate

Data Guardは、エンタープライズ・データベースのディザスタ・リカバリおよび高可用性を提供するOracle Databaseの機能です。プライマリ・データベースに障害が発生した場合にテイクオーバーできるスタンバイ・データベースを作成できます。スタンバイ・データベースはプライマリ・データベースと継続的に同期されるため、データが常に最新であることが保証されます。これにより、クリティカルなシステムおよびアプリケーションに対する耐障害性のレイヤーが追加されます。

GoldenGateは、異なるデータベース間のリアルタイム・データ統合を可能にするデータ統合およびレプリケーション・ツールです。異機種間データ統合をサポートしています。つまり、異なるデータベース・ベンダー間および単一のベンダー内でデータをレプリケートできます。GoldenGateは、データベース移行、データ・ウェアハウスおよびビジネス・インテリジェンスにも使用できます。

OCIは、さまざまな要件やユースケースに対応するために、さまざまなバージョンのData GuardとGoldenGateを提供しています。たとえば、Data Guard Standard Editionは基本的なディザスタ・リカバリ機能を提供し、Data Guard Enterprise Editionは自動フェイルオーバーやデータ保護などのより高度な機能を提供します。GoldenGate Standard Editionはデータベース間でリアルタイムのデータ・レプリケーションを提供し、GoldenGate Enterprise Editionには競合検出や解決などの追加機能が含まれています。

これらのテクノロジをOCIと組み合せて使用することで、災害やシステム障害が発生した場合でも、重要なデータが常に使用可能かつ最新の状態に保たれるようにすることで、システムの自己回復性を向上させることができます。たとえば、金融サービス会社では、Data Guardを使用して、OCIの米国北部および南部リージョンなど、別のリージョンのスタンバイ・データベースに本番データベースをレプリケートすることで、壊滅的なイベントから迅速にリカバリし、中断することなく顧客へのサービスを継続できます。

日付レプリケーション

データ・レプリケーションは、障害発生時でもデータを使用できるようにするため、クラウド・コンピューティングにおける回復性の重要な側面です。レプリケーションでは、データのコピーを作成し、複数の場所に格納します。これは、障害または障害からのリカバリに使用できます。

OCIには、データをレプリケートするための複数のストレージ・オプションが用意されています。Object Storageは、リージョンをまたがるデータのレプリケーションを可能にする拡張性と耐久性に優れたストレージ・サービスです。リージョン間レプリケーションを構成すると、データは自動的に別のリージョンにレプリケートされ、高いレベルの回復力が提供されます。災害や停電が発生した場合、レプリケートされた場所からデータに簡単にアクセスできるため、ビジネスの継続性が確保されます。

File Storageは、複数のインスタンスが同時にアクセスできる、可用性と耐久性の高いファイル・システムを提供します。レプリケーション・ポリシーを使用することで、ファイルは自動的に別の可用性ドメインにレプリケートされ、フォルト・トレランスと高可用性が提供されます。

Block Volumeは、レプリケーション機能を提供する、可用性の高い耐久性の高いブロック・ストレージ・サービスです。Block Volume Replicationを構成すると、データは同じリージョン内の別の可用性ドメイン内の別のブロック・ボリュームに自動的にレプリケートされます。これにより、障害や停止が発生した場合でもデータが使用可能になります。

データ・レプリケーションはクラウド・コンピューティングの回復性を維持するために不可欠であり、OCIには、リージョン、可用性ドメインおよびインスタンス間でデータをレプリケートするためのオプションがいくつか用意されています。これらのオプションを使用すると、障害または障害発生時にデータの可用性と耐久性が高く、簡単にリカバリできます。

全体的な信頼性の計算

アプリケーションまたはワークロードをクラウドにデプロイする際には、信頼性を考慮することが重要です。失敗の確率と影響を測定することは、事業運営の円滑な運営を確保するために不可欠です。OCIは、クラウド・インフラストラクチャの全体的な信頼性とコストを計算するのに役立つ様々なツールとサービスを提供します。たとえば、クラウド・アドバイザは、アーキテクチャに関する潜在的な問題を特定し、信頼性を向上させるための推奨事項を提供しますが、Cost Estimatorはクラウド・インフラストラクチャの実装コストを見積るのに役立ちます。これらのツールとサービスを使用することで、アプリケーションとワークロードが信頼性とコスト効率に優れた方法でデプロイされるようにできます。

パッチ適用およびアップグレードの計画

クラウドで最適なセキュリティとパフォーマンスを維持するには、アプリケーションとインフラストラクチャを最新の状態に保つことが重要です。必要なパッチやアップグレードを適用しないと、システムが攻撃に弱くなり、業務運営を妨げるパフォーマンスの問題を引き起こす可能性があります。OCIは、パッチ適用およびアップグレード・プロセスの合理化と自動化を支援する様々なツールとサービスを提供しています。

OCIが提供するパッチ適用自動化およびアップグレード・アドバイザ・サービスは、パッチ適用およびアップグレード・プロセスの計画と実行を容易にするために設計されています。また、OS管理サービス(OSMS)では、Oracle LinuxまたはWindowsインスタンスのパッチ適用を自動化できます。OSMSを使用すると、システムをグループに編成し、ジョブをスケジュールして、すべてのシステムに最新の更新を適用できます。このサービスでは、様々な事前定義済ソフトウェア・ソースにアクセスでき、LinuxシステムにOracle yumリポジトリの全範囲が提供されます。その結果、システムを常に最新のパッチで最新の状態に保つことができ、セキュリティとパフォーマンスが向上します。

事業継続計画

堅実なビジネス継続性計画は、あらゆる組織にとって、破壊的な出来事に直面しても事業を継続できるようにするために不可欠です。これには、自然災害、停電、サイバー攻撃などが含まれます。

OCIは、このタイプの計画をサポートするためのさまざまなツールとサービスを提供しています。たとえば、サイト間VPNサービスを使用すると、オンプレミス・ネットワークとOCI Virtual Cloud Network (VCN)の間にセキュアな暗号化された接続を作成し、データ・センターをクラウドに拡張できます。同様に、FastConnectサービスは、オンプレミス・インフラストラクチャとOCIリソース間のプライベートで高帯域幅の接続を提供し、データをレプリケートしてクラウドで重要なアプリケーションを実行できます。

疎結合アーキテクチャの使用

疎結合アーキテクチャは、コンポーネント間の依存性を減らすことで障害の影響を最小限に抑えることができるため、自己回復システムを構築する際の重要な要素です。依存関係を減らすことで、各コンポーネントを個別にスケーリングおよび展開できるため、システムの柔軟性と変更への適応性が向上します。OCIは、Oracle Functionsなどのこのアーキテクチャをサポートするツールやサービスを提供します。これにより、開発者は、他のコンポーネントと緊密に結合することなく、ワークロードの需要に基づいて自動的にスケーリングできるサーバーレス・アプリケーションを構築およびデプロイできます。もう1つの例は、Oracle Kubernetes Engine (OKE)で、コンテナ化されたアプリケーションを実行するためのスケーラビリティと柔軟性に優れたプラットフォームを提供します。OKEでは、簡単にスケーリングおよび管理できるモジュール化された疎結合アプリケーションを構築およびデプロイできるマイクロサービス・ベースのアーキテクチャを使用します。

異常なパターンの監視と適応

システムの自己回復性を確保するには、リソース使用率、トラフィックおよび動作の異常なパターンを監視して適応することが重要です。これらのパターンは、潜在的な問題がクリティカルになる前に特定し、システムのパフォーマンスと可用性に影響を与えるのに役立ちます。OCIは、クラウド・ガードやセキュリティ・ゾーンなどのツールやサービスを提供し、リソース使用率、ネットワーク・トラフィック、ユーザー行動の継続的な監視と分析を提供します。Cloud Guardは、リソースの監視を自動化し、クラウド環境におけるセキュリティの脅威や構成の誤りを検出するのに役立ちます。また、セキュリティ・ゾーンは、より高いレベルのセキュリティを必要とするワークロードおよびリソースに対してセキュアな環境を提供します。

SaaS、PaaSおよびIaaSからの選択

適切なクラウド・サービス・モデルを選択することは、アプリケーションおよびワークロードに必要な制御レベル、柔軟性および管理レベルを決定するため、非常に重要です。サービスとしてのソフトウェア(SaaS)、サービスとしてのプラットフォーム(PaaS)、サービスとしてのインフラストラクチャ(IaaS)などのクラウド・サービス・モデルには、異なる利点と欠点があります。SaaSは、簡単にデプロイでき、メンテナンスをほとんど必要としないフルマネージド・ソリューションを提供しますが、PaaSは、より制御とカスタマイズのオプションを備えた開発プラットフォームを提供します。IaaSはインフラストラクチャを完全に制御しますが、より多くの管理およびメンテナンスが必要です。パフォーマンスを最大化し、コストを削減し、高いレベルの自己回復性を維持するには、ビジネスに適したサービス・モデルを選択することが不可欠です。

失敗の予測

潜在的な障害の影響を軽減することは、クラウド・インフラストラクチャの自己回復性を確保するために重要です。OCIは、潜在的な障害点を予測し、緩和を計画できる様々なツールとサービスを提供します。たとえば、フォルト・ドメインと可用性ドメインは、自己回復性を高め、障害の影響を軽減するためにクラウド・コンピューティングで使用される概念です。リソースをまとめてグループ化し、異なるフォルト・ドメインおよび可用性ドメインに分散することで、単一障害点のリスクを最小限に抑えることができます。また、OCIのセキュリティ・ゾーンでは、ワークロードを分離し、セキュリティ・インシデントや障害の影響を軽減できます。

コストと信頼性

信頼性を維持しながらコスト効率を確保するには、クラウド・インフラストラクチャのコストとパフォーマンスのバランスを取ることが不可欠です。OCIは、Cost EstimatorやCost Managementなど、クラウド支出の監視と最適化に役立つさまざまなツールやサービスを提供しています。Cost Estimatorは、インフラストラクチャの導入コストを見積もり、潜在的なコスト削減を特定するのに役立ちます。コスト管理サービスは、様々なサービスやリージョンにわたるクラウド支出を監視および管理するための一元化されたプラットフォームを提供します。このサービスを使用すると、予算の設定、使用量の追跡、およびインフラストラクチャの信頼性に影響を与えずにコストを削減できる領域の特定を行うことができます。

ビッグ・イベントの計画

高可用性を確保し、トラフィックの季節的なピークや計画されたメンテナンス期間など、大規模なイベント中の混乱を回避するには、慎重な計画が必要です。OCIは、自動スケーリングやスケジュール・スケーリングなどの様々なツールやサービスを提供し、それに応じてリソースを計画および調整するのに役立ちます。自動スケーリングは、リアルタイムのトラフィックに基づいてリソースの容量を自動的に調整し、ユーザーがアプリケーションを使用できるようにします。スケジュールされたスケーリングでは、予測可能なトラフィック・パターンに対して事前にリソースを計画および調整できるため、過剰なプロビジョニングや不要なコストのリスクが軽減されます。これらのツールは、クラウド・リソースを効率的に管理し、ビッグ・イベント中に高可用性と最適なパフォーマンスを確保するのに役立ちます。

Oracle Cloud Infrastructureドキュメント