1 バックアップおよび障害時リカバリについて

バックアップおよび障害時リカバリ戦略は、包括的な運用メンテナンス計画の主要コンポーネントです。障害時リカバリ戦略は、破壊的な災害発生後のシステム、インフラストラクチャおよびデータの継続またはリカバリを可能にすることを目的としています。

障害イベントには、自然なイベント、物理ハードウェア障害、ソフトウェアのバグ、またはエラーや悪意による人為的なデータ破壊などがあります。いずれの場合も、最小限のダウンタイムでデータ損失を最小限に抑えながら、重要なシステムやデータをリカバリするための計画を立ててください。

次に、異なる手順とポリシーが必要な様々な障害イベントを示します。

  • データ・センター障害

    データ・センターの障害に対応している障害時リカバリ戦略は、コストは高くなりますが、地理的に異なる複数の場所にあるデータとシステムを効果的にミラーリングすることもできます。このアプローチは、特定の地理的な場所のデータ・センター全体に影響を与える可能性があるイベントからのリカバリに役立ちます。これらのタイプのイベントを処理するには、複数の場所で物理的なシステムが使用可能であり、システムを迅速にリカバリできるように、各場所にデータをレプリケートする必要があります。

    このタイプの障害に対処する障害時戦略のコストは、地理的な場所全体のサービスを提供するOracle Cloud Infrastructureなどのクラウドタイプのサービスを使用して削減できます。

    Oracle Linuxは、Gluster Storage for Oracle Linuxなどのツールで地理的なデータレプリケーション機能も提供します。詳細は、「データ・ミラーリングの操作」を参照してください。

  • システム障害

    システム障害戦略は、ハードウェアに障害が発生したり、破壊的なアクションによって完全なシステム機能が削除された場合に、コンポーネントまたはシステム全体を交換するための物理ハードウェアを提供するためのものです。場合によっては、物理ハードウェアが冗長コンポーネントを提供することでコンポーネントの障害に対処する場合があります。ただし、この戦略では、システム全体の障害の可能性を考慮する必要があります。リストアが必要なビジネスクリティカルなリソースごとに、完全なシステムをどの程度迅速に物理的に交換できるかを計画します。この戦略には、ソフトウェア構成情報およびデータをデプロイする計画も含めることが理想的です。

    Oracle Cloud Infrastructureは、必要に応じて新しいシステムや構成を迅速にデプロイするために、既存のインフラストラクチャに基づいてカスタム・システム・イメージおよび構成エントリを作成する機能を提供するため、システム障害のための計画時の総所有コストを削減できます。

    仮想化またはコンテナ・ソリューションにより、システムの自己回復性をさらに高めることができます。これにより、システム・プロセスと機能を物理ハードウェアから抽象化できます。また、仮想化またはコンテナ・サービスを使用すると、必要に応じてサービスを迅速にリカバリするためのイメージまたはデプロイメント計画を作成できます。 コンテナ・サービスの詳細は、『Oracle Linux Podmanユーザー・ガイド』およびOracle Linux Oracle Container Runtime for Dockerユーザー・ガイドを参照してください。Oracle Linuxでの仮想化の詳細は、『Oracle Linux KVMユーザー・ガイド』を参照してください。

  • ディスクまたはボリュームの障害

    通常、すべての障害時リカバリ計画は、ディスクまたはボリュームの障害を伴うイベントを中心に展開します。ディスク障害は発生しますが、その頻度はハードウェアの進化に伴って大幅に減少しています。バックアップおよびミラーリング・ソフトウェアは低コストであり、Oracle Linuxに簡単に実装でき、これらの問題の軽減に役立ちます。

    ディスクおよびボリュームの障害は、なんらかのデータ・ミラーリングまたはレプリケーションを実行することで処理されます。データの自己回復性は、多くの場合、RAID-1ミラーリング、ボリューム・スナップショットの作成および従来のバックアップ方法を使用して、ディスク冗長性によって実現されます。詳細は、「データ・ミラーリングの操作」を参照してください。

    ボリュームレベルのスナップショット作成は、ボリューム間でデータをレプリケートします。詳細は、ファイル・システム・スナップショットの操作を参照してください。

    フル・データ・バックアップ(「ReaRを使用したバックアップの管理」を参照)では、システムレベルの障害が発生した場合のプラットフォーム・リカバリのレベルも提供されます。

    Oracle Cloud Infrastructureでは、作成されたインスタンスのディスクとして機能するブロック・デバイスには、複数のサーバーにまたがる組込みのデータ・レプリケーション機能があり、可用性と稼働時間が保証されます。したがって、Oracle Cloud Infrastructureインスタンスの場合、ディスクまたはボリューム障害に対する緩和は自動的に行われます。

  • ユーザーおよびソフトウェア・イベント

    ユーザーおよびソフトウェア・イベントには、システムに対する悪意のある攻撃や、ファイル・システム上のデータの破壊または破損につながる不注意なエラーが含まれる場合があります。ソフトウェアのバグや更新によって、意図しない構成変更やその他のデータが破損する可能性があります。したがって、障害時リカバリ戦略では、既知の作業環境に迅速にロールバックすることが重要です。

    従来、この分野は、主に完全および通常のデータ・バックアップによって処理されていました。このアプローチは引き続き有用ですが、リカバリに時間がかかる可能性があり、ダウンタイムが必要です。保護を最大化するには、このアプローチを他のより迅速なソリューションと組み合せます。バックアップの管理の詳細は、「ReaRを使用したバックアップの管理」を参照してください。

    Btrfsによって提供されるファイル・システムのスナップショット作成機能により、システムを既知の動作状態に戻すために必要な時間を短縮できます。詳細および手順は、「ファイル・システム・スナップショットの操作」を参照してください。

包括的な障害時リカバリ計画では、プラットフォーム、環境、およびホスティングのニーズに適したツールを組み合せて使用する必要があります。

クラウドベースのサービスでは、通常、データ損失を軽減しリカバリ時間を短縮するツールと組込みの冗長性を提供しています。ただし、これらの環境でも、潜在的なすべての障害シナリオに対応するために、他のツールと機能を組み合せて使用できます。たとえば、クラウド・インスタンスでファイル・システムのスナップショット作成を使用すると、基本的なソフトウェア更新後もシステム・ロールバックを微調整できます。

特定のデータ・センター内の物理システムの場合、ハードウェアおよびソフトウェアの障害に対する回復性と耐久性を確保するために、より広範なツールおよびサービスを使用できます。

このドキュメントを使用すると、OSにネイティブなソフトウェアを使用して、より包括的な障害時リカバリ戦略を実現するためにOracle Linuxで使用できる様々なツールの使用を開始できます。さらに、Oracle Linuxで提供されるRelax-and-Recover (ReaR)およびデータ・バックアップ・ツールについて、より詳細な記載もあります。