この項に記載されているベスト・プラクティスは、Oracle Real Application Clusters(Oracle RAC)を使用したOracle Database 11gに適用されます。これらのベスト・プラクティスは、2.2項「Oracle Database 11gの構成」および2.3項「Oracleクラスタウェアを使用したOracle Database 11gの構成」に説明されているOracle Database 11g構成のベスト・プラクティスを基盤としています。各ベスト・プラクティスは、Oracle RACとData Guardを使用したOracle Database 11g(MAA)環境のData Guardで使用される場合、プライマリ・データベースとスタンバイ・データベースで同一です。一部のベスト・プラクティスでは、停止時間を短縮または排除するためにシステム・リソースを大量に使用することがあります。これにより、パフォーマンス・サービス・レベルが影響を受ける可能性があるため、これらのベスト・プラクティスを本番環境で実装する前に必ずテスト環境でその影響を評価してください。
この項には、次の各項目が含まれます。
|
関連項目: 『Oracle Real Application Clusters管理およびデプロイメント・ガイド』 |
インスタンス・リカバリ(障害インスタンスからREDOスレッドをリカバリするプロセス)は、可用性に影響を及ぼす重要な要素です。インスタンス・リカバリ時のデータベースの可用性は、Oracleデータベースの最近のいくつかのメジャー・リリースで大幅に向上しています。
Oracle RACを使用している場合、稼働を続けるいずれかのインスタンスのSMONプロセスが、障害インスタンスのインスタンス・リカバリを実行します。これは、データベースにアクセスするすべてのインスタンスに障害が発生した場合に実行されるクラッシュ・リカバリとは異なります。クラッシュ・リカバリは、単一インスタンスのOracleデータベースを使用するインスタンスに障害が発生した場合に実行される唯一のタイプのリカバリです。
Oracle RACと単一インスタンス環境の両方で、チェックポイントは、平均リカバリ時間(MTTR)の制限に使用される内部メカニズムです。チェックポイントは、バッファ・キャッシュからディスクに使用済バッファを書き込むプロセスです。チェックポイントの数を増やすと、障害後のリカバリに必要とされるREDOは少なくなります。目的は同じですが、MTTRの調整に使用されるパラメータおよびメトリックは、単一インスタンス環境とOracle RAC環境で異なります。
単一インスタンス環境では、クラッシュ・リカバリで必要とする秒数にFAST_START_MTTR_TARGET初期化パラメータを設定できます。クラッシュ・リカバリ時間には、データベースの起動、マウント、リカバリおよびオープンに要する時間が含まれます。
Oracleには、現在のシステムが達成しているMTTRターゲットと、所定のI/O容量において達成可能なMTTRターゲットを把握するのに役立ついくつかの方法が用意されています。詳細は、MAAホワイト・ペーパー『Best Practices for Optimizing Availability During Unplanned Outages Using Oracle Clusterware and Oracle Real Application Clusters』を参照してください。
FAST_START_PARALLEL_ROLLBACKパラメータにより、REDO適用後に実行されるトランザクション・リカバリで使用されるプロセスの数を決定します。トランザクション・リカバリの最適化は、計画外の障害の発生後に効率的なワークロードを確保するために重要です。システムのCPU負荷が高くならないかぎり、このパラメータをHIGHに設定するのがベスト・プラクティスです。これにより、Oracleでは、トランザクション・リカバリ用にCPU数の4倍(4×cpu_count)のパラレル・プロセスを使用します。このパラメータのデフォルト設定はLOW、またはCPU数の2倍(2×cpu_count)です。パラメータは、次のように設定します。
ALTER SYSTEM SET FAST_START_PARALLEL_ROLLBACK=HIGH SCOPE=BOTH;
このデータベース構成のベスト・プラクティスと、2.4.3項「非同期I/Oの有効化の確認」に記載されたベスト・プラクティスで構成を使用すると、データベース・レベルの総可用性の向上が約20%に達することもあります。
非同期I/Oの使用は、すべてのOracleデータベースで推奨されるベスト・プラクティスです。ガイドラインは、2.2.1.8項「DISK_ASYNCH_IOの設定」を参照してください。
パブリック・トラフィック、Oracle RACインターコネクトおよびI/Oには、冗長専用接続を使用して十分な帯域幅を確保します。
通常、1つのファイバに基づく個別の専用チャネルが必要です。または、オプションで高密度波長分割多重方式(DWDMと呼ばれる)を構成して、リピータを使用せずにサイト間で通信することや、サイト間を遠く離す(10km超脚注6)ことができます。ただし、デメリットとして、DWDMは非常にコストがかかる可能性があります。
脚注の説明
脚注6: 100kmごとにインターコネクトでは1ミリ秒、I/Oでは3ミリ秒の待機時間が発生します。LGWRは、少なくともネットワークI/Oに影響を受けます。スイート・スポットは、都市圏内90%の領域です。