Go to main content

Oracle® ZFS Storage Appliance 管理ガイド、Release OS8.8.x

印刷ビューの終了

更新: 2021 年 8 月
 
 

スプリットブレイン状態の回避

クラスタ化されたシステムの一般的な障害モードは、スプリットブレインと呼ばれます。この状況では、各クラスタ化コントローラは、そのピアに障害が発生した場合と同じように動作し、テイクオーバーを試みます。この状況のもっとも一般的な原因は、コントローラによってシェアされている通信メディアの障害です。Oracle ZFS Storage Appliance では、シェアされている通信メディアはクラスタ I/O リンクです。ただし、Oracle ZFS Storage Appliance のクラスタ I/O リンクには、組み込みリンク冗長性があります。ZS9-2 コントローラでは、テイクオーバーのトリガーを避けるために 1 つのクラスタ I/O Ethernet リンクのみが必要です。ほかのすべてのコントローラでは、テイクオーバーのトリガーを避けるために 1 つのクラスタ I/O シリアルリンクのみが必要です。

アプライアンスソフトウェアで、テイクオーバーを継続するコントローラを決定するアービトレーション手順が実行されます。

Oracle ZFS Storage Appliance のクラスタ化ソリューションは、単一障害点が存在しないことを保証するとともに、障害からデータと可用性の両方を保護するように設計されています。ほとんどの障害は、ハードウェアを適切に設置してクラスタの設定および管理のベストプラクティスに従うことで予防できます。次のことを確認します。

  • すべてのクラスタ I/O リンク (ZS9-2 コントローラでは 2 つ、ほかのすべてのコントローラでは 3 つ) が、クラスタ構成の BUI ビューおよびクラスタリンクステータスの確認 (CLI)に示すように接続され、動作しています。

  • すべてのストレージ配線が、アプライアンスに付属の設定ドキュメントに示すように接続されています。

    クラスタを本稼働に移行する前およびそのあとはいつでも、次の図に示すように、各ディスクシェルフへの 2 つのパスが検出されることが特に重要になります。ただし、容量の増加や障害のあるコンポーネントの交換をサポートするために一時的に配線を変更する場合は例外です。アラートを使用して、クラスタ相互接続リンクおよびディスクシェルフパスの状態をモニターし、障害を迅速に修正するようにしてください。適切な接続を保持すると、ハードウェアまたはソフトウェアコンポーネントに障害が発生した場合でも、可用性とデータ整合性の両方が保護されます。

図 8  クラスタの各ディスクシェルフへの 2 つのパス

image:この図は、ディスクシェルフの「パス」列の 2 を示しています。

関連トピック