Go to main content
Oracle® ZFS Storage Appliance 管理ガイド、Release OS8.7.0

印刷ビューの終了

更新: 2017 年 3 月
 
 

クラスタ相互接続 I/O

コントローラ間のすべての通信は、CLUSTRON ハードウェアによって提供される 3 つのクラスタ I/O リンクのいずれか 1 つを介して転送される 1 つ以上のメッセージで構成されます (Oracle ZFS Storage Appliance 配線ガイドのコントローラのクラスタ I/O ポートを参照)。このデバイスは、2 つの低速シリアルリンクと 1 つの Ethernet リンクを提供します。シリアルリンクを使用すると、信頼性が高まります。極端に負荷が高い状態のシステムでは、Ethernet リンクが十分な速さでサービスを提供できない可能性があります。不正な障害検出および不要なテイクオーバーは、クラスタ化されたシステムが負荷に対応するための最悪の手段です。テイクオーバー中に、リクエストは処理されず、代わりにクライアントによってキューに入れられます。これにより、すでに高負荷な状態に加えて、テイクオーバー後に遅延したリクエストが大量に発生します。Oracle ZFS Storage Appliance で使用されるシリアルリンクは、このような障害モードの影響を受けにくくなっています。Ethernet リンクは、再度参加時の同期などのハートビート以外のメッセージに対して、より高パフォーマンスのトランスポートを提供し、バックアップハートビートを提供します。

3 つのリンクはすべて、通常の EIA/TIA-568B (8 線式、ギガビット Ethernet) ストレートケーブルを使用して形成されます。2 つの同じコントローラ間でストレートケーブルを使用するには、Oracle ZFS Storage Appliance 配線ガイドのクラスタケーブルの接続で示すように、2 つのコネクタの反対のソケットを接続するようにケーブルを使用する必要があります。

クラスタ化コントローラが相互に通信を行うのは、クラスタ相互接続により確立されたセキュアなプライベートネットワーク経由だけで、サービスや管理向けのネットワークインタフェース経由では相互通信を行いません。メッセージは、リモートコントローラの障害を検出するときに使用される通常のハートビートと、リソースマネージャーおよびクラスタ管理サブシステムに関連する、より高いレベルのトラフィックの 2 つの一般的なカテゴリに分類されます。ハートビートは 3 つのすべてのリンク上で送信 (および予期) されます。ハートビートは一定の間隔で継続的に転送され、すべてのハートビートが同一であり、一意の情報が含まれないときは肯定応答も再転送も行われません。その他のトラフィックは、任意のリンク (通常は転送時に最速のリンク) 上に送信できます。このトラフィックでは、より高レベルのソフトウェアで信頼できる転送を保持するために、必要に応じて肯定応答、検証、および再転送が行われます。

メッセージのタイプまたは送信元に関係なく、すべてのメッセージは単一の 128 バイトパケットとして送信され、1 - 68 バイトのデータペイロード、およびデータ整合性を確認するための 20 バイトの検証ハッシュが含まれます。シリアルリンクは 115200 ビット/秒で動作し、9 データビットおよび単一のスタートビットとストップビットが含まれます。Ethernet は 1G ビット/秒で動作します。したがって、シリアルリンクにおける効率的なメッセージ待機時間は約 12.2 ミリ秒です。Ethernet の待機時間は大幅に変動します。一般的な待機時間は数マイクロ秒ですが、アプライアンス管理ソフトウェアにとって効率的な待機時間は、システム負荷のためにより大きくなる可能性があります。

通常、ハートビートメッセージは、3 つのすべてのクラスタ I/O リンクで各コントローラによって 50 ミリ秒間隔で送信されます。メッセージ受信の失敗は、200 ミリ秒 (シリアルリンク) または 500 ミリ秒 (Ethernet リンク) 後にリンク障害と見なされます。3 つのすべてのリンクで障害が発生した場合、ピアで障害が発生したと想定され、テイクオーバーアービトレーションが実行されます。パニックの場合は、パニックが発生したコントローラが単一の通知メッセージを各シリアルリンク上に転送します。ほかのリンクの状態に関係なく、そのピアではすぐにテイクオーバーが開始されます。このような特徴を考慮すると、通常、クラスタ化サブシステムは次の時間内にそのピアに障害が発生したことを検出できます。

  • 550 ミリ秒 (ピアが応答を停止した場合、または電源を喪失した場合)、または

  • 30 ミリ秒 (ピアでオペレーティングシステムのパニックを引き起こす致命的なソフトウェアエラーが発生した場合)。

このセクションで説明する値はすべて固定値です。Oracle ZFS Storage Appliance はアプライアンスとして、これらのパラメータを調整する機能を提供しません (必要もありません)。これらの値は、実装の詳細と見なされており、ここでは情報目的でのみ提供されます。いつでも通知なしで変更されることがあります。


注 -  クラスタの物理的な再配置のあとのデータ破損を回避するために、すべてのクラスタ配線が新しい場所に正しく設置されていることを確認してください。詳細は、「スプリットブレイン」状態の回避を参照してください。

関連トピック