この章では Alternate Pathing の目的、および Alternate Pathing の概念と機構についての概要を説明します。
Alternate Pathing (AP) は、入出力コントローラ (システムボードに常駐し、Sun Enterprise サーバーがディスクやネットワークなどの入出力デバイスと通信できるようにするためのハードウェアコンポーネント) の高可用性をサポートします。 AP を使用することによって、各入出力デバイスがそれぞれ 2 つの入出力コントローラに接続されます。
入出力コントローラは、「代替パス」と呼ばれる、入出力デバイスへの 2 つの異なる電気的な経路の一部です。 AP によって、Sun Enterprise サーバーでの代替パスの設定と使用ができるようになります。
ディスクコントローラでは、正常な運用中にパスの障害が検出されると、この切り替えが「自動的に」行われます。 ネットワークコントローラでは、ユーザーがパスを手動で (1 つの AP コマンドを使用して) 切り替える必要があります。
AP には 2 つの目的があります。 第 1 の目的は、入出力コントローラ障害時の処理の継続です。 AP を使用すると、入出力コントローラの 1 つに障害が発生しても代替コントローラに切り替えることができます。 Sun StorEdgeTM T3 ディスク上のディスクメタデバイスには、2 つの実行可能な物理入出力デバイスが存在し、パス最適化はディスクパスグループに対して適用されます。 パス最適化とは、特定のデバイスに対する入出力トラフィックの効率的な分散のことです。 物理入出力デバイスパスの 1 つが利用不可能になった場合は、原因がデバイス故障かユーザー操作かにかかわらず、パス最適化は無効となります。
T3 の自動切り替え機能では、パスを 1 つだけしか利用できないので、パス最適化アルゴリズムが無効となっています。
AP の 2 番目の目的は、Dynamic Reconfiguration (DR: 動的再構成) をサポートすることです。 DR は、オペレーティングシステムを稼働させたまま、オペレーティングシステム (Solaris) にシステムボードを論理的に接続したり、切り離したりするための機能です。
たとえば、DR を使用すると次の一連の操作が実行できます。まず、オペレーティングシステムからボードを論理的に切り離します (DR Detach) 。その後、ボードを物理的に取り外して保守を行ってから、ボードを装着し直します。最後に、オペレーティングシステムにボードを再度論理的に接続することができます (DR Attach) 。 これらの操作はすべて、オペレーティングシステムを停止させたり、ユーザーアプリケーションを終了させたりしないで実行できます。
ある入出力デバイスに接続されているボードを切り離すとき、その入出力デバイスに代替パスが設定されている場合は、最初に AP を使用して入出力フローを別のボードのコントローラに変更する必要があります。
T3 ディスクパスグループでは、この操作によってパス最適化が無効となり、有効でないパスに対する DR 切り離し操作が行えるようになります。 その後、DR を使用してシステムボードを切り離せます。 このとき、入出力フローは中断されません。
Sun Enterprise 10000 では、(ディスクデバイスとネットワークデバイスの両方の) DR 操作の際、切り替えが「自動的に」行われ、もう 1 つのボードにある障害のない代替コントローラがこれを受け継ぎます。 しかし、手動で切り替えるときは、DR 切り離し操作よりも前にパス最適化を無効にする必要があります。
ほかのすべてのサーバーでは、この切り替えを手動で行う必要があります。
以下に AP と DR の関係を示します。
ここでは、AP の基本概念と用語について説明します。
AP では、入出力デバイスはディスクまたはネットワークのどちらかです。 「入出力コントローラ」は、入出力デバイス用のコントローラカードです。 「入出力ポート」はコントローラカード上のコネクタを指します。通常、コントローラカードにはポートが 2 つ以上あります。「デバイスノード」とは、物理デバイスを指定するときに使用する、/devices または /dev ディレクトリ内でのパスです (例: /dev/dsk/c0t0d1s0)。 「物理パス」という用語は、ホストからディスクまたはネットワークへの電気的な経路を指します。
物理デバイスは、/dev/dsk/c0t0d1s0 のようなデバイスノードによって参照します。
「メタディスク」は、2 つある物理パスのどちらかを経由してディスクにアクセスするための構造です (図 1-5 を参照)。 このとき、スクリプト内やプログラム内でどちらの物理パスも明示的に参照する必要はありません。
スクリプト内やプログラム内でメタディスクを参照する場合は、/dev/ap/dsk/mc0t1d1s0 のような AP 固有のデバイスノードを使用して参照します。 詳細については、「メタディスクのデバイスノード」を参照してください。
次の図では、現在どちらの pln ポート (pln:2 または pln:9) が入出力を処理しているかに関係なく、AP 固有のデバイスノードを使用してディスクの入出力が実行されます。
T3 に対して 2 つの物理パスが利用できる場合は、T3 のシステム起動時に、それらのディスクパスグループに対してパス最適化アルゴリズムが実行されます。 デバイス障害あるいはユーザー操作によって物理パスの 1 つが無効になると、影響のあるディスクパスグループのパス最適化が無効となります。 パス最適化アルゴリズムを再度有効にするには、apconfig(1M) コマンドを使用するか、あるいはシステムを再起動します。 パス最適化は、両方の物理入出力パスが利用可能にならない限り、再度有効にすることはできません。 詳細は、「ディスクパスグループとメタディスクの操作」を参照してください。
「メタネットワーク」は、2 つある物理パスのどちらかを経由してネットワークにアクセスするための構造です (図 1-6 を参照)。このとき、スクリプト内やプログラム内でどちらの物理パスも明示的に参照する必要はありません。 スクリプト内やプログラム内でメタネットワークを参照する場合は、mether1 のような「メタネットワークインタフェース」名を使用して参照します。 詳細については、「メタネットワークインタフェース」を参照してください。
次の図では、現在どのコントローラ (hme1 または qfe3) がメタネットワークの入出力を処理しているかに関係なく、mether1 を使用してメタネットワークにアクセスします。
「ディスクパスグループ」は、図 1-7 に示すように、同じディスクアレイに接続された 2 つの物理パスからなります。 物理パスは、パスグループの一部であるときには、「代替パス」と呼ばれます。 ディスクへの代替パスは、代替パスが使用するpln ポートまたは sf ポートによって一意に識別することができます。 入出力を現在処理している代替パスを「有効な代替パス」と呼びます。
T3 ディスクパスグループでパス最適化アルゴリズムを利用している場合、両方の物理パスは「有効な代替パス」となります。物理パスが無くなった場合は、どのような理由であるかにかかわらず、パス最適化は無効となります。 このような場合、1 つのパスだけが「有効な代替パス」となります。
メタディスク (/dev/ap/[r]dsk/mc?t?d?s? など) がスクリプト内やプログラム内で「個別のディスク」にアクセスするための手段を提供するのに対し、ディスクパスグループは AP コマンドを実行する際にそのディスクへの「パス」を操作するための手段を提供します。 たとえば、「切り替え」操作を実行する、すなわち、有効な代替パスを別のパスに変更するには、apconfig(1M) コマンド内でディスクパスグループを参照します。
切り替え操作を実行すると、T3 のパス最適化が自動的に無効となります。
代替パスの 1 つを「主パス」として指定します。 切り替え操作を実行すると、有効な代替パスは変更されますが、主パスはそのままです。 ディスクパスグループは、主パスに対応する pln ポート (pln:2 など) または sf ポート (sf:2 など) を指定して参照します。 pln または sf ポート名の判定についての詳細は、「メタディスクのデバイスノード」を参照してください。
ディスクパスグループの有効な代替パスを切り替えるには、以下のコマンドを使用します。
# apconfig -P sf:2 -a sf:9 |
次の図に、apconfig(1M) コマンドを使用してディスクパスグループの有効な代替パスを切り替えた例を示します。
この操作によって、T3 のパス最適化は無効となります。 パス最適化を再有効化するには次のコマンドを使用します。
# apconfig -P sf:2 -a sf:2 -a sf:9 |
「ネットワークパスグループ」は、図 1-8 に示すように、同じ物理ネットワークに接続された 2 つのネットワークコントローラからなります。 「代替パス」、「有効な代替パス」、および「切り替え」という用語は、基本的にはディスクパスグループに対して使用する場合と同じ意味を持ちます。 ただし、ネットワークパスグループには、「主パス」は存在しません。
ネットワークパスグループを指定するには、対応するメタネットワークインタフェース名を、mether1 のように参照します。 メタネットワークインタフェース名は、「メタネットワークインタフェース」で説明しています。 ネットワークパスグループの有効な代替パスを切り替えるには、以下のコマンドを使用します。
#apconfig -a mether1 -a hme1 |
図 1-8 に、apconfig(1M) コマンドを使用してネットワークパスグループの有効な代替パスを切り替えた例を示します。
AP 2.3.1 は、Solaris 2.6、Solaris 7、および Solaris 8 オペレーティング環境で使用することができます。
AP がサポートするディスクデバイス、ネットワークデバイスおよび他社製のソフトウェア製品については、『Solaris 8 10/00 Sun ハードウェアマニュアル (補足)』を参照してください。
代替パスが設定されているディスクを Volume Manager を使用して管理している場合は、そのディスクが AP メタディスク名で排他的に管理されている必要があります。 このように設定しておくと、AP がディスクへのパスを代替パスに切り替えるときに Volume Manager の操作を妨げません。
起動ディスクと主ネットワークインタフェースを AP の制御下に置くことができます。 AP は、主ネットワークまたは起動ディスクコントローラがアクセスできない場合でも、これらのデバイスの代替パスが定義されている限りシステムを起動することができます。
図 1-9 に、AP を使用して Ethernet ネットワークとディスクアレイをサポートする方法を示します。
この例では、2 つのネットワークコントローラ (ボード 1 とボード 2 にそれぞれ 1 つずつ) が、同じネットワークに接続されています。 同様に、2 つのボード上の 2 つの SSA コントローラが、同じ SSA に接続されています。 この状態で、ボード 1 が DR Detach 操作によって切り離された場合、AP は処理中の入出力操作を続行したまま使用するボードをボード 1 からボード 2 に切り替えることができます。
AP は、ディスクのミラー化とは異なります。 ディスクのミラー化でも、2 つのパス (ミラー化する側とされる側に 1 つずつ) を使用できるようになりますが、ミラー化は主として「データ」の冗長性を実現します。
AP は、ミラー化する側とされる側のそれぞれで 2 つのパスを使用できるようにすることによって真の意味での「パス」の冗長性を実現します。 AP とディスクのミラー化を併用するには、AP メタディスクパスを使用できるように、ボリュームマネージャーソフトウェア (Sun Enterprise Volume ManagerTM (SEVM) など) を構成する必要があります。
次の図は、ディスクのミラー化とともに AP を使用する方法の例を示します。
この構成にすると、1 つのボードから別のボードへのミラー化に使用されているパスを、ディスクのミラー化や入出力を妨げないで切り替えることができます。
すべての Sun Enterprise サーバーは、ドメインをサポートします。 Sun Enterprise 10000 サーバーは、動的システムドメイン (ここでは単に「ドメイン」と呼びます) をサポートします。 ただし、AP は、2 つのドメインにわたって使用することはできません。
たとえば、ボードにパスグループの一部であるコントローラがあり、DR を使用してそのボードを別のドメインに移動します。 これができるのは、そのボード上の代替パスが現在無効になっている場合だけです。 ボードを別のドメインに移動させると、それ以降そのボード上のパスは代替パスとして使用できません。