機能していないゾーンの修復
ゾーンが機能しなくなったが定数が維持されている場合は、「機能していないゾーンのハードウェア交換による修復」で説明される手順に従い、機能しなくなったゾーンを新しいハードウェアを使用して修復する手段があります。
もう1つの方法は、機能しなくなったゾーンをセカンダリ・ゾーンに変換することです。場合によっては、このアプローチによって定数要件が減少し、ストアの高可用性が向上することがあります。
たとえば、ストアに2つのプライマリ・ゾーンがあり、ゾーン1のレプリケーション係数は3、ゾーン2のレプリケーション係数は2であるとします。このとき、ゾーン2が機能しなくなったとします。このケースでは、5個のレプリカのうち3個があるため定数は維持されますが、さらに障害が発生すると定数が失われることになります。
ゾーン2をセカンダリ・ゾーンに変換すると、プライマリ・レプリケーション係数が3に減少し、各シャードがさらに1回の障害に耐えられるようになります。
ゾーン・タイプの切替えによって可用性が向上するかどうかを判断する必要があります。向上する場合には、現在の状況で実行する価値があるかどうかを次に判断します。
セカンダリ・ゾーンの管理ノードの必要性:
セカンダリ・ゾーンに管理があると、障害リカバリのサポートに役立ちます。たとえば、ストアにプライマリ・ゾーンとセカンダリ・ゾーンがあり、すべてのプライマリ・ゾーンが失われた場合、管理者はrepair-admin-quorumコマンドとplan failoverコマンドを使用し、セカンダリ・ゾーンをプライマリ・ゾーンに変換することで操作を再開できます。ただし、これらの操作は管理ノードが使用可能な場合にのみ発生できます。このため、セカンダリ・ゾーンを持つストアでは、セカンダリ・ゾーンに管理を含める必要があります。
ゾーンのレプリケーション係数と同じ数の管理をデプロイすることをお薦めします。たとえば、レプリケーション係数が3のプライマリ・ゾーンとセカンダリ・ゾーンがある場合、各ゾーンは3つの管理で構成する必要があります。ゾーン障害が発生し、使用可能な管理が残っていない場合、フェイルオーバー手順は使用できません。この状況を回避するには、ゾーンのレプリケーション係数と同じ数の管理を構成する必要があります。