Oracle® Solaris 11.2 での ZFS ファイルシステムの管理

印刷ビューの終了

更新: 2014 年 12 月
 
 

ZFS ストレージプールの保守およびモニタリングのプラクティス

  • パフォーマンスを最適にするために、必ずプール容量が 90% を下回るようにします。

    ビジー状態のメールサーバー上など、プールがいっぱいでファイルシステムが頻繁に更新されるときは、プールパフォーマンスが低下する可能性があります。プールがいっぱいになると、パフォーマンスペナルティーが発生することがありますが、それ以外の問題は発生しません。主要な作業負荷が不変のファイルの場合は、プール使用率の範囲を 95 - 96% に維持してください。95 - 96% の範囲のほとんど静的なコンテンツでも、書き込み、読み取り、および再同期のパフォーマンスが低下することがあります。

    • プールとファイルシステムの容量をモニターして、それらがいっぱいにならないようにします。

    • ZFS の割り当て制限と予約を使用して、ファイルシステムの容量がプール容量の 90% を超えないようにすることを検討します。

  • プールの健全性をモニターします

    • 冗長プールを少なくとも週に一度、zpool status および fmdump でモニターします

    • 冗長でないプールを少なくとも週に二度、zpool status および fmdump でモニターします

  • zpool scrub を定期的に実行して、データ整合性の問題を特定します。

    • 消費者品質のドライブがある場合は、スクラブを週に 1 度行うスケジュールを考えます。

    • データセンター品質のドライブがある場合は、スクラブを月に 1 度行うスケジュールを考えます。

    • デバイスを交換する前やプールの冗長性を一時的に下げる前にもスクラブを実行して、すべてのデバイスが現在運用可能であることを確認するようにしてください。

  • プールまたはデバイス障害のモニタリング - 下記のように zpool status を使用します。また、fmdump または fmdump -eV を使用して、デバイスの障害またはエラーが発生しているかどうかを調べます。

    • 冗長プールの場合は、zpool status および fmdump を使用して、週単位でプールの健全性をモニターします

    • 冗長でないプールの場合は、zpool status および fmdump を使用して、週に二度プールの健全性をモニターします

  • プールデバイスが UNAVAIL または OFFLINE である – プールデバイスが使用できない場合、そのデバイスが format コマンド出力に一覧表示されているかどうかを確認します。デバイスが format 出力に一覧表示されていない場合、デバイスは ZFS に認識されていません。

    プールデバイスが UNAVAIL または OFFLINE である場合、これは通常、デバイスに障害があったりケーブルが切断されていたりすること、または、不良ケーブルや不良コントローラなど、ほかのハードウェアの問題が原因でデバイスにアクセスできないことを示します。

  • ハードウェアコンポーネントが欠陥があると診断されたときに通知するように、smtp-notify サービスを構成することを検討してください。詳細は、smf(5) および smtp-notify(1M) の通知パラメータセクションを参照してください。

    デフォルトでは、いくつかの通知は root ユーザーに送信されるように自動的に設定されます。/etc/aliases ファイルでユーザーアカウントの別名を root として追加した場合は、次のような電子メール通知を受け取ります。

    From noaccess@tardis.space.com Fri Jun 29 16:58:59 2012
    Date: Fri, 29 Jun 2012 16:58:58 -0600 (MDT)
    From: No Access User <noaccess@tardis.space.com>
    Message-Id: <201206292258.q5TMwwFL002753@tardis.space.com>
    Subject: Fault Management Event: tardis:ZFS-8000-8A
    To: root@tardis.central.com
    Content-Length: 771
    
    SUNW-MSG-ID: ZFS-8000-8A, TYPE: Fault, VER: 1, SEVERITY: Critical
    EVENT-TIME: Fri Jun 29 16:58:58 MDT 2012
    PLATFORM: ORCL,SPARC-T3-4, CSN: 1120BDRCCD, HOSTNAME: tardis
    SOURCE: zfs-diagnosis, REV: 1.0
    EVENT-ID: 76c2d1d1-4631-4220-dbbc-a3574b1ee807
    DESC: A file or directory in pool 'pond' could not be read due to corrupt data.
    AUTO-RESPONSE: No automated response will occur.
    IMPACT: The file or directory is unavailable.
    REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event.
    Run 'zpool status -xv' and examine the list of damaged files to determine what
    has been affected. Please refer to the associated reference document at
    http://support.oracle.com/msg/ZFS-8000-8A for the latest service procedures
    and policies regarding this diagnosis.
  • ストレージプール容量をモニターする – zpool list コマンドと zfs list コマンドを使用して、ファイルシステムデータによってどれだけのディスクが消費されたかを特定します。ZFS スナップショットがディスク容量を消費する可能性があります。zfs list コマンドで ZFS スナップショットが一覧表示されない場合、認識されずにディスクを消費していることがあります。zfs list – t スナップショットコマンドを使用して、スナップショットが消費するディスク容量を特定します。