Gestion des systèmes de fichiers ZFS dans Oracle®Solaris 11.2

Quitter la vue de l'impression

Mis à jour : Décembre 2014
 
 

Pratiques recommandées pour la maintenance et la surveillance d'un pool de stockage ZFS

  • Assurez-vous que la capacité d'un pool est inférieure à 90 %, pour obtenir de meilleures performances.

    Les performances d'un pool peuvent se dégrader lorsque le pool est très plein et que les systèmes de fichiers sont fréquemment mis à jour, comme c'est le cas par exemple pour un serveur de courrier très actif. Des pools pleins peuvent entraîner une baisse des performances, mais aucun autre problème. Si la charge de travail principale consiste en des fichiers immuables, maintenez un taux d'utilisation du pool de 95 à 96 %. Même avec un contenu essentiellement statique et un taux d'utilisation de 95 à 96 %, les performances d'écriture, de lecture et de réargenture risquent de se dégrader.

    • Surveillez l'espace des pools et des systèmes de fichiers pour vous assurer qu'il n'est pas entièrement utilisé.

    • Il vous est conseillé d'envisager l'utilisation quotas et réservations ZFS pour vous assurer que l'espace pour système de fichiers ne dépasse pas 90 % capacité du pool.

  • Surveillez la santé du pool

    • Surveillez au moins une fois par semaine un pool redondant avec zpool status et fmdump.

    • Surveillez au moins deux fois par semaine un pool non redondant avec zpool status et fmdump

  • Exécutez régulièrement zpool scrub pour repérer les problèmes d'intégrité des données.

    • Si vous utilisez des unités de qualité grand public, envisagez de planifier un nettoyage hebdomadaire.

    • Si vous utilisez des unités de qualité professionnelle, envisagez de planifier un nettoyage mensuel.

    • Vous devez également exécuter un nettoyage avant de remplacer des périphériques ou de réduire temporairement la redondance d'un pool, afin d'assurer que tous les périphériques sont alors opérationnels.

  • Surveillance des défaillances de pools ou de périphériques : utilisez zpool status comme décrit ci-dessous. Utilisez également les commandes fmdump ou fmdump -eV pour vérifier l'absence de défauts et d'erreurs au niveau des périphériques.

    • Surveillez la santé des pools redondants toutes les semaines à l'aide de zpool status et fmdump

    • Surveillez la santé des pools non redondants deux fois par semaine à l'aide de zpool status et fmdump

  • Le périphérique de pool est UNAVAIL ou OFFLINE : si un périphérique de pool n'est pas disponible, vérifiez si le périphérique est répertorié dans la sortie de la commande format. Si le périphérique n'apparaît pas dans la sortie de format, il n'est pas visible sur ZFS.

    L'état de périphérique de pool UNAVAIL ou OFFLINE signifie généralement que le périphérique est en panne, qu'un câble est déconnecté ou qu'un autre problème matériel, tel qu'un câble ou un contrôleur défectueux, a rendu inaccessible le périphérique.

  • Envisagez de configurer le service smtp-notify de manière à ce qu'il vous informe lorsqu'un composant matériel est diagnostiqué comme défectueux. Pour plus d'informations, reportez-vous à la rubrique Paramètres de notification des pages de manuel smf(5) et smtp-notify(1M).

    Par défaut, certaines notifications sont configurées automatiquement pour être envoyées à l'utilisateur root. Si vous ajoutez un alias pour votre compte utilisateur en tant qu'utilisateur root dans le fichier /etc/aliases, vous recevrez par courrier électronique des notifications semblables à la suivante :

    From noaccess@tardis.space.com Fri Jun 29 16:58:59 2012
    Date: Fri, 29 Jun 2012 16:58:58 -0600 (MDT)
    From: No Access User <noaccess@tardis.space.com>
    Message-Id: <201206292258.q5TMwwFL002753@tardis.space.com>
    Subject: Fault Management Event: tardis:ZFS-8000-8A
    To: root@tardis.central.com
    Content-Length: 771
    
    SUNW-MSG-ID: ZFS-8000-8A, TYPE: Fault, VER: 1, SEVERITY: Critical
    EVENT-TIME: Fri Jun 29 16:58:58 MDT 2012
    PLATFORM: ORCL,SPARC-T3-4, CSN: 1120BDRCCD, HOSTNAME: tardis
    SOURCE: zfs-diagnosis, REV: 1.0
    EVENT-ID: 76c2d1d1-4631-4220-dbbc-a3574b1ee807
    DESC: A file or directory in pool 'pond' could not be read due to corrupt data.
    AUTO-RESPONSE: No automated response will occur.
    IMPACT: The file or directory is unavailable.
    REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event.
    Run 'zpool status -xv' and examine the list of damaged files to determine what
    has been affected. Please refer to the associated reference document at
    http://support.oracle.com/msg/ZFS-8000-8A for the latest service procedures
    and policies regarding this diagnosis.
  • Surveillez l'espace du pool de stockage : utilisez les commandes zpool list et zfs list pour déterminer la quantité d'espace disque utilisée par les données des systèmes de fichiers. Les instantanés ZFS peuvent consommer de l'espace disque et, lorsqu'ils ne sont pas répertoriés par la commande zfs list, peuvent consommer de l'espace disque de manière silencieuse. Utilisez la commande d'instantané zfs list– t pour identifier l'espace disque consommé par des instantanés.