Ignorer les liens de navigation | |
Quitter l'aperu | |
Guide d'administration Oracle Solaris ZFS Oracle Solaris 10 1/13 Information Library (Français) |
1. Système de fichiers Oracle Solaris ZFS (introduction)
2. Mise en route d'Oracle Solaris ZFS
3. Gestion des pools de stockage Oracle Solaris ZFS
4. Installation et initialisation d'un système de fichiers root ZFS Oracle Solaris
5. Gestion des systèmes de fichiers Oracle Solaris ZFS
6. Utilisation des instantanés et des clones ZFS Oracle Solaris
7. Utilisation des ACL et des attributs pour protéger les fichiers Oracle Solaris ZFS
8. Administration déléguée de ZFS dans Oracle Solaris
9. Rubriques avancées Oracle Solaris ZFS
10. Dépannage d'Oracle Solaris ZFS et récupération de pool
Identification des problèmes ZFS
Résolution des problèmes matériels généraux
Identification des problèmes avec les pools de stockage ZFS
Recherche de problèmes éventuels dans un pool de stockage ZFS
Consultation de la sortie de zpool status
Informations globales d'état des pools
Informations sur la configuration des pools de stockage ZFS
Etat du nettoyage des pools de stockage ZFS
Erreurs d'altération de données ZFS
Résolution des problèmes des périphériques de stockage ZFS
Résolution d'un périphérique manquant ou supprimé
Résolution d'un périphérique supprimé
Reconnexion physique d'un périphérique
Notification relative à la disponibilité de périphériques dans ZFS
Remplacement ou réparation d'un périphérique endommagé
Détermination du type de panne de périphérique
Suppression des erreurs de périphérique transitoires
Remplacement d'un périphérique dans un pool de stockage ZFS
Détermination de la possibilité de remplacement du périphérique
Périphériques impossibles à remplacer
Remplacement d'un périphérique dans un pool de stockage ZFS
Affichage de l'état de réargenture
Résolution des problèmes de système de fichiers ZFS
Résolution des problèmes de données dans un pool de stockage ZFS
Contrôle de l'intégrité d'un système de fichiers ZFS
Réparation du système de fichiers
Validation du système de fichiers
Contrôle du nettoyage de données ZFS
Nettoyage explicite de données ZFS
Nettoyage et réargenture de données ZFS
Résolution des problèmes d'espace ZFS
Compte-rendu d'espace de système de fichiers ZFS
Compte-rendu sur l'espace des pools de stockage ZFS
Réparation de données endommagées
Identification du type d'altération de données
Réparation d'un fichier ou répertoire endommagé
Réparation de données endommagées avec plusieurs références de blocs
Réparation de dommages présents dans l'ensemble du pool de stockage ZFS
Réparation d'une configuration ZFS endommagée
Réparation d'un système impossible à réinitialiser
11. Pratiques recommandées pour Oracle Solaris ZFS
Consultez les sections suivantes pour déterminer si des problèmes de pool ou une indisponibilité de système de fichiers sont liés à un problème matériel, tel qu'une carte système, une mémoire, un périphérique, un HBA défectueux ou une erreur de configuration.
Par exemple, un disque défaillant ou défectueux situé sur un pool ZFS occupé peut considérablement dégrader les performances globales du système.
Si vous commencez par diagnostiquer et identifier les problèmes matériels, qui peuvent être plus faciles à détecter, et par effectuer une vérification matérielle, vous pouvez ensuite diagnostiquer les problèmes liés au pool et aux systèmes de fichiers comme décrit dans le reste de ce chapitre. Si vos configurations matérielles, de pool et de système de fichiers sont en bon état, pensez à diagnostiquer les problèmes d'application, qui sont généralement plus complexes à corriger et qui ne sont pas décrits dans ce guide.
Le gestionnaire des pannes Solaris recherche les problèmes logiciels, matériels et spécifiques aux périphériques en identifiant les informations de télémétrie des erreurs qui indiquent un symptôme spécifique dans un journal des erreurs puis signalent le diagnostic de panne réelle lorsque le symptôme d'erreur entraîne une panne réelle.
La commande suivante identifie toute panne logicielle ou matérielle.
# fmadm faulty
Exécutez régulièrement la commande ci-dessus pour identifier les services ou les périphériques défectueux.
Exécutez la commande suivante régulièrement pour identifier les erreurs liées au matériel ou aux périphériques.
# fmdump -eV | more
Les messages d'erreur de ce fichier journal qui décrivent les problèmes vdev.open_failed, checksum ou io_failure requièrent votre attention ou ils pourraient se transformer en pannes réelles affichées avec la commande faulty fmadm.
Si cette procédure indique qu'un périphérique est défectueux, c'est le bon moment pour vous assurer de la disponibilité d'un périphérique de remplacement.
Vous pouvez également suivre les autres erreurs de périphérique à l'aide de commande iostat. Utilisez la syntaxe suivante afin d'identifier un résumé des statistiques d'erreurs.
# iostat -en ---- errors --- s/w h/w trn tot device 0 0 0 0 c0t5000C500335F95E3d0 0 0 0 0 c0t5000C500335FC3E7d0 0 0 0 0 c0t5000C500335BA8C3d0 0 12 0 12 c2t0d0 0 0 0 0 c0t5000C500335E106Bd0 0 0 0 0 c0t50015179594B6F11d0 0 0 0 0 c0t5000C500335DC60Fd0 0 0 0 0 c0t5000C500335F907Fd0 0 0 0 0 c0t5000C500335BD117d0
Dans la sortie ci-dessus, les erreurs sont signalées sur le disque interne c2t0d0. Utilisez la syntaxe suivante pour afficher des erreurs de périphérique plus détaillées.
# iostat -En c0t5000C500335F95E3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672QFSB Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335FC3E7d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672TE67 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335BA8C3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672SDF4 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c2t0d0 Soft Errors: 0 Hard Errors: 12 Transport Errors: 0 Vendor: AMI Product: Virtual CDROM Revision: 1.00 Serial No: Size: 0.00GB <0 bytes> Media Error: 0 Device Not Ready: 12 No Device: 0 Recoverable: 0 Illegal Request: 2 Predictive Failure Analysis: 0
Outre le suivi permanent des erreur au sein du pool, ZFS affiche également des messages syslog lorsque des événements intéressants se produisent. Les scénarios suivants donnent lieu à des événements de notification :
Transition d'état de périphérique : si l'état d'un périphérique devient FAULTED, ZFS consigne un message indiquant que la tolérance de pannes du pool risque d'être compromise. Un message similaire est envoyé si le périphérique est mis en ligne ultérieurement, restaurant la maintenance du pool.
Altération de données : en cas de détection d'altération de données, ZFS consigne un message indiquant où et quand s'est produit la détection. Ce message n'est consigné que lors de la première détection. Les accès ultérieurs ne génèrent pas de message.
Défaillances de pool et de périphérique : en cas de défaillance d'un pool ou d'un périphérique, le démon du gestionnaire de pannes rapporte ces erreurs par le biais de messages syslog et de la commande fmdump.
Si ZFS détecte un erreur de périphérique et la corrige automatiquement, aucune notification n'est générée. De telles erreurs ne constituent pas une défaillance de redondance de pool ou de l'intégrité des données. En outre, de telles erreurs sont typiquement dues à un problème de pilote accompagné de son propre jeu de messages d'erreur.