Ignorer les liens de navigation | |
Quitter la vue de l'impression | |
![]() |
Guide d'administration des systèmes Oracle® ZFS Storage Appliance, version 2013.1.3.0 |
A propos d'Oracle ZFS Storage Appliance
Configuration d'Oracle ZFS Storage Appliance
Configuration initiale de l'appareil
Configuration initiale à l'aide de la BUI
Configuration initiale à l'aide de la CLI
Utilisation de la page de configuration réseau de la BUI
Configuration des périphériques réseau
Configuration des liaisons de données réseau
Configuration des interfaces réseau
Configuration du multiacheminement IP (IPMP) réseau
Configuration des performances et de la disponibilité réseau
Configuration du routage réseau
Configuration du réseau à l'aide de la BUI
Création d'une interface à port unique à l'aide de la BUI
Modification d'une interface à l'aide de la BUI
Création d'une interface à port unique à l'aide de la BUI
Création d'une interface de liaison groupée LACP à l'aide de la BUI
Extension d'un groupement LACP à l'aide de la BUI
Extension d'un groupe IPMP à l'aide de la BUI
Création d'une liaison de données et d'une interface de partition InfiniBand à l'aide de la BUI
Création d'un VNIC sans ID de VLAN pour des contrôleurs en cluster à l'aide de la BUI
Création de VNIC avec le même ID de VLAN pour des contrôleurs en cluster à l'aide de la BUI
Ajout d'une route statique à l'aide de la BUI
Suppression d'une route statique à l'aide de la BUI
Configuration du réseau à l'aide de la CLI
Ajout d'une route statique à l'aide de la CLI
Suppression d'une route statique à l'aide de la CLI
Réglage de la propriété de multihébergement sur strict à l'aide de la CLI
Configuration d'un profil de données
Importation de pools de stockage existants
Annulation de la configuration du stockage
Configuration d'un pool de stockage à l'aide de la BUI
Ajout de périphériques de cache à un pool existant à l'aide de la BUI
Ajout de périphériques de cache à un pool existant à l'aide de la CLI
Présentation du statut de l'appareil
Résumé de l'utilisation de la mémoire
Section Matériel du Tableau de bord
Tableau de bord d'activité du disque
Exécution continue de l'écran Tableau de bord
Paramètres de statut du tableau de bord
Modification des statistiques d'activité affichées
Modification des seuils d'activité
Configuration du réseau de stockage SAN
Configuration du protocole SAN Fibre Channel
Configuration des modes de port FC à l'aide de la BUI
Détection de ports FC à l'aide de la BUI
Création de groupes d'initiateurs FC à l'aide de la BUI
Association d'un LUN à un groupe d'initiateurs FC à l'aide de la BUI
Changement de mode de port FC à l'aide de la CLI
Détection de ports FC à l'aide de la CLI
Création de groupes d'initiateurs FC à l'aide de la CLI
Association d'un LUN à un groupe d'initiateurs FC à l'aide de la CLI
Scripts de création d'alias pour les initiateurs et groupes d'initiateurs à l'aide de la CLI
Configuration du protocole SAN iSCSI
Configuration des initiateurs SAN iSCSI
Création d'une feuille de travail d'analyse à l'aide de la BUI
Configuration des cibles SAN iSER
Ajout d'une cible iSCSI possédant un IQN généré de manière automatique à l'aide de la CLI
Ajout d'une cible iSCSI avec IQN spécifique et authentification RADIUS à l'aide de la CLI
Ajout d'un initiateur iSCSI utilisant l'authentification CHAP à l'aide de la CLI
Ajout d'un groupe de cibles iSCSI à l'aide de la CLI
Ajout d'un groupe d'initiateurs iSCSI à l'aide de la CLI
Configuration du protocole SAN SRP
Configuration des cibles SRP à l'aide de la BUI
Configuration des cibles SRP à l'aide de la CLI
Configuration des utilisateurs
Gestion des propriétés utilisateur
Ajout d'un administrateur à l'aide de la BUI
Ajout d'un rôle à l'aide de la BUI
Ajout d'autorisations à un rôle à l'aide de la BUI
Suppression des autorisations d'un rôle à l'aide de la BUI
Ajout d'un utilisateur uniquement autorisé à afficher le tableau de bord à l'aide de la BUI
Ajout d'un rôle à l'aide de la CLI
Ajout d'un administrateur à l'aide de la CLI
Ajout d'autorisations à un rôle à l'aide de la CLI
Suppression des autorisations d'un rôle à l'aide de la CLI
Définition des préférences d'Oracle ZFS Storage Appliance
Définition des préférences à l'aide de la CLI
Configurations des clés SSH publiques à l'aide de la CLI
Ajout d'une alerte avec seuil à l'aide de la BUI
Ajout d'une action d'alerte à l'aide de la BUI
Ajout d'une alerte avec seuil à l'aide de la CLI
Ajout d'une action d'alerte à l'aide de la CLI
Reprise/suspension d'ensembles de données
Reprise/suspension de feuilles de travail
Avantages et inconvénients des clusters
E/S d'interconnexion de cluster
Gestion des ressources du cluster
Reprise et rétablissement du cluster
Modifications de la configuration dans un environnement clusterisé
Considérations relatives au clustering pour le stockage
Considérations relatives au clustering pour la gestion réseau
Considérations relatives au clustering pour Infiniband
Estimation et réduction de l'impact de la reprise
Configuration du clustering à l'aide de la BUI
Annulation de la configuration du clustering à l'aide de la BUI
Arrêt de la configuration clusterisée à l'aide de la CLI
Arrêt de la tête de secours à l'aide de la CLI
Annulation de la configuration du clustering à l'aide de la CLI
Câblage des clusters ZS4-4, ZS3-4 et 7x20
Câblage des étagères de stockage pour la mise en cluster
Un mode d'échec courant dans les systèmes clusterisés est le split-brain. Dans cet état, chacune des têtes clusterisées croit que son pair subit une défaillance et tente une reprise. En dehors de toute logique supplémentaire, cet état peut entraîner une large gamme de comportements inattendus et destructifs qu'il peut être difficile de diagnostiquer ou de corriger. Le déclenchement canonique de cet état est l'échec du moyen de communication partagé par les têtes. Dans le cas des appareils de la série Oracle ZFS Storage Appliance, cela aurait lieu en cas d'échec des liaisons d'E/S du cluster. En plus de la redondance à liaison triple associée (une seule liaison est requise pour éviter le déclenchement de la reprise), le logiciel de l'appareil exécute également une procédure d'arbitrage afin de déterminer la tête qui continuera avec la reprise.
Un certain nombre de mécanismes d'arbitrage sont utilisés par des produits similaires. En général, ils impliquent l'utilisation de disques de quorum (à l'aide de réservations SCSI) ou de serveurs de quorum. Pour prendre en charge l'utilisation de disques ATA sans recourir à du matériel supplémentaire, l'appareil Oracle ZFS Storage Appliance utilise une approche différente basée sur la topologie Fabric de stockage elle-même afin de fournir l'exclusivité mutuelle requise. Le processus d'arbitrage consiste à tenter d'exécuter une commande SAS ZONE LOCK sur chacun des expandeurs SAS visibles dans la topologie Fabric de stockage dans un ordre prédéfini. L'appareil sur lequel aboutit la tentative d'obtention des verrouillages poursuit la reprise, l'autre est réinitialisé. Dans la mesure où un appareil clusterisé qui est initialisé et détecte que son pair est inaccessible tente la reprise et effectue le même processus d'arbitrage, il est réinitialisé dans une boucle continue jusqu'à ce qu'au moins une liaison d'E/S du cluster soit restaurée. Cela garantit que la panne qui s'en suit sur l'autre tête n'entraîne pas d'interruption de service étendue. Ces verrous de zone SAS sont libérés lors du rétablissement ou environ 10 secondes après le renouvellement de l'accès à la topologie Fabric de stockage pour la tête dont l'état est AKCS_OWNER.
Le mécanisme d'arbitrage est simple, peu onéreux et ne nécessite pas de matériel supplémentaire. Il repose sur les appareils clusterisés ayant accès à au moins un expandeur SAS commun dans la topologie Fabric de stockage. Dans des conditions normales, chaque appareil a accès à tous les expandeurs et l'arbitrage est réalisé à l'aide d'au moins deux verrous de zone SAS. Il est néanmoins possible de concevoir des scénarios à pannes multiples dans lesquels les appareils n'ont accès à aucun expandeur commun. Par exemple, si deux des câbles SAS sont débranchés ou si une étagère de disques est mise hors tension, chaque appareil a accès à des sous-ensembles disjoints d'expandeurs. Dans ce cas, chaque appareil verrouille tous les expandeurs accessibles, conclut que son pair subit une défaillance et tente de procéder à la reprise. Cela peut entraîner des blocages irrécupérables en raison des conflits d'affiliation de disque et/ou d'une grave altération de données.
Notez que, bien que les conséquences de cet état soient graves, elles ne surviennent qu'en cas de pannes multiples (souvent après quatre pannes ou plus). La solution de clustering intégrée aux appareils de la gamme Oracle ZFS Storage Appliance a été conçue pour garantir l'absence de point de panne unique et protéger les données et la disponibilité contre toute panne éventuelle sans impliquer de coûts ou de complexité supplémentaires. Il reste possible qu'un grand nombre de pannes multiples entraîne une perte de service et/ou de données, de la même manière qu'aucune configuration RAID n'offre de protection contre un nombre illimité de défaillances de disque.
Figure 2-26 Prévention des états split-brain
Heureusement, la plupart de ces scénarios de panne sont dus à une erreur humaine et peuvent être entièrement évités si le matériel est correctement installé et si vous formez du personnel à la configuration du cluster et aux meilleures pratiques de gestion. Les administrateurs doivent toujours veiller à ce que les trois liaisons d'E/S du cluster soient connectées et fonctionnelles (voir illustration) et s'assurer que le câblage du stockage respecte le schéma de configuration fourni avec vos appareils. Il est particulièrement important que les deux chemins soient détectés vers chaque étagère de disques (voir illustration) avant et après la mise en production du cluster, exception faite évidemment des modifications temporaires de câblage pour prendre en charge les améliorations des fonctionnalités ou le remplacement des composants défectueux. Les administrateurs doivent utiliser des alertes pour surveiller l'état des liaisons d'interconnexion du cluster et des chemins d'étagères de disques et corriger rapidement toute panne. En vous assurant du maintien de la connectivité, vous pourrez protéger à la fois la disponibilité et l'intégrité des données en cas de défaillance d'un composant matériel ou logiciel.
Figure 2-27 Cluster à deux chemins