Guide du propriétaire du serveur Sun Enterprise 220R

Informations sur les fonctions de fiabilité, disponibilité et facilité de maintenance

La fiabilité, la disponibilité et la facilité de maintenance, regroupées sous le sigle RAS (de l'anglais Reliability, Availability and Serviceability), sont les trois aspects de la conception d'un système qui contribuent à un fonctionnement ininterrompu et à la minimisation des périodes d'inactivité. La fiabilité est la capacité d'un système à fonctionner de façon continue, sans panne, et à assurer l'intégrité des données. La disponibilité d'un système est le pourcentage de temps durant lequel ce système est accessible et utilisable. La facilité de maintenance, enfin, est relative au temps nécessaire pour remettre un système en service à la suite d'une panne. Ensemble, ces trois éléments sont la clé d'un fonctionnement pratiquement ininterrompu du système.

Pour fournir de hauts niveaux de fiabilité, disponibilité et facilité de maintenance, votre système bénéficie des fonctions suivantes :

Correction d'erreurs et contrôle de parité

Le code correcteur et détecteur d'erreurs (ECC, Error-correcting code) est utilisé sur tous les chemins de données internes du système pour assurer de hauts niveaux d'intégrité des données. Toutes les données qui circulent entre les processeurs, les E/S et la mémoire bénéficient d'une protection ECC de bout en bout.

Le système signale et enregistre les erreurs ECC corrigeables. Une erreur ECC corrigeable est une erreur portant sur un seul bit dans un champ de 64 bits. Ces erreurs sont corrigées dès qu'elles sont détectées. La mise en oeuvre de l'ECC permet également de détecter les erreurs portant sur deux bits dans le même champ de 64 bits et les erreurs portant sur plusieurs bits dans le même quartet (groupe de 4 bits).

En sus de la protection ECC des données, le système offre une protection de la parité sur tous les bus d'adresse du système. La protection de la parité est également utilisée sur les bus PCI et SCSI, et dans le cache interne et externe des UC UltraSPARC.

Voyants de fonctionnement

Le système est doté de diodes électroluminescentes facilement accessibles qui se trouvent sur le panneau avant, les baies des disques internes et les alimentations. Ces voyants fournissent des indications visuelles sur l'état du système et de ses composants. Ils éliminent les devinettes et simplifient le diagnostic des problèmes pour une plus grande facilité de maintenance.

Les voyants de fonctionnement du système sont décrits dans la section "Informations sur le panneau d'état", tandis que les voyants des unités de disque et des alimentations sont décrits dans "Signalisation des erreurs".

Unités de disque enfichables à chaud

La fonctionnalité d'enfichage à chaud des unités de disque internes du système permet de retirer et d'installer ces unités pendant le fonctionnement du système. Toutes les unités sont facilement accessibles par l'avant du système. La technologie d'enfichage à chaud augmente considérablement la facilité de maintenance et la disponibilité du système, en permettant de :

Pour plus d'informations sur les unités de disque enfichables à chaud, consultez "Informations sur les unités de disque internes" et "Informations sur la configuration des grappes de disques et concepts".

Prise en charge des configurations de disques RAID 0, RAID 1, RAID 0 + 1 et RAID 5

Le logiciel Solstice DiskSuite conçu pour être utilisé avec le système permet de configurer le stockage sur disques du système selon plusieurs niveaux RAID (Redundant Arrays of Inexpensive Disks, système de disques en grappes). C'est à vous de choisir la configuration RAID la plus appropriée en fonction de son coût et de vos objectifs en matière de performance, fiabilité et disponibilité, pour votre système.

Les configurations RAID 0 (entrelacement), RAID 1 (mise en miroir), RAID 0+1 (entrelacement plus mise en miroir -- parfois appelée RAID 10) et RAID 5 (entrelacement plus parité) peuvent toutes être mises en oeuvre en utilisant Solstice DiskSuite. Vous pouvez également configurer une ou plusieurs unités en tant que pièces de rechange prêtes (hot-spares), pour qu'elles remplacent automatiquement une unité défectueuse en cas de panne.

Pour plus d'informations sur les configurations RAID, consultez "Informations sur la configuration des grappes de disques et concepts".

Alimentations redondantes

Le système peut accueillir une ou deux alimentations. Toutes les configurations système peuvent fonctionner avec une seule alimentation. Mais il est possible d'en utiliser une seconde pour assurer la redondance et permettre au système de continuer à fonctionner en cas de panne de la première alimentation.

Pour plus d'informations sur les alimentations, la redondance et les règles de configuration, consultez "Informations sur les alimentations".

Alimentations échangeables à chaud

Dans une configuration redondante, la fonctionnalité d'échange à chaud des alimentations devient réalité. Un technicien qualifié agréé peut retirer et changer une alimentation défectueuse sans mettre le système hors tension ni même arrêter le système d'exploitation. Les alimentations sont facilement accessibles par l'avant du système. Pour plus d'informations sur le retrait et l'installation d'une alimentation, consultez le Sun Enterprise 220R Server Service Manual.

Quatre niveaux de diagnostic

Pour une facilité de maintenance et une disponibilité améliorées, le système fournit quatre niveaux de tests : POST (auto-test à la mise sous tension), OBDiag (OpenBoot diagnostics), SunVTS(TM) et Sun Enterprise SyMON(TM).

POST et OBDiag sont des diagnostics intégrés au microprogramme qui peuvent s'exécuter même lorsque le serveur est dans l'incapacité d'initialiser le système d'exploitation. Les diagnostics de niveau application, tels que SunVTS et Sun Enterprise SyMON, offrent des fonctionnalités de dépannage supplémentaires une fois que le système d'exploitation fonctionne.

Les diagnostics POST fournissent un contrôle rapide mais exhaustif des fonctions matérielles les plus simples du système. Pour plus d'informations sur POST, consultez "Informations sur les diagnostics POST" et "Comment utiliser les diagnostics POST".

Les diagnostics OBDiag testent le système de manière plus approfondie, interfaces externes comprises. OBDiag est décrit dans "Informations sur les diagnostics OBDiag" et "Comment utiliser les diagnostics OBDiag".

Au niveau des applications, vous avez accès aux diagnostics SunVTS. A l'instar d'OBDiag, SunVTS effectue un test complet du système, interfaces externes comprises. SunVTS vous permet d'exécuter des tests à distance via une connexion réseau. Sachez toutefois que vous ne pouvez utiliser SunVTS que si le système d'exploitation fonctionne. Pour plus d'informations sur SunVTS, consultez "Informations sur le logiciel SunVTS", "Comment utiliser le logiciel SunVTS", et "Comment vérifier si le logiciel SunVTS est installé".

Un autre programme de niveau application, appelé Sun Enterprise SyMON, fournit un vaste éventail de fonctionnalités de surveillance en continu du système. Il vous permet de surveiller l'état du matériel et les performances du système d'exploitation de votre serveur. Pour plus d'informations sur le logiciel Sun Enterprise SyMON, consultez "Informations sur le logiciel Sun Enterprise SyMON".