Ein Cluster besteht aus zwei oder mehr Systemen bzw. Knoten, die als ein einziges, ständig verfügbares System zusammenarbeiten, um den Benutzern Anwendungen, Systemressourcen und Daten bereitzustellen. Jeder Knoten im Cluster ist ein voll funktionsfähiges eigenständiges System. In einer Cluster-Umgebung sind die Knoten jedoch über einen Interconnect verbunden und arbeiten zur Steigerung der Verfügbarkeit und Leistung als Einheit zusammen.
Hoch verfügbare Cluster stellen nahezu ständigen Zugriff auf Daten und Anwendungen bereit, indem sie den Cluster bei Ausfällen betriebsbereit halten, die ein System mit einem einzelnen Server normalerweise zum Absturz brächten. Kein einzelner Fehler — sei es durch Hardware, Software oder Netzwerk — kann einen Cluster zum Ausfall bringen. Fehlertolerante Hardwaresysteme sorgen demgegenüber für einen kontinuierlichen Zugriff auf Daten und Anwendungen, verursachen aber aufgrund der spezialisierten Hardware höhere Kosten. Fehlertolerante Systeme haben in der Regel keine Absicherung gegen Softwarefehler.
Jedes Sun Cluster-System ist eine Sammlung eng miteinander verbundener Knoten, die eine einzige Verwaltungsansicht für Netzwerkdienste und Anwendungen bietet. Das Sun Cluster-System erzielt seine Hochverfügbarkeit durch eine Kombination aus der folgenden Hardware und Software:
Redundante Plattensysteme stellen Speicherplatz bereit. Diese Plattensysteme sind in der Regel gespiegelt, um eine Betriebsunterbrechung zu vermeiden, wenn eine Platte oder ein Teilsystem ausfällt. Redundante Verbindungen mit den Plattensystemen stellen sicher, dass keine Daten isoliert werden, wenn ein Server, Controller oder Kabel ausfällt. Ein Hochgeschwindigkeits-Interconnect zwischen Knoten sorgt für den Zugriff auf Ressourcen. Alle Knoten im Cluster sind auch mit einem öffentlichen Netzwerk verbunden, so dass Clients von mehreren Netzwerken aus auf den Cluster zugreifen können.
Redundante Komponenten, die während des Betriebs gewechselt werden können, wie Stromkabel und Kühlsysteme, verbessern die Verfügbarkeit, da die Systeme nach einem Hardwarefehler den Betrieb aufrechterhalten können. Die Komponenten, die während des Betriebs gewechselt werden können, ermöglichen das Hinzufügen oder Entfernen von Hardwarekomponenten in einem laufenden System, ohne dass dieses heruntergefahren werden muss.
Das Hochverfügbarkeits-Framework der Sun Cluster-Software stellt ein Knotenversagen rasch fest und migriert die Anwendung bzw. den Dienst auf einen anderen Knoten, der in einer identischen Umgebung läuft. Alle Anwendungen sind jederzeit verfügbar. Die von einem Knotenversagen nicht betroffenen Anwendungen stehen während der Wiederherstellung vollständig zur Verfügung. Darüber hinaus sind die Anwendungen des ausgefallenen Knotens wieder verfügbar, sobald sie wiederhergestellt sind. Eine wiederhergestellte Anwendung muss nicht die Wiederherstellung aller anderen Anwendungen abwarten.
Eine Anwendung ist hoch verfügbar, wenn sie trotz eines einzelnen Software- oder Hardwarefehlers im System in Betrieb bleibt. Ausfälle durch Fehler oder Datenbeschädigung innerhalb der Anwendung selbst sind ausgeschlossen. Hoch verfügbare Anwendungen lassen sich wie folgt beschreiben:
Die Wiederherstellung ist für die Anwendungen, die eine Ressource verwenden, transparent.
Der Ressourcenzugriff bleibt während des Knotenversagens vollständig gewährleistet.
Die Anwendungen können nicht erkennen, dass der Host-Knoten auf einen anderen Knoten verschoben wurde.
Der Ausfall eines einzelnen Knotens ist für diejenigen Programme auf verbleibenden Knoten, die zu dem Knoten gehörende Dateien, Geräte und Plattendatenträger verwenden, vollständig transparent.
Über Failover- und Scalable-Dienste sowie parallele Anwendungen können Ihre Anwendungen hoch verfügbar gemacht und die Leistung einer Anwendung im Cluster verbessert werden.
Ein Failover-Dienst sorgt mittels Redundanz für Hochverfügbarkeit. Wenn ein Fehler auftritt, kann eine laufende Anwendung so konfiguriert werden, dass sie entweder auf demselben Knoten neu gestartet wird, oder dass sie auf einen anderen Knoten im Cluster verschoben wird. Hierfür ist kein Bedienereingriff erforderlich.
Zur Leistungssteigerung setzt ein Scalable-Dienst die verschiedenen Knoten in einem Cluster für die gleichzeitige Ausführung einer Anwendung ein. In einer Scalable-Konfiguration kann jeder Cluster-Knoten Daten liefern und Client-Abfragen verarbeiten.
Bei parallelen Datenbanken können mehrere Instanzen des Datenbankservers folgende Aufgaben ausführen:
Im Cluster teilnehmen
Verschiedene Abfragen derselben Datenbank gleichzeitig abwickeln
Bei langen Abfragen parallele Abfragemöglichkeit bereitstellen
Weitere Informationen zu Failover- und Scalable-Diensten sowie parallelen Anwendungen finden Sie unter Datendiensttypen.
Clients führen über das öffentliche Netzwerk Datenanforderungen an den Cluster durch. Jeder Cluster-Knoten ist über einen oder mehrere öffentliche Netzwerkadapter mit mindestens einem öffentlichen Netzwerk verbunden.
Bei IP network multipathing können mehrere Netzwerk-Ports eines Servers an dasselbe Teilnetz angeschlossen sein. Zunächst sorgt die IP network multipathing-Software für Spielraum bei Netzwerkadapterversagen, indem sie das Versagen bzw. die Reparatur eines Netzwerkadapters feststellt. Anschließend schaltet sie die Netzwerkdresse automatisch zum alternativen Adapter und wieder zurück. Wenn mehr als ein Netzwerkadapter in Betrieb ist, erhöht IP network multipathing den Datendurchsatz durch die Aufteilung von gesendeten Datenpaketen unter den Adaptern.
Durch den Multihost-Speicher werden die Platten durch Anschluss an mehrere Knoten hoch verfügbar gemacht. Mehrere Knoten aktivieren mehrere Pfade für den Datenzugriff. Wenn ein Pfad ausfällt, steht ein anderer Pfad als Ersatz zur Verfügung.
Multihost-Platten ermöglichen die folgenden Cluster-Prozesse:
Toleranz von einzelnen Knotenausfällen.
Zentralisierung von Anwendungsdaten, Anwendungsbinärdateien und Konfigurationsdateien.
Schutz gegen Knotenversagen. Wenn Client-Anfragen über einen Knoten auf Daten zugreifen und dieser Knoten ausfällt, werden die Anfragen umgeschaltet und über einen anderen Knoten abgewickelt, der mit denselben Platten direkt verbunden ist.
Zugriff entweder global über einen Primärknoten, der die Platten “unterstützt”, oder über direkten, gleichzeitigen Zugriff über lokale Pfade.
Ein Datenträger-Manager ermöglicht dem Benutzer das Verwalten einer großen Plattenanzahl sowie der zugehörigen Plattendaten. Datenträger-Manager steigern durch folgende Funktionen die Speicherkapazität und Datenverfügbarkeit:
Plattenlaufwerk-Striping und Verkettung
Plattenspiegelung
Plattenlaufwerk-Hot-Spares
Abwicklung von Plattenausfällen und Plattenersatz
Sun Cluster-Systeme unterstützen die folgenden Datenträger-Manager:
Solaris Volume Manager
VERITAS Volume Manager
Die Sun StorEdge Traffic Manager-Software ist ab dem Solaris-Betriebssystem 8 E/A-Kern-Framework voll integriert. Mithilfe der Sun StorEdge Traffic Manager-Software können Sie Geräte, auf die über mehrere E/A-Controller-Schnittstellen innerhalb einer einzelnen Instanz der Solaris-Betriebsumgebung zugegriffen wird, besser darstellen und verwalten. Die Sun StorEdge Traffic Manager-Architektur kann Folgendes leisten:
Schutz vor E/A-Ausfällen durch E/A-Controller-Versagen
Automatisches Wechseln zu einem anderen Controller bei E/A-Controller-Versagen
Verbesserte E/A-Leistung durch Lastausgleich über mehrere E/A-Kanäle
Sun Cluster-Systeme unterstützen die Verwendung von Hardware-RAID (Redundant Array of Independent Disks) und Host-basiertem Software-RAID. Hardware-RAID verwendet die Redundanz des Speicher-Arrays bzw. die Hardwareredundanz des Speichersystems, um sicherzustellen, dass unabhängige Hardwarefehler die Datenverfügbarkeit nicht beeinträchtigen. Beim Spiegeln über getrennte Speicher-Arrays stellt Host-basiertes Software-RAID sicher, dass unabhängige Hardwarefehler die Datenverfügbarkeit nicht beeinträchtigen, wenn ein ganzes Speicher-Array offline geschaltet ist. Hardware-RAID und Host-basiertes Software-RAID können gleichzeitig eingesetzt werden. Dennoch ist nur eine RAID-Lösung erforderlich, um einen hohen Grad an Datenverfügbarkeit sicherzustellen.
Eine der inhärenten Eigenschaften von Cluster-Systemen besteht in der gemeinsamen Nutzung von Ressourcen. Daher benötigt ein Cluster ein Dateisystem, das für Kohärenz bei der gemeinsamen Nutzung von Dateien sorgt. Über das Sun Cluster-Dateisystem können Benutzer oder Anwendungen auf jede beliebige Datei auf allen Cluster-Knoten über Remote- bzw. lokale Standard-UNIX-APIs zugreifen. Wenn eine Anwendung von einem Knoten auf einen anderen verschoben wird, ist keine Änderung an der Anwendung erforderlich, um auf dieselben Dateien zugreifen zu können. Vorhandene Anwendungen können das Cluster-Dateisystem ohne Änderungen voll nutzen.