Mithilfe des Sun Cluster-Systems können Anwendungen als hoch verfügbare und Scalable-Ressourcen ausgeführt und verwaltet werden. Das Cluster-Programm mit der Bezeichnung Ressourcengruppen-Manager bzw. RGM stellt den Mechanismus für hohe Verfügbarkeit und Skalierbarkeit bereit. Die Programmierschnittstelle für dieses Programm setzt sich aus folgenden Elementen zusammen.
Einem Satz Rückmeldemethoden, die Sie schreiben und mit deren Hilfe RGM eine Anwendung auf dem Cluster steuern kann.
Der Ressourcenverwaltungs-API (RMAPI), einem Satz von API-Befehlen und -Funktionen auf niedriger Ebene, mit denen Sie Rückmeldemethoden schreiben können. Diese APIs sind in der libscha.so-Bibliothek implementiert.
Prozessverwaltungsprogramme (Process Management Facilities, PMF) für das Überwachen und Neustarten von Prozessen auf dem Cluster.
DSDL (Data Service Development Library, Datendienst-Entwicklungsbibliothek), einer Reihe von Bibliotheksfunktionen, welche die API niedriger Ebene und Prozessverwaltungsfunktionen auf einer höheren Ebene einkapseln. Sie bieten weitere Funktionalität und erleichtern damit das Schreiben von Rückmeldemethoden. Diese Funktionen sind in der libdsdev.so-Bibliothek implementiert.
Die folgende Abbildung verdeutlicht die Beziehungen zwischen den aufgeführten Elementen.
Im Sun Cluster-Paket ist SunPlex Agent BuilderTM enthalten, ein Tool zum Automatisieren des Datendienst-Erstellungsprozesses (siehe Kapitel 9). Agent Builder generiert Datendienstcode entweder in C unter Verwendung von DSDL-Funktionen zum Schreiben der Rückmeldemethoden oder in Korn-Shell (ksh) unter Verwendung von API-Befehlen auf niedriger Ebene zum Schreiben der Rückmeldemethoden.
RGM wird als Dämon auf jedem Cluster-Knoten ausgeführt und startet und stoppt die Ressourcen auf ausgewählten Knoten automatisch, entsprechend den vorkonfigurierten Richtlinien. RGM macht eine Ressource hoch verfügbar, wenn ein Knoten versagt oder neu startet, indem die Ressource auf dem betroffenen Knoten gestoppt und auf einem anderen Knoten neu gestartet wird. RGM sorgt auch für das automatische Starten und Stoppen der ressourcenspezifischen Monitore, die Ressourcenfehler feststellen und fehlerhafte Ressourcen auf einen anderen Knoten verschieben sowie andere Aspekte der Ressourcenleistung überwachen können.
RGM unterstützt sowohl Failover-Ressourcen, die jeweils nur auf einem Knoten online sein können, als auch Scalable-Ressourcen, die auf mehreren Knoten gleichzeitig online sein können.