Bevor Sie davon ausgehen, daß immer der Server die Ursache aller Netzwerkprobleme ist, sollten Sie Überprüfungen durchführen, um die Funktionsfähigkeit des Netzwerks zu testen. Dies ist besonders dann wichtig, wenn alle oder sehr viele Server-Benutzer gleichzeitig Probleme melden.
Anhand der folgenden Schritte können Sie die Funktionsfähigkeit des Netzwerks testen.
Zuerst sollten Sie das physische Netzwerk überprüfen. Der größte Teil der heutigen Netzwerk-Hardware ist mit Statusanzeigen ausgestattet, anhand derer Sie den Status der verschiedenen Netzwerkverbindungen erkennen können (10-BASE-T-Hubs verwenden zum Beispiel LEDs). Überprüfen Sie diese Verbindungen immer zunächst auf Probleme am physischen Netzwerk hin, zum Beispiel auf zu viele erneute Übertragungen, auf Unstimmigkeiten bei der Verbindungsintegrität und auf Jabber-Bedingungen.
Selbst in Fällen, in denen nur ein Client betroffen ist, sollten Sie nie die Möglichkeit einer fehlerhaften Kabelverbindung ausschließen. Bei einem einzigen betroffenen Client ist es am einfachsten zu überprüfen, ob das Problem immer auftritt, unabhängig davon, auf welchen Server der Client zuzugreifen versucht.
Wenn ein Client in einem Netzwerk, das in jeder anderen Hinsicht problemlos funktioniert, "nichts sehen kann", können Sie davon ausgehen, daß das Problem mit der Netzwerkkonfiguration dieses Clients zusammenhängt. Wenn ein solcher Client andere Knoten im Netzwerk sehen, jedoch keine Verbindung zu einem bestimmten Server herstellen kann, dann liegt die Ursache des Problems wahrscheinlich im Netzwerkpfad zum Server, im Server selbst oder in dem Konto, das dieser Client verwendet.
Es gibt eine Reihe von Produkten anderer Hersteller zum Überprüfen der physischen Funktionsfähigkeit eines Netzwerks. Es lohnt sich, mit einem solchen Gerät regelmäßig den Netzwerkverkehr zu überprüfen, um zu sehen, ob am physischen Netzwerk Probleme zu erkennen sind.
Wenn an den physischen Netzwerkverbindungen kein Fehler zu finden ist, besteht der nächste Schritt darin zu überprüfen, ob die verschiedenen Computer im Netzwerk einander im Hinblick auf das Transportprotokoll "sehen" können. Die meisten Transportprotokollanwendungen umfassen ein Programm zum Testen der Konnektivität, mit dem die Verbindung zwischen Client und Server über das Netzwerk auf der Transportschicht überprüft werden kann.
Wenn Sie einen Server von einem bestimmten Client aus nicht mit dem Befehl ping erreichen können, dann kann auch dieser Client keine Verbindung zu dem Server herstellen. Wenn Sie einen Server mit dem Befehl ping von mehreren Client-Computern aus nicht erreichen können, dann liegt unter Umständen eine der folgenden Bedingungen vor: Der Server läuft nicht, das Transportprotokoll läuft nicht oder es gibt ein Konfigurationsproblem, das die Konnektivität im Netzwerk stört.
Schlagen Sie die Empfehlungen in der Software-Dokumentation zu Ihrem Transportprotokoll nach. Führen Sie dann gegebenenfalls die weiteren Verfahren in diesem Kapitel durch, nämlich die Überprüfung des Status des NetBIOS-Protokolls und der SunLink Server-Software.
Überprüfen Sie die NetBIOS-Protokollschicht. Die meisten NetBIOS-Module enthalten Testprogramme zum Prüfen der Konnektivität zwischen NetBIOS-Namen im Netzwerk.
Wenn zwar die Konnektivität zwischen Knoten über TCP/IP gegeben ist, zwischen den NetBIOS-Namen jedoch nicht, dann funktioniert die SunLink Server-Software nicht. Die gesamte SunLink Server-Kommunikation basiert auf NetBIOS-Namenssitzungen. Überprüfen Sie mit dem Testprogramm, das zu Ihrer Protokoll-Software gehört, die Konnektivität in der NetBIOS-Schicht. Wenn Sie ein Problem finden, isolieren Sie es, wie in der Dokumentation zum NetBIOS-Protokoll beschrieben.
Wenn an den Netzwerkkonnektivitätsmodulen keine Fehler zu finden sind, sollten Sie als nächstes die Solaris-Betriebsumgebung auf dem Computer überprüfen, auf dem das SunLink Server-Programm residiert. Das Betriebssystem enthält eine Reihe von Protokolldateien und Systemprüfungen, anhand derer Sie die Funktionsfähigkeit des Systems überprüfen können. Erläuterungen zu diesen Prüfungen finden Sie in der Administrationsdokumentation zum Solaris-System.
Die SunLink Server-Software ist besonders anfällig für folgende Systemprobleme:
Zu wenig Platz auf der Festplatte bei kritischen Dateisystemen wie zum Beispiel root ( / ) oder /var
Zu wenig Systemhauptspeicher, was zu exzessiven Auslagerungsaktivitäten führt
Fehlerbedingungen im Zusammenhang mit der CPU
Nicht ausgewogene Plattenauslastung
Fehlerhaft eingestellte Kernel-Parameter, zum Beispiel die Höchstzahl an gleichzeitig geöffneten Dateien
Betriebssystemprobleme betreffen in der Regel alle oder die meisten Client-Computer, die an den Server angeschlossen sind. Wenn es sich also um einen Fehler an einem einzigen Client handelt, sollten Sie in diesen Schritt nicht zu viel Zeit investieren.
Wenn Sie feststellen, daß die gesamte zugrunde liegende Software ordnungsgemäß funktioniert, müssen Sie das SunLink Server-System überprüfen. Die Problemisolierung an einem Server richtet sich oft nach dem Typ des Problems, das von den Benutzern gemeldet wird.
Betrifft ein Problem nur einen einzigen Benutzer, dann können Sie sich bei Ihren Überprüfungen auf die Funktionen konzentrieren, die dieser Benutzer ausführen möchte.
Wenn bei einer Gruppe von Benutzern Probleme auftreten, bei vielen anderen Benutzern jedoch nicht, dann sollten Sie versuchen herauszufinden, welche Gemeinsamkeiten zwischen den Benutzern in der betroffenen Gruppe bestehen. Beispiele:
Befinden sie sich am gleichen Hub?
Benutzen sie die gleichen Anwendungen oder Drucker?
Verwenden sie den gleichen lmx.srv-Prozeß?
Sind sie Mitglieder der gleichen SunLink Server-Gruppe?
Tritt bei allen Benutzern an einem Server ein Problem auf, dann sollten Sie mit einer Überprüfung des grundlegenden Server-Status beginnen. Die Fragen, die zu einer solchen Überprüfung gehören, sind im folgenden beschrieben.
Es ist durchaus sinnvoll zu überprüfen, ob der Server läuft. Dies ist ganz einfach. Sie brauchen lediglich an der Systemeingabeaufforderung folgenden Befehl einzugeben:
ps -ef | grep lmx
Daraufhin sollte das System (mindestens) das folgende anzeigen:
root 3554 3452 Feb28 19:39 lmx.srv -s 1
root 3452 1 0 Feb28 5:03 lmx.ctrl
root 3568 1 0 Feb28 2:16 lmx.dmn
An dieser Anzeige können Sie sehen, daß die drei notwendigen Server-Prozesse tatsächlich laufen, nämlich der Dämon (lmx.dmn), der Steuerprozeß (lmx.ctrl) und mindestens ein Arbeitsprozeß (lmx.srv). Darüber hinaus können auch andere Prozesse angezeigt werden, zum Beispiel lmx.browser und lmx.alerter.
Mehrere weitere Arbeitsprozesse, alle mit einer eindeutigen Nummer am Ende der Zeile, können ebenfalls angezeigt werden. Der Server generiert je nach der Anzahl der Clients, die er unterstützt, neue Arbeitsprozesse. Wenn neue Client-Sitzungen gestartet werden, werden in der Regel auch neue lmx.srv-Prozesse gestartet, jeder mit einer eindeutigen Prozeß-ID und Nummer. Das ist normal.
Wenn der Server nicht läuft, geben Sie an der Eingabeaufforderung den Befehl net start server ein.
Wenn einer der notwendigen Server-Prozesse nicht läuft, stellen Sie fest, ob alle Server-Dienste ordnungsgemäß gestartet wurden. Es sind Situationen denkbar, in denen mehrere Server-Prozesse laufen, der Server aber trotzdem nicht zur Verfügung steht, weil ein bestimmter Dienst nicht gestartet wurde. Dies gilt insbesondere für den Anmeldedienst. Mit dem folgenden Befehl, eingegeben an der Eingabeaufforderung, können Sie überprüfen, welche Dienste laufen:
net start
Das System zeigt eine Liste der Dienste an, die zu diesem Zeitpunkt auf dem Server aktiv sind.
Der Anmelde- und der Server-Dienst müssen unbedingt angezeigt werden. Andernfalls liegt am Server ein Problem vor. Oftmals startet der Anmeldedienst nicht, weil am Server-Namen, am Domänennamen oder an der Domänenkonfiguration ein Problem vorliegt.
Überprüfen Sie die Fehlerprotokolle auf Probleme, wie sie im folgenden beschrieben werden.
Sehen Sie in den Fehlerprotokollen des Servers nach. Sie können das System-, Sicherheits- und Anwendungsprotokoll mit der Ereignisanzeige von einem Client-Computer aus, mit SunLink Server Manager vom SunLink Server-System aus oder mit dem Befehl elfread von der Systemkonsole aus anzeigen lassen. Auch die Protokolle im PRINTLOG-Freigabebereich können Sie anzeigen lassen, falls ein Problem im Zusammenhang mit dem Drucken vorliegt. Bei Problemen mit dem Server-Start können Sie im Protokoll lmxstart.log im Verzeichnis /var/opt/lanman/logs nachsehen.
Enthalten einige dieser Protokolle Einträge, speichern Sie sie zum späteren Gebrauch. Löschen oder überschreiben Sie Fehlermeldungen nicht, denn diese können auf die Ursache eines Problems hinweisen. Daher sollten Sie sie behalten, um sie gegebenenfalls später dem Unterstützungspersonal vorlegen zu können.
Folgende Meldung weist im besonderen auf ein Server-Problem hin:
A server process has unexpectedly terminated
Diese Meldung besagt, daß ein Server-Prozeß auf einen unerwarteten Fehler gestoßen ist. Je nach Konfiguration des Servers befindet sich auf Ihrem System unter Umständen eine Core-Datei.
Ist der Wert des Schlüsselworts CoreOk in der SunLink Server-Registrierung auf 1 (ja) gesetzt, befindet sich eine Core-Datei irgendwo auf dem System. Der Wert CoreOk befindet sich im folgenden Schlüssel:
SYSTEM\CurrentControlSet\Services\ AdvancedServer\ProcessParameters
Wechseln Sie ins Stammverzeichnis, und führen Sie folgenden Befehl aus, um das Dateisystem nach Core-Dateien zu durchsuchen:
find . -name "core*" -print
Speichern Sie alle Dateien, die Sie finden. Ist der Parameter coreok auf Nein gesetzt, werden keine Core-Dateien angelegt. Daher ist es unter Umständen sinnvoll, das Schlüsselwort CoreOk auf Ja zu setzen, damit Core-Dateien erfaßt werden, die bei der Fehlerbehebung nützlich sind.
Einige Server-Ressourcen werden automatisch jedesmal freigegeben, wenn der Server gestartet wird. Diese Ressourcen werden von Clients im Hintergrund verwendet, während sie andere Server-Aktivitäten ausführen.
Die Liste der standardmäßig freigegebenen Ressourcen umfaßt:
ADMIN$
C$
D$
IPC$
LIB
NETLOGON
PRINTLOG
PRINT$
USERS
Die Ressourcen mit einem Dollarzeichen ($) sind spezielle Ressourcen, die zur Server-Verwaltung und -Kommunikation erforderlich sind. Eine weitere spezielle Ressource -- REPL$ -- steht zur Verfügung, wenn der Verzeichnisreplikationsdienst läuft.
Versuchen Sie nicht, diese Ressourcen zu löschen oder erneut freizugeben. Wenn eine dieser Ressourcen fehlt, funktioniert der Server nicht ordnungsgemäß. Wenn Sie sehen, daß eine dieser Ressourcen fehlt, stoppen Sie den Server, und starten Sie ihn erneut, um festzustellen, ob diese Ressourcen beim Server-Start freigegeben werden. Wenn sie nicht angezeigt werden, wenden Sie sich an Ihren Kundendienst.
Die übrigen Ressourcen sind Standardressourcen, die in der Regel von Clients bei Anmelden (NETLOGON), zum Herstellen von Verbindungen zu Basisverzeichnissen (USERS) und für den Zugriff auf Dienstprogramme oder Fehlerprotokolle (DOSUTIL, OS2UTIL, PRINTLOG) verwendet werden. Diese Komponenten können auf Ihrem Server aus gutem Grund fehlen. Wenn Sie jedoch die Freigabe dieser Ressourcen nicht aufgehoben haben, wurden sie aufgrund eines Problems am Server entfernt.
Es gibt einen einfachen Test, um festzustellen, ob der Server über das Netzwerk kommuniziert. Geben Sie dazu den folgenden Befehl an der Systemkonsole ein.
net view
Das System zeigt den Namen des Servers und anderer Server an, die in der gleichen Domäne in Betrieb sind. Wenn der Name Ihres Servers erscheint, führen Sie den gleichen Befehl nochmals aus, und zwar mit dem Server-Namen:
net view \\asutrial
Das System zeigt eine Liste der freigegebenen Ressourcen etwa wie die folgende an:
Shared resources at \\asutrial
SunLink Server Systems
Sharename Type Used as Comment
----------------------------------------------------------------
DOSUTIL Disk DOS Utilities
LIB Disk Programming Aids
NETLOGON Disk Logon Scripts Directory
OS2UTIL Disk OS/2 Utilities
PRINTLOG Disk LP Printer Messages
USERS Disk User Directory
Es können auch weitere Einträge angezeigt werden, wenn Sie freigegebene Ressourcen zu Ihrem Server hinzugefügt haben.
Wenn einer dieser Befehle permanent fehlschlägt, liegt ein Problem an der Broadcast-Kommunikation im Netzwerk vor. Sind die Befehle erfolgreich, können Sie mit den Tests im nächsten Abschnitt fortfahren.
Wenn ein Konnektivitätsproblem auftritt, stellen Sie sicher, daß die Höchstzahl an Clients, für die der Server konfiguriert ist, nicht überschritten ist. Diese Höchstzahl ist im Parameter maxclients in der Datei lanman.ini des Servers definiert. Sie können sie mit dem Befehl srvconfig - g maxclients anzeigen lassen.
Führen Sie den Befehl regcheck -C aus, um festzustellen, ob das interne Format der Registrierungsdatei beschädigt wurde. Wenn dieser Befehl eine Beschädigung erkennt, führen Sie den Befehl regcheck -R aus, um die Registrierungsdatei zu reparieren.
Wenn in die SunLink Server-Registrierung ungültige Werte eingegeben wurden, können Sie mit dem Befehl regload durch eine Reinitialisierung alle Registrierungswerte auf ihre Standardwerte zurücksetzen.
Versuchen Sie, sich von einem Client-Computer aus am Server anzumelden. Ist die Anmeldung erfolgreich, verknüpfen Sie die ID eines virtuellen Laufwerks mit einer freigegebenen Ressource. Lassen Sie dann den Inhalt des verknüpften Laufwerks anzeigen.
Wenn bei diesen Schritten Probleme auftreten, isolieren Sie die einzelnen Probleme mit Hilfe des folgenden Verfahrens.