Informationen zu Best Practices für die Effizienz von Betriebs-Cloud-Bereitstellungen

Die betriebliche Effizienz bezieht sich auf die Identifizierung geeigneter Prozesse und Verfahren zur Automatisierung und Optimierung des Betriebs aller Cloud-Services. Für das Deployment, den Betrieb und die Überwachung von Anwendungen und Infrastruktur müssen Best Practices berücksichtigt werden, um einen maximalen Geschäftswert zu erzielen. Bei alltäglichen Deployments müssen Sie sehen, was mit den Cloud-Ressourcen geschieht. Es muss überwacht werden, ob eine Umgebung ordnungsgemäß arbeitet und ob Anpassungen erforderlich sind.

Vorgänge als Code ausführen

Stellen Sie Ihre Umgebung bereit, skalieren und verwalten Sie sie mit Automatisierung und einer Infrastruktur als Codemethode.
  • Einführung einer Infrastructure-as-Code-Methode (IaC)

    Automatisieren Sie die Bereitstellung von Workloads und Betriebsverfahren, begrenzen Sie die menschliche Interaktion und verbessern Sie die Reaktion auf Ereignisse mit Infrastructure-as-Code.

  • Workload-Infrastruktur definieren

    Wenn Sie die Infrastruktur als Code definieren, können Sie Workloads automatisch und wiederholt in einer konsistenten Infrastruktur bereitstellen. Die Parametrierung ermöglicht die Wiederverwendung gemeinsamer Vorlagen, die Förderung einer systemübergreifenden Standardisierung und die Minimierung der Teamüberarbeitung.

  • Anwendungen entwickeln und bereitstellen

    Die Automatisierung der Codebereitstellung in einer vorhandenen Infrastruktur ermöglicht die Anwendungskonsistenz bei mehreren Infrastrukturbereitstellungen.

  • Infrastrukturkonfiguration verwalten

    Konsistenz ist bei der Konfiguration und Aktualisierung der Infrastrukturkonfiguration in mehreren Cloud-Ressourcen von entscheidender Bedeutung. Mit der Konfigurationsverwaltung kann das Deployment der Infrastrukturkonfiguration während Design, Implementierung, Tests, Patching und neuen Releases verwaltet werden.

Häufige und iterative Deployments vornehmen

Minimieren Sie Risiken durch Automatisierung und einen iterativen Entwicklungsprozess beim Testen und Bereitstellen von Code.

  • Automatisieren Sie Ihren Anwendungsbereitstellungsprozess

    Automatisieren Sie so viele Prozesse wie möglich. Vermeiden Sie manuelle Deployments in der Produktion, obwohl dies in niedrigeren Umgebungen akzeptabel sein könnte, um Geschwindigkeit und Flexibilität zu fördern.

  • Nutzen Sie die Automatisierung, um Ihren Code vor der Bereitstellung zu testen

    Tests auf Bugs, Sicherheitslücken, Funktionalität, Performance und Integrationen sind entscheidend, um Probleme zu minimieren, die Benutzer erkennen. Testfehler sollten verhindern, dass Code in die Produktion freigegeben wird.

  • Iterative und inkrementelle Deployments implementieren

    Reduzieren Sie Risiken, indem Sie Deployments häufiger testen und validieren. Kleinere, häufigere Änderungen können zu weniger Ausfällen und Verzögerungen bei der Erkennung von Problemen führen.

Betriebsverfahren definieren

Definieren Sie Verfahren, um verfügbare Tools zu nutzen und Prozeduren zu automatisieren.

  • Automatisierung von Patching und Wartung

    Nutzen Sie Tools zum automatischen Aktualisieren und Patchen von Compute-Instanzen, Datenbankinstanzen und Servern, die zu Ihrer Verantwortung für die Kundenwartung gehören.

  • Utilitys für das Konfigurationsmanagement nutzen

    Mit Konfigurationsverwaltungstools können Sie Risiken beim Aktualisieren von Ressourcenkonfigurationen automatisieren und reduzieren.

  • Überwachen der Systemleistungsmetriken

    Machen Sie sich mit den Metriken vertraut, die von den Infrastrukturservices bereitgestellt werden. Richten Sie Monitoring und Alerting ein, um den Status aller Workloads sowie proaktive Fehlerindikatoren anzuzeigen.

  • Dokumentieren und Testen des Disaster Recovery-Plans

    Erstellen Sie einen Disaster Recovery-Plan, der die Auswirkungen von Anwendungsfehlern auf das Geschäft widerspiegelt. Verstehen Sie Anwendungsabhängigkeiten und deren Auswirkungen auf Anwendungen. Automatisieren Sie den Recovery-Prozess so weit wie möglich, und dokumentieren Sie alle manuellen Schritte. Testen Sie regelmäßig Ihren Disaster Recovery-Prozess, um den Plan zu validieren und zu verbessern.

  • Planung von Oracle Cloud Infrastructure-Supportinteraktionen

    Stellen Sie vor Bedarf einen Prozess zur Kontaktaufnahme mit dem Oracle Cloud Infrastructure-Support her.

Fehler und Lernen erwarten

Unerwartete Fehler treten während des gesamten Lebenszyklus einer Anwendung auf. Erfahren Sie mehr über einen Fehler und verbessern Sie Reaktions- und Recovery-Prozesse.

  • Aus Fehlern lernen

    Durchführen von Ursachenanalyse- und -optimierungsprozessen für bessere und agilere Reaktionen auf zukünftige Fehler.

  • Kontinuierliche Verbesserung der Reaktion auf Vorfälle

    Verteilen Sie Lektionen aus Fehlern und früheren Problemen, um zukünftige Probleme zu vermeiden und die durchschnittliche Reparaturzeit zu reduzieren.

  • Fehlerübungen

    Testen und prognostizieren Sie regelmäßig Vorfallsmanagement- und Wiederherstellungsprozesse, um zukünftige Reaktionen zu optimieren.

Workload-KPIs identifizieren und überwachen

Identifizieren Sie die Baseline-Performance und die KPIs für Ihre Workloads. Mit den KPIs und Logs können Sie den Zustand und die Performance der Anwendungs-Workload überwachen.

Sie sollten Folgendes zur Überwachung der Workload-Performance verwenden:

  • Verfolgung von Serviceaufrufen implementieren

    Basisplandaten können dabei helfen, Trenddaten bereitzustellen, mit denen Sie Performanceprobleme proaktiv identifizieren können, bevor sie sich auf die Benutzer auswirken.

  • Integritätsprüfungen implementieren

    Führen Sie Health Checks und Probes regelmäßig von außerhalb der Anwendung aus, um eine Verschlechterung der Anwendungsintegrität und -performance zu erkennen. Die Health Checks und Probes sollten mehr sein als nur statische Seitentests, sie sollten sich der ganzheitlichen Anwendungsintegrität widerspiegeln.

  • Prüfen Sie Workflows mit langer Ausführungszeit

    Die frühzeitige Behebung von Problemen kann die Notwendigkeit, den gesamten Workflow zurückzusetzen oder mehrere Vergütungstransaktionen auszuführen, minimieren.

  • System-, Anwendungs- und Auditprotokolle verwalten

    Nutzen Sie einen zentralen Logging-Service, um Logs zu speichern und zu analysieren.

  • Frühwarnsystem einrichten

    Identifizieren Sie die Key Performance Indicators (KPIs) für den Zustand einer Anwendung, wie vorübergehende Ausnahmen und Remote Call Latenzzeiten, und legen Sie für jede Anwendung entsprechende Schwellenwerte fest. Senden Sie einen Alert an Vorgänge, wenn der Schwellenwert erreicht ist.

  • Trainieren Sie mehrere Operatoren, um die Anwendung zu überwachen und manuelle Wiederherstellungsschritte auszuführen

    Stellen Sie sicher, dass immer mindestens ein geschulter Operator aktiv ist.

  • Erstellen Sie Skalierungs-Policys, die basierend auf KPIs Maßnahmen ergreifen

    Mit Skalierungs-Policys können Sie eine konsistente Performance für die Endbenutzer in Perioden mit hohem Bedarf bereitstellen und Ihre Kosten in Perioden mit geringem Bedarf reduzieren.

Managed Services nutzen

Verwenden Sie verwaltete Cloud-Services, um sicherzustellen, dass Ihre Cloud-Ressourcen effizient und kostengünstig ausgeführt werden. Ihre IT-Organisation kann die taktische und und differenzierte starke Verlagerung im Zusammenhang mit der Verwaltung von Cloud-Ressourcen auslagern, damit sie sich auf ihre Kernkompetenzen konzentrieren können.

Zuständigkeiten ermitteln

Cloud-Anbieter dokumentieren, für welche Plattform sie verantwortlich sind und wofür der Kunde verantwortlich ist. Identifizieren Sie Ihre Kundenzuständigkeiten, und stellen Sie sicher, dass für jede dieser Zuständigkeiten Betriebsverfahren bestehen.