حول أفضل الممارسات لتشغيل كفاءة عمليات النشر السحابية

ترتبط الكفاءة التشغيلية بتحديد العمليات والإجراءات المناسبة لأتمتة تشغيل جميع الخدمات السحابية وتحسينه. من المهم مراعاة أفضل الممارسات لنشر التطبيقات والهياكل الأساسية وتشغيلها ومراقبتها لتوفير أقصى قيمة للأعمال.مع عمليات النشر اليومية، هناك حاجة إلى رؤية ما يحدث مع موارد السحابة. ويجب أن يكون الرصد قائما لمعرفة ما إذا كانت البيئة تعمل بشكل صحيح وما إذا كانت هناك حاجة إلى تعديلات.

تنفيذ العمليات كرمز

توفير بيئتك وتوسيعها وإدارتها باستخدام الأتمتة والبنية الأساسية كمنهجية للتعليمات البرمجية.
  • اعتماد بنية تحتية كمنهجية تعليمات برمجية (IaC)

    أتمتة نشر أحمال العمل والإجراءات التشغيلية، والحد من التفاعل البشري، وتحسين الاستجابة للأحداث باستخدام البنية الأساسية كرموز.

  • تحديد البنية الأساسية لتحميل العمل

    عند تعريف البنية الأساسية على أنها تعليمات برمجية، يمكن تزويد أحمال العمل تلقائيًا وبشكل متكرر على بنية أساسية متسقة. ويسمح القياس بإعادة استخدام النماذج المشتركة، وتعزيز التوحيد عبر البيئة، والتقليل إلى أدنى حد من إعادة التشغيل عبر الأفرقة.

  • تطوير التطبيقات ونشرها

    تتيح أتمتة نشر التعليمات البرمجية على البنية الأساسية الموجودة اتساق التطبيق على عمليات نشر البنية التحتية المتعددة.

  • إدارة تكوين البنية الأساسية

    يعد الاتساق أمرًا بالغ الأهمية عند تكوين وتحديث تكوين البنية الأساسية على موارد سحابية متعددة. باستخدام إدارة التكوين، يمكن إدارة نشر تكوين البنية الأساسية أثناء التصميم والتنفيذ والاختبار والتصحيح والإصدارات الجديدة.

إجراء عمليات نشر متكررة ومتكررة

تقليل المخاطر إلى أدنى حد باستخدام الأتمتة وعملية التطوير المتكررة عند اختبار التعليمات البرمجية ونشرها.

  • أتمتة عملية نشر التطبيق

    أتمتة أكبر عدد ممكن من العمليات. وإذا أمكن القضاء على عمليات النشر اليدوية في الإنتاج؛ ومع ذلك، قد يكون ذلك مقبولا في بيئات أقل لتعزيز السرعة والمرونة.

  • الاستفادة من الأتمتة لاختبار التعليمة البرمجية قبل النشر

    يعد اختبار الأخطاء ومواطن الضعف الأمنية والوظائف والأداء والتكامل أمرًا بالغ الأهمية لتقليل المشكلات التي يكتشفها المستخدمون. يجب أن تمنع حالات فشل الاختبار إصدار التعليمات البرمجية في الإنتاج.

  • تنفيذ عمليات النشر المتكررة والمتزايدة

    تقليل المخاطر من خلال اختبار عمليات النشر والتحقق منها بشكل أكثر تواترا. ويمكن أن تؤدي التغييرات الأصغر والأكثر تواترا إلى تقليل التعرض لحالات الفشل والتأخير في تحديد المسائل.

تحديد الإجراءات التشغيلية

تحديد إجراءات للاستفادة من الأدوات المتاحة وأتمتة الإجراءات.

  • أتمتة التصحيح والصيانة

    الاستفادة من الأدوات لتحديث طبعات الحساب وطبعات قاعدة البيانات والخوادم التي تعد جزءًا من مسئولية صيانة العميل وتصحيحها آليًا.

  • الاستفادة من البرامج المساعدة لإدارة التكوين

    استخدم أدوات إدارة التكوين لأتمتة المخاطر وتقليلها عند تحديث إعدادات الموارد.

  • مراقبة قياسات أداء النظام

    فهم المقاييس التي توفرها خدمات البنية التحتية. إعداد المراقبة والتنبيه لتوفير رؤية لحالة كل أحمال العمل ومؤشرات الفشل الاستباقية.

  • توثيق واختبار خطة استعادة القدرة على العمل بعد الكوارث

    كتابة خطة استعادة القدرة على العمل بعد الكوارث تعكس تأثير فشل التطبيق على الأعمال. فهم تبعيات التطبيق وتأثيرها على التطبيقات. أتمتة عملية الاستعادة قدر الإمكان وتوثيق أية خطوات يدوية. قم باختبار عملية استعادة القدرة على العمل بعد الكوارث بشكل منتظم لمراجعة الخطة وتحسينها.

  • خطة تفاعلات دعم Oracle Cloud Infrastructure

    قبل الحاجة، قم بإنشاء عملية للاتصال بدعم Oracle Cloud Infrastructure.

توقع الفشل والتعلم

ستحدث حالات فشل غير متوقعة خلال دورة حياة التطبيق. تعلم من الفشل وتحسين عمليات الاستجابة والاستعادة.

  • تعلم من حالات الفشل

    إجراء تحليلات جذرية وعمليات ضبط لاستجابات أفضل وأكثر مرونة لحالات الفشل في المستقبل.

  • تحسين الاستجابة للحوادث باستمرار

    توزيع الدروس المستفادة من الفشل والقضايا السابقة لمنع المشاكل المستقبلية وتقليل متوسط وقت الإصلاح.

  • ممارسة الفشل

    اختبار عمليات إدارة الحوادث واستردادها وإعادة استخدامها دوريًا لضبط الاستجابات المستقبلية.

تحديد ومراقبة مؤشرات الأداء الأساسية لحمل العمل

حدد مؤشرات الأداء الأساسية (KPIs) لأحمال العمل الخاصة بك. استخدم مؤشرات الأداء الرئيسية والسجلات لمراقبة سلامة أداء حمل العمل للتطبيق.

ضع في اعتبارك استخدام ما يلي لمراقبة أداء حمل العمل:

  • تنفيذ التتبع حول مكالمات الخدمة

    يمكن أن تساعد بيانات الأداء الأساسية على توفير بيانات الاتجاه التي يمكنك استخدامها لتحديد مشكلات الأداء بشكل استباقي قبل أن تؤثر على المستخدمين.

  • تنفيذ الفحوص الصحية

    إجراء فحوص صحية وإجراء فحوص منتظمة من خارج التطبيق لتحديد تدهور صحة التطبيق وأدائه. وينبغي أن تكون الفحوص الصحية والفحوص أكثر من مجرد اختبارات ثابتة للصفحات، وينبغي أن تعكس صحة التطبيق الشاملة.

  • التحقق من عمليات سير العمل الطويلة الأجل

    يمكن أن يؤدي التقاط المشكلات مبكرًا إلى تقليل الحاجة إلى إلغاء تعديلات سير العمل بأكمله أو تنفيذ معاملات تعويضية متعددة.

  • صيانة سجلات النظام والتطبيق والتدقيق

    استخدم خدمة تسجيل مركزية لتخزين السجلات وتحليلها.

  • إعداد نظام الإنذار المبكر

    حدد مؤشرات الأداء الأساسية (KPI) لصحة التطبيق، مثل الاستثناءات العابرة وكمية المكالمة عن بُعد، وقم بتعيين قيم الحد المناسبة لكل منها. إرسال تنبيه إلى العمليات عند بلوغ قيمة الحد.

  • تدريب مشغلات متعددة لمراقبة التطبيق وتنفيذ خطوات الاستعادة اليدوية

    تأكد من وجود عامل تشغيل مدرب واحد نشط دائمًا.

  • تكوين أنظمة الضبط التي تتخذ إجراء استنادًا إلى مؤشرات الأداء الرئيسية

    تساعد سياسات التوسيع على توفير أداء متسق للمستخدمين النهائيين أثناء فترات الطلب المرتفع، وتساعدك على تقليل التكاليف أثناء فترات الطلب المنخفض.

الاستفادة من الخدمات المدارة

استخدم الخدمات السحابية المدارة لضمان تشغيل مواردك السحابية بكفاءة وبطريقة فعالة من حيث التكلفة. يمكن لمؤسسة تكنولوجيا المعلومات الخاصة بك إلغاء تحميل الزيادة الثقيلة التكتيكية وغير المتميزة المرتبطة بإدارة موارد السحابة حتى تتمكن من التركيز على كفاءاتها الأساسية.

تحديد مسئولياتك

يوثق موفرو الخدمة السحابية ما هو النظام الأساسي الخاضع للمساءلة وما هو المسؤول عنه العميل. حدد مسئوليات العملاء وتأكد من وجود إجراءات تشغيلية لكل مسئولية من هذه المسئوليات.