النظام الأساسي للتعلم الآلي في Autonomous Data Warehouse

لمواكبة الاحتياجات المتغيرة بسرعة من المعلومات، تبحث المؤسسات عن كل فرصة لتدريب نماذج التعلم الآلي ونشرها وإدارتها بسرعة.

مع Oracle Autonomous Data Warehouse (ADW) يكون لديك جميع الأدوات المضمنة اللازمة لتحميل البيانات وإعدادها، ولتدريب نماذج التعلم الآلي ونشرها وإدارتها. يتم تضمين هذه الخدمات مع Autonomous Data Warehouse، ولكن لديك أيضًا المرونة اللازمة لدمج الأدوات الأخرى ومطابقتها لتلبية احتياجات مؤسستك بشكل أفضل.

يضع هذا الهيكل المرجعي حل التكنولوجيا ضمن سياق العمل العام:

فيما يلي وصف الأعمال القائمة على البيانات-context.png
وصف الشكل التوضيحي data-driven-business-context.png

عندما تنفذ المؤسسات مستودع بيانات أو مخزن بيانات بالاقتران مع نظام أساسي للتعلم الآلي في السحابة، فإنها تحتاج عادة إلى تجميع خدمات متعددة معًا لتنفيذ حل شامل. وفي حين أن ذلك يمكن تحقيقه بالنسبة لبعض المنظمات، بالنسبة إلى منظمات أخرى تفتقر إلى الخبرة أو الموارد اللازمة للقيام بذلك، فقد يكون مهمة شاقة.

يجب أن يتضمن النظام الأساسي الشامل للتعلم الآلي على الأقل ما يلي:

  • سهولة الوصول إلى كل من البيانات الهيكلية وغير الهيكلية
  • القدرة على إنشاء وإدارة خطوط أنابيب هندسة البيانات
  • القدرة على إنشاء النماذج وتسجيل نقاط البيانات على نطاق واسع لتحقيق أهداف العمل
  • منصة تعاونية لبناء نماذج التعلم الآلي
  • عملية بسيطة لإدارة النماذج ونشرها
  • استخدم AutoML لتوسيع نطاق وصول القادرين على إنشاء نماذج التعلم الآلي وتسريع عمل علماء البيانات

توفر منصة التعلم الآلي للأدوات المضمنة في Autonomous Data Warehouse للإدارات والمؤسسات طريقة فعالة لتقديم مزايا التعلم الآلي دون الاعتماد بشدة على موارد تكنولوجيا المعلومات وتوافرها. بالإضافة إلى ذلك، تتم معالجة تحديثات المنتجات وتصحيحات التأمين تلقائيًا من خلال Autonomous Data Warehouse.

البنية

تستخدم هذه البنية علوم البيانات وميزات التعلم الآلي المضمنة في Oracle Autonomous Data Warehouse لتحليل البيانات من مجموعة واسعة من موارد بيانات المؤسسة لتحليل الأعمال والتعلم الآلي.

يعرض الشكل التالي مسارات متعددة يمكن للمستخدم اتباعها، تبعًا لحالة الاستخدام. يوفر أسهل مسار (خطوط صلبة) طريقة بسيطة لأداء مهام هندسة البيانات، ولإنشاء نماذج التعلم الآلي، ولإدارة النماذج ونشرها باستخدام الأدوات المضمنة في Autonomous Data Warehouse (ADW). لحالات الاستخدام الأكثر تقدمًا (خطوط متقطعة)، قمنا بتضمين خدمات Oracle Cloud Infrastructure (OCI) الأخرى التي تتكامل بسلاسة مع الخدمات المضمنة في ADW (المغلقة في المربع ذو الخط الرمادي).

فيما يلي وصف ml-adw-architecture.png
وصف الشكل التوضيحي ml-adw-architecture.png

ml-adw-architecture-oracle.zip

ويركز الهيكل على التقسيمات المنطقية التالية:

  • استيعاب، تحويل

    يستوعب البيانات ويحسنها لاستخدامها في كل طبقة من طبقات البيانات في البنية.

  • الاحتفاظ، التوقع، الإنشاء

    تسهيل الوصول إلى البيانات واستكشافها لعرض عرض العمل الحالي. بالنسبة للتقنيات العلائقية، قد تكون البيانات منظمة منطقيًا أو ماديًا في أشكال بسيطة علائقية أو طولية أو بُعدية أو OLAP. بالنسبة للبيانات غير العلائقية، تحتوي هذه الطبقة على مجمع بيانات واحد أو أكثر، إما مخرجات من عملية تحليلية أو بيانات محسنة لمهمة تحليلية محددة.

  • التحليل والتعلم والتنبؤ

    تلخيص طريقة عرض الأعمال المنطقية للبيانات للمستهلكين. وييسر هذا التجريد اتباع نُهج مرنة إزاء التنمية، والانتقال إلى الهيكل المستهدف، وتوفير طبقة إبلاغ واحدة من مصادر اتحادية متعددة.

يوضح المخطط التالي تخطيطًا للبنية إلى الخدمات المقدمة على Oracle Cloud Infrastructure باستخدام أفضل ممارسات الأمان.



oci-adb-oac-arch-gw-oracle.zip

تشتمل البنية على المكونات التالية:

  • تكامل البيانات

    Autonomous Data Warehouse يأتي مع الأدوات المضمنة اللازمة لاكتساب بياناتك وتحميلها وتحويلها للعديد من سيناريوهات الأقسام وحالات الاستخدام المتقدمة المحددة. المضمنة مع Autonomous Data Warehouse هي قدرة تحميل تتيح لك تحميل البيانات بسرعة من التخزين المحلي أو تخزين الكائنات. كما يتم تضمين عمليات تحويل البيانات الذاتية التي تتيح لك الاتصال بالبيانات من العديد من أنواع المصادر المختلفة والوصول إلى وظيفة نوع ELT.

    لحالات الاستخدام الأكثر تقدمًا، يوجد Oracle Cloud Infrastructure Data Integration. Oracle Cloud Infrastructure Data Integration هي خدمة سحابية أصلية مدارة بالكامل ومن دون خادم تساعدك على القيام بمهام الاستخراج والتحميل والتحويل الشائعة (ETL) مثل استيعاب البيانات من مصادر مختلفة، وتنقيح تلك البيانات وتحويلها وإعادة تشكيلها، ثم تحميلها بكفاءة إلى مصادر البيانات المستهدفة في Oracle Cloud Infrastructure.

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse هي خدمة قاعدة بيانات ذاتية التوجيه والتأمين والإصلاح يتم تحسينها لأحمال عمل تخزين البيانات. لست بحاجة إلى تكوين أي جهاز أو إدارته، أو تثبيت أي برنامج. يعالج Oracle Cloud Infrastructure تكوين قاعدة البيانات، بالإضافة إلى النسخ الاحتياطي والتصحيح والترقية وتوسيع قاعدة البيانات.

    باستخدام Autonomous Data Warehouse، تتوفر لديك المرونة لتحميل البيانات إلى تنسيقات متعددة بما في ذلك البيانات المهيكلة وJSON وXML والرسم البياني والمكاني. هذه الخدمة مدمجة في الأدوات الذاتية التي تتيح لك تحميل البيانات بسهولة إلى الجداول وتنفيذ أعمال ETL الخفيفة.

    يتم دمج Oracle Machine Learning في جوهر Autonomous Data Warehouse. يتيح ذلك تشغيل الخوارزميات داخل قاعدة البيانات في نواة قاعدة البيانات وإنتاج كائنات قاعدة بيانات من الدرجة الأولى للتوزيع الفوري.

  • تخزين الكائنات

    يعد Oracle Cloud Infrastructure Object Storage نظامًا أساسيًا للتخزين عالي الأداء على مستوى الإنترنت يوفر إمكانية ثبات البيانات بشكل موثوق وفعال من حيث التكلفة. يمكن لـ Oracle Cloud Infrastructure Object Storage تخزين كمية غير محدودة من البيانات غير الهيكلية من أي نوع محتوى، بما في ذلك البيانات التحليلية. يمكنك تخزين البيانات أو استرجاعها مباشرةً من الإنترنت أو من داخل النظام الأساسي السحابي بأمان وأمان. تتيح لك واجهات الإدارة المتعددة إمكانية البدء بسهولة على نطاق صغير ومتوسع بسلاسة، دون التعرض لأي تدهور في الأداء أو موثوقية الخدمة.

  • تنبؤ

    تقوم خدمات Oracle Machine Learning بتوسيع وظيفة Oracle Machine Learning (OML) لدعم نشر النموذج وإدارة دورة حياة النموذج لكل من نماذج Oracle Machine Learning داخل قاعدة البيانات ونماذج التعلم الآلي Open Neural Networks Exchange (ONNX) لطرف ثالث من خلال REST APIs. تدعم خدمات Oracle Machine Learning تسجيل النقاط في الوقت الفعلي والصغير للتطبيقات ولوحات المعلومات.

    يوفر REST API for Oracle Machine Learning Services نقاط انتهاء REST مع التصديق عبر Autonomous Data Warehouse. تتيح نقاط النهاية هذه تخزين وإدارة نماذج التعلم الآلي والبيانات الوصفية الخاصة بها. وتتيح نقاط النهاية هذه أيضًا إنشاء نقاط انتهاء تسجيل النقاط للنماذج.

    تدعم خدمات Oracle Machine Learning تصنيف الطرف الثالث أو نماذج التراجع التي يمكن بناؤها باستخدام حزم مثل Scikit - Leaarn وTensorFlow، ضمن حزم أخرى ثم يتم تصديرها بتنسيق ONNX. تدعم خدمات Oracle Machine Learning تحليلات النصوص المعرفية المتكاملة لاكتشاف الموضوع والكلمات الأساسية والملخص والشعور والتشابه. تدعم خدمات Oracle Machine Learning أيضًا تصنيف الصور من خلال نشر نموذج بتنسيق ONNX لطرف ثالث، وتدعم تسجيل النقاط باستخدام الصور أو المتوتر.

    يمكن للمستخدمين أيضًا التنبؤ مباشرة في قاعدة البيانات باستخدام نماذج داخل قاعدة البيانات من SQL وR وPython للفرد والدُفعة الصغيرة وتسجيل نقاط الدُفعات على نطاق واسع. يمكن للمستخدمين الاستفادة من تنفيذ Python المضمن OML4Py لاستدعاء وظيفة Python المحددة بواسطة المستخدم مع النماذج المنتجة من حزم الجهات الخارجية وإجراء تنبؤات من واجهات Python وREST.

  • معرفة

    توفر Oracle Machine Learning Notebooks واجهة مستخدم تعاونية لعلماء البيانات ومحللي الأعمال والبيانات للعمل مع مترجمي SQL وPython مع إجراء التعلم الآلي في Oracle Autonomous Database - التي تشمل Autonomous Data Warehouse (ADW) وAutonomous Transaction Processing (ATP) وAutonomous JSON Database (AJD). تعمل Oracle Machine Learning Notebooks على تمكين فريق علوم البيانات الأوسع (علماء البيانات، وعلماء بيانات المواطنين، ومحللي البيانات، ومهندسي البيانات، ومسؤولي قواعد البيانات) من العمل معًا لاستكشاف بياناتهم بصريًا وتطوير المنهجيات التحليلية باستخدام OML4SQL وOML4Py. توفر واجهة دفاتر الملاحظات إمكانية الوصول إلى عمليات التنفيذ عالية الأداء والتوازي والقابلة للتوسع من Oracle لخوارزميات التعلم الآلي عبر Python وSQL وPL/SQL. يمكن أيضًا الوصول إلى الوظائف المضمنة في قاعدة البيانات من خلال الاتصال بـ Autonomous Database عبر واجهات خارجية، مثل SQL Developer وبيئات أجهزة الكمبيوتر المحمولة مفتوحة المصدر وبيئات IDEs التابعة لجهات خارجية.

    يوفر OML4Py أيضًا واجهة برمجة تطبيقات Python للتعلم الآلي التلقائي (AutoML) للخوارزميات واختيار الميزات تلقائيًا وضبط النماذج واختيارها تلقائيًا.

    Oracle Machine Learning AutoML User Interface (OML AutoML UI) هي واجهة مستخدم بدون تعليمات برمجية توفر التعلم الآلي التلقائي بسهولة النشر إلى خدمات Oracle Machine Learning. يمكن لمستخدمي الأعمال الذين ليس لديهم خلفية واسعة لعلم البيانات استخدام واجهة مستخدم OML AutoML لتكوين نماذج التعلم الآلي ونشرها، وكذلك إنشاء دفتر ملاحظات OML يحتوي على تعليمات OML4Py البرمجية المقابلة لإعادة إنشاء النموذج وتسجيل النقاط برمجيًا.

    يمكن لعلماء بيانات الخبراء استخدام واجهة مستخدم OML AutoML كمسرع إنتاجية لاستكشاف النماذج بشكل أسرع، ولتسهيل النشر، ولتكوين دفتر ملاحظات البادئ.

  • التحليلات

    Oracle Analytics Cloud خدمة سحابية عامة قابلة للتوسيع وآمنة توفر مجموعة كاملة من الإمكانات لاستكشاف التحليلات التعاونية وتنفيذها لك ولمجموعة العمل ومؤسستك.

    يتكامل Oracle Analytics Cloud مع Oracle Machine Learning مع الوصول إلى النماذج المضمنة في قاعدة البيانات التي يمكن البحث عنها وتصورها ونشرها داخل لوحات معلومات وسير عمل Oracle Analytics Cloud.

    باستخدام Oracle Analytics Cloud، ستحصل أيضًا على إمكانات مرنة لإدارة الخدمة، بما في ذلك الإعداد السريع، والتوسيع والتصحيح السهلين، وإدارة دورة الحياة الآلية.

التوصيات

استخدم التوصيات التالية كنقطة بداية لإنشاء نظام أساسي لكل من مستودع البيانات السحابي المتقدم وإطار عمل عمليات التعلم الآلي.

قد تختلف متطلباتك عن البنية الموضحة هنا.

  • استيعاب، تحويل

    أدوات Autonomous Database هي وظيفة مضمنة في Oracle Autonomous Data Warehouse توفر الإمكانات للتحميل والتحويل والكتالوج واكتساب الرؤى وحتى تطوير نماذج الأعمال بطريقة بسيطة ومباشرة.

  • التحليل والتعلم والتنبؤ

    قبل توصيل Oracle Analytics Cloud بـ Oracle Autonomous Data Warehouse، يجب أن يسمح مسئول قاعدة البيانات بعنوان IP (أو نطاق العنوان) لطبعة Oracle Analytics Cloud. يجب على مسئول قاعدة البيانات إضافة قاعدة تأمين تسمح بحركة مرور TCP/IP من Oracle Analytics Cloud إلى قاعدة البيانات.

الاعتبارات

عند تكوين إطار عمل لعمليات التعلم الآلي مع مستودع بيانات السحابة، ضع في اعتبارك خيارات التنفيذ هذه.

  • خطورة البيانات: الاحتفاظ بإطار عمليات التعلم الآلي قريبًا من بياناتك للحد من التكلفة المرتفعة لنقل البيانات، سواء من الناحية النقدية أو من حيث وقت تطوير نموذج التعلم الآلي (حتى بالنسبة لتسجيل نقاط البيانات باستخدام نماذج التعلم الآلي).
  • وقت أسرع للقيمة: ستساعدك التوصيات الواردة في الجدول أدناه على البدء بشكل أسرع وتقليل الوقت المستغرق لبدء تحقيق قيمة الحل الخاص بك.
الإرشاد موصى به خيارات أخرى الأساس المنطقي
استيعاب، تحويل أدوات Autonomous Database تكامل بيانات Oracle Cloud Infrastructure يعتمد هذا على حالة الأحرف. لتسهيل تحميل البيانات من الملفات في تخزين الكائنات أو تخزين البيانات المحلي، استخدم أدوات Autonomous Database. كما سبق ذكره، يمكن أيضًا استخدام تحويلات بيانات Autonomous Data Warehouse تبعًا لحالة الاستخدام. بالنسبة للحالات الأكثر تقدمًا، استخدم Oracle Cloud Infrastructure Data Integration، وهي خدمة عند الطلب.
استمرار Oracle Autonomous Data Warehouse Autonomous Data Warehouse هو مستودع بيانات سحابي لا يوفر احتياجات التحليلات لمستودع البيانات فحسب، بل يشمل أيضًا وظيفة نشر إطار عمل عمليات Oracle Machine Learning متقدم. يمكنك أيضًا الوصول مباشرة إلى البيانات من تخزين الكائنات عبر جداول خارجية مخزنة بأي عدد من الصيغ والأنواع.
معرفة Oracle Machine Learning Notebooks مع OML4SQL وOML4Py وOML4R

واجهة مستخدم Oracle Machine Learning AutoML

الطرف الثالث

علوم بيانات OCI

تُعد دفاتر ملاحظات OML بيئة دفتر ملاحظات تعاونية مضمنة في منصة Autonomous Data Warehouse. باستخدام OML4SQL وOML4Py وOML4R، يمكن للمستخدم إنشاء نماذج مباشرة في قاعدة البيانات. يمكن تصدير النماذج المضمنة في قاعدة البيانات واستيرادها بين Oracle Database وAutonomous Data Warehouse. يمكن للمستخدمين إنشاء نماذج Python وR باستخدام أدوات الجهات الخارجية مع بيئات conda المخصصة في Autonomous Database، أو إنشاؤها خارج إطار عمل Oracle Machine Learning وتخزين هذه النماذج الأصلية في مخزن بيانات قاعدة البيانات للاستخدام مع تنفيذ OML4Py-embedded وOML4R-embedded.
تنبؤ

خدمات Oracle Machine Learning

Oracle Machine Learning Notebooks مع OML4SQL وOML4Py وOML4R

علوم بيانات Oracle Cloud Infrastructure

نماذج داخل قاعدة البيانات باستخدام استعلامات SQL وواجهات OML4R/OML4Py

القدرة على تسجيل نقاط النموذج من خلال REST API مع توزيع النموذج المدار بواسطة Oracle Machine Learning Services. تسمح خدمات Oracle Machine Learning أيضًا باستيراد النماذج التي تم تكوينها خارج إطار عمل Oracle Machine Learning من خلال صيغة ONNX. يمكن أن يتضمن ذلك النماذج التي تم إنتاجها في Oracle Cloud Infrastructure Data Science.
الوصول والترجمة الشفوية Oracle Analytics Cloud أدوات الطرف الثالث تتم إدارة Oracle Analytics Cloud بالكامل وتكاملها بشكل دقيق مع إطار عمل Oracle Machine Learning. تتمثل إحدى الإمكانات الأساسية في القدرة على توزيع النماذج التي تم إنشاؤها في Oracle Machine Learning إلى Oracle Analytics Cloud للتعلم الآلي القابل للتوسيع ولوحات المعلومات.

توزيع

التعليمة البرمجية المطلوبة لنشر هذه البنية المرجعية متاحة في GitHub. يمكنك سحب التعليمة البرمجية إلى Oracle Cloud Infrastructure Resource Manager بنقرة واحدة وتكوين المكدس وتوزيعه. بدلاً من ذلك، قم بتنزيل التعليمة البرمجية من GitHub إلى الكمبيوتر، وتخصيص التعليمة البرمجية، وتوزيع البنية باستخدام Terraform CLI.

  • التوزيع باستخدام Oracle Cloud Infrastructure Resource Manager:
    1. انقر على النشر في Oracle Cloud

      إذا لم تكن قد قمت بتسجيل الدخول بالفعل، أدخل بيانات صلاحية العميل والمستأجر.

    2. مراجعة وقبول البنود والشروط.
    3. حدد المنطقة التي تريد توزيع المكدس بها.
    4. اتبع الموجهات والتعليمات على الشاشة لتكوين المكدس.
    5. بعد تكوين المكدس، انقر على إجراءات Terraform، وحدد خطة.
    6. انتظر حتى إتمام الوظيفة، وراجع الخطة.

      لإجراء أية تغييرات، ارجع إلى صفحة تفاصيل المكدس وانقر على تحرير المكدس وقم بإجراء التغييرات المطلوبة. ثم قم بتشغيل إجراء الخطة مرة أخرى.

    7. إذا لم تكن هناك حاجة إلى أية تغييرات أخرى، ارجع إلى صفحة تفاصيل المكدس وانقر على إجراءات Terraform وحدد تطبيق.
  • النشر باستخدام تعليمات Terraform البرمجية في GitHub:
    1. انتقل إلى GitHub.
    2. استنساخ المستودع أو تنزيله إلى الكمبيوتر المحلي.
    3. اتبع التعليمات الواردة في مستند README.

تغيير الأرشيف

يسرد هذا السجل التغييرات الهامة: