تكوين نماذج التنبؤ في Oracle Analytics واستخدامها

تستخدم نماذج التنبؤ في Oracle Analytics العديد من خوارزميات Oracle Machine Learning المضمنة للبحث في مجموعات بياناتك، أو التنبؤ بالقيم الهدف أو تحديد فئات السجلات. استخدم محرر تدفق البيانات لتكوين نماذج التنبؤ وتدريبها وتطبيقها على بياناتك.

ما نماذج التنبؤ في Oracle Analytics؟

يُطبق نموذج التنبؤ في Oracle Analytics خوارزمية محددة على مجموعة بيانات للتنبؤ بقيم أو التنبؤ بفئات أو لتعريف مجموعات في البيانات.

يمكنك أيضًا استخدام نماذج تعلم الآلة من Oracle للتنبؤ بالبيانات.

يحتوي Oracle Analytics على خوارزميات لمساعدتك على تدريب نماذج التنبؤ لأغراض متعددة. من بعض أمثلة الخوارزميات: أشجار التراجع والتصنيف (CART) والتراجع المنطقي وk-means.

استخدم محرر تدفق البيانات لتدريب نموذج على مجموعة بيانات تدريبية أولاً. بعد تدريب نموذج التنبؤ، يمكنك تطبيقه على مجموعات البيانات التي تريد التنبؤ باستخدامها.

يمكنك جعل نموذج تم تدريبه متاحًا ليستخدمه المستخدمون الآخرون الذين يمكنهم تطبيقه على بياناتهم لتوقع القيم. في بعض الحالات، يقوم مستخدمون معينون بتدريب النماذج، ويطبقها مستخدمون آخرون.

ملاحظة:

إذا لم تكن متأكدًا مما تبحث عنه في بياناتك، يمكنك البدء باستخدام ميزة Explain التي تستخدم تعلم الآلة لتعريف الاتجاهات والأنماط. وعندها يمكنك استخدام محرر تدفق البيانات لتكوين نماذج تدريب وتدريبها للتعرف على الاتجاهات والأنماط التي عثرت عليها ميزة Explain.
استخدم محرر تدفق البيانات لتدريب نموذج:
  • أولاً، قم بتكوين تدفق بيانات ثم أضف مجموعة البيانات التي تريد استخدامها لتدريب النموذج. تحتوي مجموعة بيانات التدريب هذه على البيانات التي تريد التنبؤ بها (على سبيل المثال، قيمة مثل المبيعات أو العمر أو متغير مثل فئة مخاطر الائتمان).
  • عند الحاجة، يمكنك استخدام محرر تدفق البيانات لتحرير مجموعة البيانات بإضافة الأعمدة وتحديد الأعمدة والربط بينها وغير ذلك.
  • بعد التأكد أن البيانات هي ما تريدها لتدريب النموذج عليها، أضف خطوة تدريب لتدفق البيانات واختيار خوارزمية التصنيف (ثنائي أو متعدد) أو التراجع أو التجميع لتدريب نموذج. ثم تسمية النموذج الناتج وحفظ تدفق البيانات وتشغيله لتدريب النموذج وتكوينه.
  • افحص خصائص كائنات تعلم الآلة لتحديد جودة النموذج. عند الحاجة، يمكنك تكرار عملية التدريب حتى يصل النموذج إلى الجودة التي تريدها.

استخدم النموذج المنتهي لوضع نتيجة البيانات غير المعروفة أو غير المعنونة، للتمكن من إنشاء مجموعة بيانات في تدفق بيانات أو لإضافة تمثيل مرئي لتنبؤ إلى مصنف.

مثال

نفرض أنك تريد تكوين نموذج تصنيف متعدد وتدريبه للتنبؤ بالمرضى المعرضين لخطر الإصابة بأمراض القلب.

  1. قدم مجموعة بيانات تدريب تتضمن سمات للأشخاص المرضى مثل العمر والجنس، وإذا ما كانوا شعروا بألم في الصدر، ومقاييس مثل ضغط الدم وسكر الدم أثناء الصيام والكوليسترول والحد الأقصى لمعدل ضربات القلب. كما تتضمن مجموعة البيانات عمودًا باسم "الاحتمالية" يتم تعيين واحدة من القيم التالية به: غير موجود، أو احتمالية ضئيلة، أو محتمل، أو احتمالية عالية، أو موجود.
  2. اختر خوارزمية CART (شجرة القرار) لأنها تتجاهل الأعمدة المكررة التي لا تضيف قيمة للتنبؤ وتحدد الأعمدة المفيدة للتنبؤ بالهدف فقط وتستخدمها. عند إضافة الخوارزمية إلى تدفق البيانات، يمكنك اختيار عمود الاحتمالية لتدريب النموذج. تستخدم الخوارزمية تعلم الآلة لاختيار أعمدة المحركات التي تحتاجها للتنبؤ وإخراج مجموعات البيانات ذات الصلة.
  3. افحص النتائج واضبط نموذج التدريب، ثم قم بتطبيق النموذج على مجموعة بيانات أكبر للتنبؤ بالمرضى الأكثر عرضة للإصابة بأمراض القلب.

كيف يمكنني اختيار خوارزمية لنموذج تنبؤ؟

يقدم Oracle Analytics خوارزميات لأي من احتياجات تعلم الآلة لديك: التنبؤ الرقمي والمصنف المتعدد والمصنف الثنائي والتجميع.

وظيفة تعلم الآلة من Oracle لمحللي البيانات المتقدمين الذين يعلمون ما يبحثون عنه في البيانات ولديهم خبرة بتحليلات التنبؤ وفهم الفروقات بين الخوارزميات.

ملاحظة:

إذا كنت تستخدم البيانات من Oracle Autonomous Data Warehouse، يمكنك استخدام إمكانية AutoML لتدريب نموذج تنبئي بسرعة وسهولة لك بدون الحاجة لمهارات التعلم الآلة. يرجى الاطلاع على تدريب نموذج تنبئي باستخدام AutoML في Autonomous Data Warehouse.

عادةً ما يود المستخدمون تكوين عدة نماذج تنبؤ ومقارنتها واختيار النموذج الذي على الأرجح سيقدم نتائج تلتزم بمعاييرهم وتلبي متطلباتهم. وقد تختلف هذه المعايير. على سبيل المثال، يختار المستخدمون أحيانًا نماذج لها دقة إجمالية أفضل، وأحيانًا يختار المستخدمون نماذج بأقل أخطاء من النوع 1 (نتيجة إيجابية خاطئة) والنوع 2 (نتيجة سلبية خاطئة)، وأحيانًا يختار المستخدمون النماذج التي تقوم بإرجاع نتائج بشكل أسرع بمستوى مقبول من الدقة حتى وإن لم تكن النتائج مثالية.

يحتوي Oracle Analytics على خوارزميات تعلم الآلة لكل نوع من التنبؤ أو التصنيف. وبهذه الخوارزميات، يمكن للمستخدمين تكوين نموذج واحد أو أكثر، أو استخدام معاملات مختلفة تم ضبطها، أو استخدام مجموعات بيانات تدريب مدخلات مختلفة، ثم اختيار النموذج الأفضل. يمكن للمستخدم اختيار أفضل نموذج من خلال مقارنة النماذج وتقييمها مقابل معاييره. لتحديد النموذج الأفضل، يمكن للمستخدمين تطبيق النموذج وتمثيل نتائج العمليات الحسابية مرئيًا لتحديد الدقة، أو يمكنهم فتح واستكشاف مجموعات البيانات ذات الصلة التي استخدمت Oracle Analytics النماذج لإخراجها.

اطلع على هذا الجدول للتعرف على الخوارزميات المقدمة:

الاسم النوع الفئة الدالة الوصف
CART

التصنيف

التراجع

المصنف الثنائي

المصنف المتعدد

رقمي

- تستخدم أشجار القرار للتنبؤ بالقيم المستمرة والمتميزة.

الاستخدام مع مجموعات البيانات الكبيرة.

التراجع الخطي للشبكة المرنة التراجع رقمي ElasticNet نموذج التراجع المتقدم. تقدم معلومات إضافية (تنظيم)، تنفيذ تحديد المتغير وتنفيذ التوليفات الخطية. عقوبات أسلوبي تراجع لاسو وريدج.

يتم الاستخدام مع العدد الأكبر من السمات لتجنب التداخل الخطي (حيث تكون عدة سمات مرتبطة تمامًا) والملاءمة الزائدة.

تدرجي التجميع التجميع AgglomerativeClustering تبني تدرج للمجموعات التي تستخدم مقاييس من أسفل لأعلى (كل ملاحظة هي تجمع في حد ذاتها وتم دمجه) أو من أعلى لأسفل (كل الملاحظات تبدأ كتجمع واحد) والمسافة.

يتم الاستخدام عندما لا تكون مجموعة البيانات كبيرة ولا يكون عدد المجموعات معروفًا مسبقًا.

K-Means التجميع التجميع k-means يتم تسجيل أقسام التكرار إلى مجموعات k حيث تنتمي كل ملاحظة إلى المجموعة ذات أقرب متوسط.

يتم الاستخدام لأعمدة قياس المجموعات وبتوقعات ثابتة لعدد المجموعات المطلوبة. تعمل جيدًا مع مجموعات البيانات الكبيرة. وتختلف النتائج مع كل عملية تشغيل.

التراجع الخطي التراجع رقمي المربعات الصغرى العادية

ريدج

لاسو

الأسلوب الخطي لنمذجة العلاقة بين المتغير الهدف والسمات الأخرى في مجموعة البيانات.

يتم الاستخدام لتوقع القيم الرقمية عندما لا تكون السمات مرتبطة تمامًا.

التراجع اللوجستي التراجع المصنف الثنائي LogisticRegressionCV يتم الاستخدام لتوقع قيمة متغير تابع من حيث الفئة. المتغير التابع هو متغير ثنائي يحتوي على بيانات بأكواد من 1 أو 0.
Naive Bayes التصنيف

المصنف الثنائي

المصنف المتعدد

GaussianNB التصنيف الاحتمالي القائم على نظرية Bayes التي تفترض عدم وجود تبعية بين السمات.

يتم الاستخدام عند وجود رقم كبير من أبعاد المدخلات.

الشبكة العصبية التصنيف

المصنف الثنائي

المصنف المتعدد

MLPClassifier خوارزمية تصنيف متكرر تتعلم من خلال مقارنة نتائج تصنيفاتها بالقيمة الفعلية وتقوم بإرجاعها إلى الشبكة لتعديل الخوارزمية لمزيد من التكرارات.

يتم الاستخدام للتحليل النصي.

غابة عشوائية التصنيف

المصنف الثنائي

المصنف المتعدد

رقمي

- أسلوب تعلم مجموعة يقوم بتكوين عدة أشجار قرارات وإرجاع مخرجات بالقيمة التي تمثل بشكل مجمع كل أشجار القرارات.

يتم الاستخدام لتوقع المتغيرات الفئوية والرقمية.

SVM التصنيف

المصنف الثنائي

المصنف المتعدد

LinearSVC, SVC تصنف السجلات من خلال تخطيطها في المساحة وتكوين المستويات الترابطية التي يمكن استخدامها للتصنيف. يتم تخطيط السجلات الجديدة (تحديد نتائج البيانات) في المساحة ويتم التنبؤ بها لتنتمي إلى فئة، الأمر الذي يعتمد على الجانب الموجودة به من المستوى الترابطي.

تدريب نموذج تنبئي باستخدام AutoML في Oracle Autonomous Data Warehouse

عند استخدام البيانات من Oracle Autonomous Data Warehouse، يمكنك استخدام إمكانية AutoML لتقديم توصيات النماذج التنبئية وتدريبها. يحلل AutoML بياناتك، ويحسب الخوارزمية الأفضل للاستخدام،ويسجل نموذج تنبئي في Oracle Analytics لتتمكن من التنبؤ بشأن بياناتك.

يعني استخدام AutoML أن Oracle Autonomous Data Warehouse يقوم بكل العمل الشاق نيابة عنك، لتتمكن من نشر نموذج تنبئي بدون مهارات تعلم آلة أو ذكاء اصطناعي. يتم حفظ النموذج التنبئي المكون في منطقة النماذج من صفحة تعلم الآلة. للتنبؤ بالبيانات وفقًا لنموذج جديد، قم بتكوين تدفق بيانات واستخدم خطوة تطبيق نموذج.
قبل البدء:
  • قم بتكوين قاعدة بيانات بناءً على البيانات في Oracle Autonomous Data Warehouse التي تريد التنبؤ بشأنها. على سبيل المثال، قد يكون لديك بيانات عن تناقص الموظفين، تتضمن حقلاً بالاسم ATTRITION بالقيمة 'Yes' أو 'No' للتناقص.
  • تأكد من أن مستخدم قاعدة البيانات المحدد في اتصال Oracle Analytics بـ Oracle Autonomous Data Warehouse لديه الدور OML_Developer وليس مستخدم مميز بالدور 'admin'. وإلا، سيفشل تدفق البيانات عندما تحاول تشغيله وحفظه.
  1. في الصفحة الرئيسية، انقر على إنشاء، ثم انقر على تدفق البيانات.
  2. في إضافة مجموعة بيانات، حدد مجموعة البيانات من Oracle Autonomous Data Warehouse التي تحتوي على بيانات لتحليلها.
  3. انقر على إضافة خطوة، ثم على AutoML.
  4. بالنسبة إلى الهدف، انقر على تحديد عمود، وحدد عمود البيانات الذي يحتوي على القيمة التي تحاول التنبؤ بها.
    على سبيل المثال، للتنبؤ بتناقص الموظفين، يمكنك تحديد حقل بالاسم ATTRITION بالقيمة 'TRUE' أو 'FALSE' لتحديد إذا غادر الموظف المؤسسة أم لا.

  5. اقبل نوع المهمة المقترح وقياس تصنيف النموذج الذي يوصي به Oracle Analytics، أو حدد خوارزمية مختلفة.
  6. انقر على حفظ نموذج، وحدد اسم النموذج التنبئي المكون.
  7. انقر على حفظ وحدد اسم تدفق البيانات.
  8. انقر على تشغيل لتحليل البيانات وتكوين نموذج تنبئي.
  9. من الصفحة الرئيسية، انقر على تنقل، ثم على تعلم الآلة، ثم انقر بزر الماوس الأيمن على النموذج المكون وحدد فحص.
يمكنك تحديد موقع النموذج الذي يقوم Oracle Analytics بتكوينه في صفحة التعلم الآلي في علامة تبويب النماذج. افحص النموذج لتقييم جودته. يرجى الاطلاع على تقييم جودة نموذج تنبؤ. يمكنك أيضًا الرجوع إلى مجموعات البيانات المرتبطة التي تم تكوينها للنماذج التي تم تكوينها بواسطة AutoML. يرجى الاطلاع على ما مجموعات البيانات ذات الصلة بنموذج التنبؤ؟.

تكوين نموذج تنبؤ وتدريبه

يقوم محللو البيانات المتقدمة بتكوين نماذج تنبئية وتدريبها ليتمكنوا من استخدامها لنشر خوارزميات Oracle Machine Learning إلى مجموعات بياناتك، أو التنبؤ بالقيمة الهدف أو تحديد فئات السجلات. استخدم محرر تدفق البيانات لتكوين نماذج التنبؤ وتدريبها وتطبيقها على بياناتك.

أيقونة مادة تعليمية LiveLabs Sprint

إن عملية تحديد نموذج دقيق تعتمد على التكرار، ويمكن لمحلل البيانات المتقدم تجربة نماذج مختلفة ومقارنة نتائجها وضبط المعاملات بناءً على المحاولة والخطأ. يمكن لمحلل البيانات استخدام نموذج تنبؤ دقيق ونهائي للتنبؤ بالاتجاهات في مجموعات البيانات الأخرى أو إضافة النموذج إلى المصنفات.

ملاحظة:

إذا كنت تستخدم البيانات من Oracle Autonomous Data Warehouse، يمكنك استخدام إمكانية AutoML لتدريب نموذج تنبئي بسرعة وسهولة لك بدون الحاجة لمهارات التعلم الآلة. يرجى الاطلاع على تدريب نموذج تنبئي باستخدام AutoML في Autonomous Data Warehouse.

يقدم Oracle Analytics خوارزميات للتنبؤ الرقمي والتصنيف المتعدد والتصنيف الثنائي والتجميع.

  1. في الصفحة الرئيسية، انقر على إنشاء، ثم حدد تدفق البيانات.
  2. حدد مجموعة البيانات التي تريد استخدامها لتدريب النموذج. انقر على إضافة.
  3. في محرر تدفق البيانات، انقر على إضافة خطوة (+).
    بعد إضافة مجموعة بيانات، يمكنك إما استخدام كل الأعمدة في مجموعة البيانات لإنشاء النموذج أو تحديد الأعمدة ذات الصلة فقط. يتطلب اختيار الأعمدة ذات الصلة فهمًا لمجموعة البيانات. تجاهل الأعمدة التي تعرف أنها لن تؤثر على سلوك النتيجة أو التي تتضمن معلومات مكررة. يمكن اختيار الأعمدة ذات الصلة فقط من خلال إضافة خطوة تحديد أعمدة. إذا لم تكن متأكدًا من الأعمدة ذات الصلة، فاستخدم كل الأعمدة.
  4. عليك بتحديد واحدة من خطوات نموذج التدريب (على سبيل المثال، تدريب التنبؤ الرقمي أو تدريب التجميع).
  5. حدد خوارزمية وانقر على موافق.
  6. إذا كنت تعمل بنموذج يخضع للإشراف مثل التنبؤ أو التصنيف، فانقر على الهدف وحدد العمود الذي تحاول التنبؤ به. على سبيل المثال، إذا كنت تقوم بتكوين نموذجًا للتنبؤ بدخل الشخص، فحدد عمود مستوى الدخل.
    إذا كنت تعمل بنموذج غير خاضع للإشراف مثل التجميع، فلا يوجد عمود هدف مطلوب.
  7. قم بتغيير الإعدادات الافتراضية للنموذج لضبط دقة نتيجة التنبؤ وتحسينها. يحدد النموذج الذي تعمل به هذه الإعدادات.
  8. انقر على خطوة حفظ النموذج وأدخل اسمًا ووصفًا للنموذج.
  9. انقر على حفظ، وأدخل اسمًا ووصفًا لتدفق البيانات ثم انقر على موافق لحفظ تدفق البيانات.
  10. انقر على تشغيل تدفق البيانات لتكوين نموذج التنبؤ تبعًا لإعدادات النموذج ومجموعة البيانات التي قمت بإدخالها.

خطوات تدفق البيانات لتدريب نماذج تعلم الآلة

يتيح لك Oracle Analytics إمكانية تدريب نماذج لتعلم الآلة باستخدام الخطوات الواردة في تدفقات البيانات. عند الانتهاء من تدريب نموذج لتعلم الآلة، يمكن استخدامه مع البيانات عن طريق خطوة تطبيق النموذج.

اسم الخطوة الوصف
AutoML (يتطلب Oracle Autonomous Data Warehouse) استخدم إمكانية AutoML في Oracle Autonomous Data Warehouse لتقديم توصيات النماذج التنبؤية وتدريبها لديك. تحلل خطوة AutoML بياناتك، وتحسب الخوارزمية الأفضل للاستخدام، وتسجل نموذجًا تنبئيًا في Oracle Analytics.
تدريب مُصنِّف ثنائي

تدريب نموذج تعلم الآلة لتصنيف البيانات إلى إحدى الفئات المحدَّدة سابقًا.

تدريب تجميع بيانات تدريب نموذج تعلم الآلة للفصل بين المجموعات ذات الخصائص المتشابهة، وتعيينها إلى مجموعات.
تدريب مُصنِّف متعدد تدريب نموذج تعلم الآلة لتصنيف بياناتك إلى ثلاث فئات أو أكثر محددة سابقًا.
تدريب التنبؤ الرقمي تدريب نموذج تعلم الآلة للتنبؤ بالقيمة الرقمية استنادًا إلى قيم البيانات المعروفة.

فحص نموذج تنبؤ

بعد تكوين نموذج التنبؤ وتشغيل تدفق البيانات، يمكنك مراجعة المعلومات الخاصة بالنموذج لتحديد دقته. استخدم هذه المعلومات لتعديل إعدادات النموذج بشكل متكرر لتحسين دقته والتنبؤ بنتائج أفضل.

عرض تفاصيل نموذج تنبؤ

تساعدك معلومات تفاصيل نموذج تنبؤ على فهم النموذج وتحديد إذا ما كان مناسبًا للتنبؤ ببياناتك. تتضمن تفاصيل النموذج فئة النموذج الخاصة به وخوارزميته وأعمدة إدخالاته وأعمدة مخرجاته

  1. في الصفحة الرئيسية، انقر على المستكشف، ثم على تعلم الآلة.
  2. انقر على أيقونة "القائمة" في نموذج تنبؤ وحدد فحص.
  3. انقر على التفاصيل لعرض معلومات النموذج.

تقييم جودة نموذج تنبؤ

عرض المعلومات التي تساعدك على فهم جودة نموذج تنبؤ. على سبيل المثال، يمكنك مراجعة دقة المقاييس مثل دقة النموذج والدقة والاستدعاء وقيمة F1 ومعدل النتائج الإيجابية الخاطئة.

يقدم Oracle Analytics مقاييس مشابهة لا تتعلق بالخوارزمية المستخدمة لإنشاء النموذج، وبالتالي يسهل من المقارنة بين النماذج المختلفة. أثناء عملية تكوين النموذج، يتم تقسيم مجموعة بيانات الإدخال إلى جزأين لتدريب النموذج واختباره استنادًا إلى معلمة Train Partition Percent (النسبة المئوية لتقسيم التدريب). يستخدم هذا النموذج جزء الاختبار من مجموعة البيانات لاختبار دقة النموذج الذي تم تكوينه.
تبعًا للنتائج في علامة تبويب الجودة، قد تحتاج إلى تعديل معلمات النموذج والاحتفاظ بها.
  1. في الصفحة الرئيسية، انقر على المستكشف، ثم على تعلم الآلة.
  2. انقر على أيقونة "القائمة" في نموذج تنبؤ وحدد فحص.
  3. انقر على علامة تبويب الجودة لمراجعة مقاييس جودة النموذج وتقييم النموذج. على سبيل المثال، راجع نتيجة دقة النموذج.

نصيحة: انقر على المزيد لمراجعة تفاصيل طرق العرض المكونة للنموذج.

ما مجموعات البيانات ذات الصلة بنموذج التنبؤ؟

عند تشغيل تدفق البيانات لتكوين نموذج تدريب لنموذج تنبؤ Oracle Analytics، تقوم Oracle Analytics بتكوين مجموعة من مجموعات البيانات ذات الصلة. ويمكن فتح مصنفات وإنشاؤها في مجموعات البيانات هذه للتعرف على مدى دقة النموذج.

تبعًا للخوارزمية التي تختارها للنموذج الخاص بك، فإن مجموعات البيانات ذات الصلة تتضمن تفاصيل بشأن النموذج مثل قواعد التنبؤ ومقاييس الدقة ومصفوفة الارتباك والمحركات الأساسية للتنبؤ. يمكنك استخدام هذه المعلومات لضبط النموذج للحصول على نتائج أفضل، كما يمكنك استخدام مجموعات البيانات ذات الصلة لمقارنة النماذج واتخاذ قرار بشأن النموذج الأكثر دقة.

على سبيل المثال، يمكنك فتح مجموعة بيانات المحركات لتحديد الأعمدة الأكثر تأثيرًا إيجابًا أو سلبًا على النموذج. من خلال فحص هذه الأعمدة، ستجد أن بعضها لا تتم معالجته كمتغيرات نموذج لأنها ليس إدخالات واقعية أو لأنها غير دقيقة جدًا بما لا يناسب التنبؤ. يمكنك استخدم محرر تدفق البيانات لفتح النموذج واستنادًا إلى المعلومات التي تكتشفها، يمكن إزالة الأعمدة غير الدقيقة للغاية أو غير المرتبطة، ثم إعادة تكوين النموذج. يمكن التحقق من علامتي تبويب "الجودة" و"النتائج" والتأكد من أنه تم تحسين دقة النموذج. تابع القيام بهذه العملية حتى تتأكد من دقة النموذج وجاهزيته لتقييم مجموعة بيانات جديدة.

تقوم خوارزميات مختلفة بتكوين مجموعات بيانات متشابهة. يمكن تغيير معلمات منفردة وأسماء الأعمدة في مجموعة البيانات تبعًا لنوع الخوارزمية ولكن تبقى وظيفة مجموعة البيانات كما هي. على سبيل المثال، يمكن تغيير أسماء الأعمدة في مجموعة بيانات إحصاءات من التراجع الخطي إلى التراجع اللوجستي، ولكن تظل مجموعة بيانات الإحصاءات تحتوي على مقاييس دقة النموذج.

مجموعات البيانات ذات الصلة لنماذج AutoML

عند تدريب نموذج تنبئي باستخدام AutoML، يقوم Oracle Analytics بتكوين مجموعات بيانات إضافية تحتوي على معلومات مفيدة حول النموذج. يعتمد عدد مجموعات البيانات التي تم تكوينها على خوارزمية النموذج. على سبيل المثال، لنماذج Naive Bayes، يقوم Oracle Analytics بتكوين مجموعة بيانات تقدم المعلومات حول الاحتمالات الشرطية. لنموذج شجرة القرار، تقدم مجموعة البيانات معلومات حول إحصائيات شجرة القرار. عند فحص نموذج مكون بواسطة AutoML باستخدام خوارزمية النموذج الخطي العام (GLM)، سترى إدخالات بالبادئة GLM* لمجموعات البيانات المحددة للنموذج والتي تحتوي على معلومات بيانات التعريف حول النموذج.
فيما يلي وصف GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png
.png

مجموعات البيانات ذات الصلة

ملاحظة:

يقوم Oracle Analytics بإلحاق اسم مخرجات تدفق البيانات بنوع مجموعة البيانات ذات الصلة. على سبيل المثال، لنموذج CART، إذا كانت مخرجات تدفق البيانات بالاسم cart_model2، فستكون مجموعة البيانات بالاسم cart_model2_CART.

CART

يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المتعلقة بـ CART (شجرة التصنيف والتراجع) التي تحتوي على الأعمدة التي تمثل الشروط ومعايير الشروط في شجرة القرارات بواقع تنبؤ لكل مجموعة وثقة التنبؤ. استخدم التمثيل المرئي للرسم البياني الشجري لتمثيل شجرة القرارات هذه مرئيًا.

يتم تكوين مجموعة بيانات CART عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزمية
قيمة رقمية CART للتنبؤ الرقمي
التصنيف الثنائي CART
التصنيف المتعدد CART

تقرير التصنيف

يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المرتبطة بتقرير التصنيف. على سبيل المثال، إذا كان العمود الهدف يمكن أن تكون له القيمتان المميزتان "نعم" أو "لا"، فإن مجموعة البيانات هذه تعرض مقاييس الدقة مثل F1، وPrecision (الدقة)، وRecall (الاستدعاء)، وSupport (الدعم) (عدد الصفوف في مجموعة بيانات التدريب التي تتضمن القيمة) لكل قيمة مميزة للعمود الهدف.

يتم تكوين مجموعة بيانات Classification (التصنيف) عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزميات
التصنيف الثنائي

Naive Bayes

الشبكة العصبية

جهاز متجهات الدعم

التصنيف المتعدد

Naive Bayes

الشبكة العصبية

جهاز متجهات الدعم

مصفوفة الارتباك

يقوم Oracle Analytics بتكوين جدول محوري لمجموعة البيانات المرتبطة بمصفوفة الارتباك التي تسمى أيضًا مصفوفة الخطأ. يمثل كل جدول طبعة لفئة تم التنبؤ بها، ويمثل كل عمود طبعة في فئة فعلية. يحتوى هذا الجدول على عدد من النتائج الإيجابية الخاطئة، والنتائج السلبية الخاطئة والنتائج الإيجابية الصحيحة والنتائج السلبية الصحيحة، ويتم استخدامها لحساب مقاييس الدقة F1 والاستدعاء والدقة.

يتم تكوين مجموعة بيانات Confusion Matrix (مصفوفة الارتباك) عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزميات
التصنيف الثنائي

التراجع اللوجستي

CART (شجرة القرارات)

Naive Bayes

الشبكة العصبية

غابة عشوائية

جهاز متجهات الدعم

التصنيف المتعدد

CART (شجرة القرارات)

Naive Bayes

الشبكة العصبية

غابة عشوائية

جهاز متجهات الدعم

برامج التشغيل

يقوم Oracle Analytics بتكوين جدول من مجموعة البيانات المرتبطة بمحركات الأقراص، التي تحتوي على المعلومات حول الأعمدة التي تحدد قيم العمود الهدف. يتم استخدام التراجع الخطي لتعريف هذه الأعمدة. يتم تعيين قيم معاملات وارتباطية لكل عمود. توضح قيم المعاملات عمر-وزن العمود المستخدم لتحديد قيمة العمود الهدف. تشير قيمة الارتباط إلى العلاقة بين العمود الهدف والعمود التابع. على سبيل المثال، إذا كانت قيمة العمود الهدف تتزايد أو تتناقص تبعًا للعمود التابع.

يتم تكوين مجموعة بيانات محركات الأقراص عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزميات
قيمة رقمية

التراجع الخطي

التراجع الخطي للشبكة المرنة

التصنيف الثنائي

التراجع اللوجستي

جهاز متجهات الدعم

التصنيف المتعدد جهاز متجهات الدعم

Hitmap

يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المرتبط بالمخطط الحراري الذي يحتوي على المعلومات حول نقاط الاتصال الطرفية لشجرة القرار. يمثل كل صف في الجدول نقطة توصيل طرفية ويشتمل على معلومات توضح ماهية نقطة التوصيل الطرفية مثل حجم المقطع والثقة وعدد الصفوف المتوقعة. على سبيل المثال، عدد التنبؤات الصحيحة المتوقعة = حجم المقطع * الثقة.

يتم تكوين مجموعة بيانات المخطط الحراري عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزمية
قيمة رقمية CART للتنبؤ الرقمي

القيم المتبقية

يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المتعلقة بالقيم المتبقية التي تحتوي على معلومات حول جودة توقعات القيم المتبقية. القيمة المتبقية هي الفرق بين القيم التي تم التنبؤ بها والقيم التي تم التنبؤ بها لنموذج تراجع. تحتوي مجموعة البيانات هذه على قيمة مجمعة للفرق المطلق بين القيم الفعلية والقيم المتنبأ بها لكل الأعمدة في مجموعة البيانات.

يتم تكوين مجموعة بيانات القيم المتبقية عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزميات
القيم الرقمية

التراجع الخطي

التراجع الخطي للشبكة المرنة

CART للتنبؤ الرقمي

التصنيف الثنائي CART (شجرة القرارات)
التصنيف المتعدد CART (شجرة القرارات)

الإحصاءات

يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المرتبطة بالإحصائيات. تعتمد مقاييس مجموعة البيانات هذه على الخوارزمية المستخدمة في إنشائها. لاحظ قائمة المقاييس القائمة على الخوارزمية:

  • التراجع الخطي، CART للتنبؤ الرقمي، التراجع الخطي للشبكة المرنة - تحتوي هذه الخوارزميات على معامل التحديد ومعامل التحديد المعدل ومتوسط الخطأ المطلق (MAE) ومتوسط مربع الخطأ (MSE) الخطأ النسبي المطلق (RAE) ومربع الخطأ النسبي (RSE) وجذر متوسط مربع الخطأ (RMSE).
  • CART(أشجار التصنيف والتراجع) وتصنيف Naive Bayes والشبكة العصبية وجهاز متجهات الدعم (SVM) والغابة العشوائية والتراجع المنطقي - تشتمل هذه الخوارزميات على الدقة وإجمالي F1.

يتم تكوين مجموعة البيانات هذه عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزمية
قيمة رقمية

التراجع الخطي

التراجع الخطي للشبكة المرنة

CART للتنبؤ الرقمي

التصنيف الثنائي

التراجع اللوجستي

CART (شجرة القرارات)

Naive Bayes

الشبكة العصبية

غابة عشوائية

جهاز متجهات الدعم

التصنيف المتعدد

Naive Bayes

الشبكة العصبية

غابة عشوائية

جهاز متجهات الدعم

الملخص

يقوم Oracle Analytics بتكوين جدول لمجموعة بيانات متعلقة بالملخص الذي يحتوي على المعلومات مثل اسم النموذج واسم الهدف.

يتم تكوين مجموعة بيانات الملخص عند تحديد توليفات النماذج والخوارزميات هذه.

النموذج الخوارزميات
التصنيف الثنائي

Naive Bayes

الشبكة العصبية

جهاز متجهات الدعم

التصنيف المتعدد

Naive Bayes

الشبكة العصبية

جهاز متجهات الدعم

البحث عن مجموعات البيانات المتعلقة بنموذج التنبؤ

يتم إنشاء مجموعات البيانات عند تدريب نموذج تنبؤ.

تبعًا للخوارزمية، فإن مجموعات البيانات المرتبطة هذه تتضمن تفاصيل بشأن النموذج مثل: قواعد التنبؤ ومقاييس الدقة ومصفوفة الارتباك والمحركات الأساسية للتنبؤ وغيرها. تساعدك هذه المعلمات على فهم القواعد التي استخدمها النموذج لتحديد التنبؤات والتصنيفات.
  1. في الصفحة الرئيسية، انقر على المستكشف، ثم على تعلم الآلة.
  2. انقر على أيقونة "القائمة" في نموذج تنبؤ وحدد فحص.
  3. انقر على علامة تبويب المرتبط للوصول إلى مجموعات البيانات المرتبطة.
  4. انقر نقرًا مزدوجًا على مجموعة بيانات مرتبطة لعرضها أو لاستخدامها في مصنف.

إضافة نموذج تنبؤ إلى مصنف

عند تكوين سيناريو في مصنف، تقوم بتطبيق نموذج تنبؤ على مجموعة بيانات المصنف للكشف عن الاتجاهات والأنماط التي تم تصميم النموذج للعثور عليها.

ملاحظة:

لا يمكن تطبيق نموذج تعلم آلة من Oracle على بيانات مصنف.
بعد إضافة النموذج إلى المصنف وتخطيط إدخالات النموذج في أعمدة مجموعة البيانات، يتضمن جزء البيانات كائنات النموذج والتي يمكنك سحبها وإفلاتها في لوحة العمل. يقوم تعلم الآلة بتكوين قيم النموذج تبعًا إلى أعمدة البيانات المطابقة للتمثيل المرئي.
  1. في الصفحة الرئيسية، انقر على تكوين، ثم انقر على مصنف.
  2. حدد مجموعة البيانات التي تريد استخدامها لتكوين المصنف وانقر على إضافة إلى مصنف.
  3. في جزء البيانات، انقر على إضافة، وحدد تكوين سيناريو.
  4. في مربع حوار تكوين سيناريو - تحديد نموذج، حدد نموذجًا وانقر على موافق.
    يمكنك تطبيق نموذج تنبؤ فقط. لا يمكن تطبيق نموذج تعلم آلة من Oracle.
    في حالة عدم التمكن من مطابقة كل نموذج إلى عنصر بيانات، يتم عرض مربع حوار تخطيط بياناتك إلى النموذج.
  5. إذا تم عرض مربع الحوار تخطيط بياناتك إلى النموذج، ففي حقل مجموعة البيانات، حدد مجموعة البيانات المطلوب استخدامها مع النموذج.
  6. قم بمطابقة إدخال النموذج وعناصر البيانات حسب الحاجة. انقر على تم.
    يظهر السيناريو كمجموعة بيانات في جزء عناصر البيانات.
  7. اسحب العناصر من مجموعة البيانات والنموذج الدلالي وأفلتها في لوحة العمل التمثيل المرئي.
  8. لتعديل السيناريو، انقر بزر الماوس الأيمن في جزء عناصر البيانات وحدد تحرير سيناريو.
  9. قم بتغيير مجموعة البيانات وتحديث تخطيط مدخلات النموذج وعناصر البيانات حسب الحاجة.
  10. انقر على حفظ لحفظ المصنف.