تستخدم نماذج التنبؤ في Oracle Analytics العديد من خوارزميات Oracle Machine Learning المضمنة للبحث في مجموعات بياناتك، أو التنبؤ بالقيم الهدف أو تحديد فئات السجلات. استخدم محرر تدفق البيانات لتكوين نماذج التنبؤ وتدريبها وتطبيقها على بياناتك.
يُطبق نموذج التنبؤ في Oracle Analytics خوارزمية محددة على مجموعة بيانات للتنبؤ بقيم أو التنبؤ بفئات أو لتعريف مجموعات في البيانات.
يمكنك أيضًا استخدام نماذج تعلم الآلة من Oracle للتنبؤ بالبيانات.
يحتوي Oracle Analytics على خوارزميات لمساعدتك على تدريب نماذج التنبؤ لأغراض متعددة. من بعض أمثلة الخوارزميات: أشجار التراجع والتصنيف (CART) والتراجع المنطقي وk-means.
استخدم محرر تدفق البيانات لتدريب نموذج على مجموعة بيانات تدريبية أولاً. بعد تدريب نموذج التنبؤ، يمكنك تطبيقه على مجموعات البيانات التي تريد التنبؤ باستخدامها.
يمكنك جعل نموذج تم تدريبه متاحًا ليستخدمه المستخدمون الآخرون الذين يمكنهم تطبيقه على بياناتهم لتوقع القيم. في بعض الحالات، يقوم مستخدمون معينون بتدريب النماذج، ويطبقها مستخدمون آخرون.
ملاحظة:
إذا لم تكن متأكدًا مما تبحث عنه في بياناتك، يمكنك البدء باستخدام ميزة Explain التي تستخدم تعلم الآلة لتعريف الاتجاهات والأنماط. وعندها يمكنك استخدام محرر تدفق البيانات لتكوين نماذج تدريب وتدريبها للتعرف على الاتجاهات والأنماط التي عثرت عليها ميزة Explain.استخدم النموذج المنتهي لوضع نتيجة البيانات غير المعروفة أو غير المعنونة، للتمكن من إنشاء مجموعة بيانات في تدفق بيانات أو لإضافة تمثيل مرئي لتنبؤ إلى مصنف.
مثال
نفرض أنك تريد تكوين نموذج تصنيف متعدد وتدريبه للتنبؤ بالمرضى المعرضين لخطر الإصابة بأمراض القلب.
يقدم Oracle Analytics خوارزميات لأي من احتياجات تعلم الآلة لديك: التنبؤ الرقمي والمصنف المتعدد والمصنف الثنائي والتجميع.
وظيفة تعلم الآلة من Oracle لمحللي البيانات المتقدمين الذين يعلمون ما يبحثون عنه في البيانات ولديهم خبرة بتحليلات التنبؤ وفهم الفروقات بين الخوارزميات.
ملاحظة:
إذا كنت تستخدم البيانات من Oracle Autonomous Data Warehouse، يمكنك استخدام إمكانية AutoML لتدريب نموذج تنبئي بسرعة وسهولة لك بدون الحاجة لمهارات التعلم الآلة. يرجى الاطلاع على تدريب نموذج تنبئي باستخدام AutoML في Autonomous Data Warehouse.عادةً ما يود المستخدمون تكوين عدة نماذج تنبؤ ومقارنتها واختيار النموذج الذي على الأرجح سيقدم نتائج تلتزم بمعاييرهم وتلبي متطلباتهم. وقد تختلف هذه المعايير. على سبيل المثال، يختار المستخدمون أحيانًا نماذج لها دقة إجمالية أفضل، وأحيانًا يختار المستخدمون نماذج بأقل أخطاء من النوع 1 (نتيجة إيجابية خاطئة) والنوع 2 (نتيجة سلبية خاطئة)، وأحيانًا يختار المستخدمون النماذج التي تقوم بإرجاع نتائج بشكل أسرع بمستوى مقبول من الدقة حتى وإن لم تكن النتائج مثالية.
يحتوي Oracle Analytics على خوارزميات تعلم الآلة لكل نوع من التنبؤ أو التصنيف. وبهذه الخوارزميات، يمكن للمستخدمين تكوين نموذج واحد أو أكثر، أو استخدام معاملات مختلفة تم ضبطها، أو استخدام مجموعات بيانات تدريب مدخلات مختلفة، ثم اختيار النموذج الأفضل. يمكن للمستخدم اختيار أفضل نموذج من خلال مقارنة النماذج وتقييمها مقابل معاييره. لتحديد النموذج الأفضل، يمكن للمستخدمين تطبيق النموذج وتمثيل نتائج العمليات الحسابية مرئيًا لتحديد الدقة، أو يمكنهم فتح واستكشاف مجموعات البيانات ذات الصلة التي استخدمت Oracle Analytics النماذج لإخراجها.
اطلع على هذا الجدول للتعرف على الخوارزميات المقدمة:
الاسم | النوع | الفئة | الدالة | الوصف |
---|---|---|---|---|
CART |
التصنيف التراجع |
المصنف الثنائي المصنف المتعدد رقمي |
- | تستخدم أشجار القرار للتنبؤ بالقيم المستمرة والمتميزة.
الاستخدام مع مجموعات البيانات الكبيرة. |
التراجع الخطي للشبكة المرنة | التراجع | رقمي | ElasticNet | نموذج التراجع المتقدم. تقدم معلومات إضافية (تنظيم)، تنفيذ تحديد المتغير وتنفيذ التوليفات الخطية. عقوبات أسلوبي تراجع لاسو وريدج.
يتم الاستخدام مع العدد الأكبر من السمات لتجنب التداخل الخطي (حيث تكون عدة سمات مرتبطة تمامًا) والملاءمة الزائدة. |
تدرجي | التجميع | التجميع | AgglomerativeClustering | تبني تدرج للمجموعات التي تستخدم مقاييس من أسفل لأعلى (كل ملاحظة هي تجمع في حد ذاتها وتم دمجه) أو من أعلى لأسفل (كل الملاحظات تبدأ كتجمع واحد) والمسافة.
يتم الاستخدام عندما لا تكون مجموعة البيانات كبيرة ولا يكون عدد المجموعات معروفًا مسبقًا. |
K-Means | التجميع | التجميع | k-means | يتم تسجيل أقسام التكرار إلى مجموعات k حيث تنتمي كل ملاحظة إلى المجموعة ذات أقرب متوسط.
يتم الاستخدام لأعمدة قياس المجموعات وبتوقعات ثابتة لعدد المجموعات المطلوبة. تعمل جيدًا مع مجموعات البيانات الكبيرة. وتختلف النتائج مع كل عملية تشغيل. |
التراجع الخطي | التراجع | رقمي | المربعات الصغرى العادية
ريدج لاسو |
الأسلوب الخطي لنمذجة العلاقة بين المتغير الهدف والسمات الأخرى في مجموعة البيانات.
يتم الاستخدام لتوقع القيم الرقمية عندما لا تكون السمات مرتبطة تمامًا. |
التراجع اللوجستي | التراجع | المصنف الثنائي | LogisticRegressionCV | يتم الاستخدام لتوقع قيمة متغير تابع من حيث الفئة. المتغير التابع هو متغير ثنائي يحتوي على بيانات بأكواد من 1 أو 0. |
Naive Bayes | التصنيف |
المصنف الثنائي المصنف المتعدد |
GaussianNB | التصنيف الاحتمالي القائم على نظرية Bayes التي تفترض عدم وجود تبعية بين السمات.
يتم الاستخدام عند وجود رقم كبير من أبعاد المدخلات. |
الشبكة العصبية | التصنيف |
المصنف الثنائي المصنف المتعدد |
MLPClassifier | خوارزمية تصنيف متكرر تتعلم من خلال مقارنة نتائج تصنيفاتها بالقيمة الفعلية وتقوم بإرجاعها إلى الشبكة لتعديل الخوارزمية لمزيد من التكرارات.
يتم الاستخدام للتحليل النصي. |
غابة عشوائية | التصنيف |
المصنف الثنائي المصنف المتعدد رقمي |
- | أسلوب تعلم مجموعة يقوم بتكوين عدة أشجار قرارات وإرجاع مخرجات بالقيمة التي تمثل بشكل مجمع كل أشجار القرارات.
يتم الاستخدام لتوقع المتغيرات الفئوية والرقمية. |
SVM | التصنيف |
المصنف الثنائي المصنف المتعدد |
LinearSVC, SVC | تصنف السجلات من خلال تخطيطها في المساحة وتكوين المستويات الترابطية التي يمكن استخدامها للتصنيف. يتم تخطيط السجلات الجديدة (تحديد نتائج البيانات) في المساحة ويتم التنبؤ بها لتنتمي إلى فئة، الأمر الذي يعتمد على الجانب الموجودة به من المستوى الترابطي. |
عند استخدام البيانات من Oracle Autonomous Data Warehouse، يمكنك استخدام إمكانية AutoML لتقديم توصيات النماذج التنبئية وتدريبها. يحلل AutoML بياناتك، ويحسب الخوارزمية الأفضل للاستخدام،ويسجل نموذج تنبئي في Oracle Analytics لتتمكن من التنبؤ بشأن بياناتك.
OML_Developer
وليس مستخدم مميز بالدور 'admin'. وإلا، سيفشل تدفق البيانات عندما تحاول تشغيله وحفظه.يقوم محللو البيانات المتقدمة بتكوين نماذج تنبئية وتدريبها ليتمكنوا من استخدامها لنشر خوارزميات Oracle Machine Learning إلى مجموعات بياناتك، أو التنبؤ بالقيمة الهدف أو تحديد فئات السجلات. استخدم محرر تدفق البيانات لتكوين نماذج التنبؤ وتدريبها وتطبيقها على بياناتك.
إن عملية تحديد نموذج دقيق تعتمد على التكرار، ويمكن لمحلل البيانات المتقدم تجربة نماذج مختلفة ومقارنة نتائجها وضبط المعاملات بناءً على المحاولة والخطأ. يمكن لمحلل البيانات استخدام نموذج تنبؤ دقيق ونهائي للتنبؤ بالاتجاهات في مجموعات البيانات الأخرى أو إضافة النموذج إلى المصنفات.
ملاحظة:
إذا كنت تستخدم البيانات من Oracle Autonomous Data Warehouse، يمكنك استخدام إمكانية AutoML لتدريب نموذج تنبئي بسرعة وسهولة لك بدون الحاجة لمهارات التعلم الآلة. يرجى الاطلاع على تدريب نموذج تنبئي باستخدام AutoML في Autonomous Data Warehouse.يقدم Oracle Analytics خوارزميات للتنبؤ الرقمي والتصنيف المتعدد والتصنيف الثنائي والتجميع.
يتيح لك Oracle Analytics إمكانية تدريب نماذج لتعلم الآلة باستخدام الخطوات الواردة في تدفقات البيانات. عند الانتهاء من تدريب نموذج لتعلم الآلة، يمكن استخدامه مع البيانات عن طريق خطوة تطبيق النموذج.
اسم الخطوة | الوصف |
---|---|
AutoML (يتطلب Oracle Autonomous Data Warehouse) | استخدم إمكانية AutoML في Oracle Autonomous Data Warehouse لتقديم توصيات النماذج التنبؤية وتدريبها لديك. تحلل خطوة AutoML بياناتك، وتحسب الخوارزمية الأفضل للاستخدام، وتسجل نموذجًا تنبئيًا في Oracle Analytics. |
تدريب مُصنِّف ثنائي |
تدريب نموذج تعلم الآلة لتصنيف البيانات إلى إحدى الفئات المحدَّدة سابقًا. |
تدريب تجميع بيانات | تدريب نموذج تعلم الآلة للفصل بين المجموعات ذات الخصائص المتشابهة، وتعيينها إلى مجموعات. |
تدريب مُصنِّف متعدد | تدريب نموذج تعلم الآلة لتصنيف بياناتك إلى ثلاث فئات أو أكثر محددة سابقًا. |
تدريب التنبؤ الرقمي | تدريب نموذج تعلم الآلة للتنبؤ بالقيمة الرقمية استنادًا إلى قيم البيانات المعروفة. |
بعد تكوين نموذج التنبؤ وتشغيل تدفق البيانات، يمكنك مراجعة المعلومات الخاصة بالنموذج لتحديد دقته. استخدم هذه المعلومات لتعديل إعدادات النموذج بشكل متكرر لتحسين دقته والتنبؤ بنتائج أفضل.
تساعدك معلومات تفاصيل نموذج تنبؤ على فهم النموذج وتحديد إذا ما كان مناسبًا للتنبؤ ببياناتك. تتضمن تفاصيل النموذج فئة النموذج الخاصة به وخوارزميته وأعمدة إدخالاته وأعمدة مخرجاته
عرض المعلومات التي تساعدك على فهم جودة نموذج تنبؤ. على سبيل المثال، يمكنك مراجعة دقة المقاييس مثل دقة النموذج والدقة والاستدعاء وقيمة F1 ومعدل النتائج الإيجابية الخاطئة.
عند تشغيل تدفق البيانات لتكوين نموذج تدريب لنموذج تنبؤ Oracle Analytics، تقوم Oracle Analytics بتكوين مجموعة من مجموعات البيانات ذات الصلة. ويمكن فتح مصنفات وإنشاؤها في مجموعات البيانات هذه للتعرف على مدى دقة النموذج.
تبعًا للخوارزمية التي تختارها للنموذج الخاص بك، فإن مجموعات البيانات ذات الصلة تتضمن تفاصيل بشأن النموذج مثل قواعد التنبؤ ومقاييس الدقة ومصفوفة الارتباك والمحركات الأساسية للتنبؤ. يمكنك استخدام هذه المعلومات لضبط النموذج للحصول على نتائج أفضل، كما يمكنك استخدام مجموعات البيانات ذات الصلة لمقارنة النماذج واتخاذ قرار بشأن النموذج الأكثر دقة.
على سبيل المثال، يمكنك فتح مجموعة بيانات المحركات لتحديد الأعمدة الأكثر تأثيرًا إيجابًا أو سلبًا على النموذج. من خلال فحص هذه الأعمدة، ستجد أن بعضها لا تتم معالجته كمتغيرات نموذج لأنها ليس إدخالات واقعية أو لأنها غير دقيقة جدًا بما لا يناسب التنبؤ. يمكنك استخدم محرر تدفق البيانات لفتح النموذج واستنادًا إلى المعلومات التي تكتشفها، يمكن إزالة الأعمدة غير الدقيقة للغاية أو غير المرتبطة، ثم إعادة تكوين النموذج. يمكن التحقق من علامتي تبويب "الجودة" و"النتائج" والتأكد من أنه تم تحسين دقة النموذج. تابع القيام بهذه العملية حتى تتأكد من دقة النموذج وجاهزيته لتقييم مجموعة بيانات جديدة.
تقوم خوارزميات مختلفة بتكوين مجموعات بيانات متشابهة. يمكن تغيير معلمات منفردة وأسماء الأعمدة في مجموعة البيانات تبعًا لنوع الخوارزمية ولكن تبقى وظيفة مجموعة البيانات كما هي. على سبيل المثال، يمكن تغيير أسماء الأعمدة في مجموعة بيانات إحصاءات من التراجع الخطي إلى التراجع اللوجستي، ولكن تظل مجموعة بيانات الإحصاءات تحتوي على مقاييس دقة النموذج.
مجموعات البيانات ذات الصلة لنماذج AutoML
عند تدريب نموذج تنبئي باستخدام AutoML، يقوم Oracle Analytics بتكوين مجموعات بيانات إضافية تحتوي على معلومات مفيدة حول النموذج. يعتمد عدد مجموعات البيانات التي تم تكوينها على خوارزمية النموذج. على سبيل المثال، لنماذج Naive Bayes، يقوم Oracle Analytics بتكوين مجموعة بيانات تقدم المعلومات حول الاحتمالات الشرطية. لنموذج شجرة القرار، تقدم مجموعة البيانات معلومات حول إحصائيات شجرة القرار. عند فحص نموذج مكون بواسطة AutoML باستخدام خوارزمية النموذج الخطي العام (GLM)، سترى إدخالات بالبادئة GLM* لمجموعات البيانات المحددة للنموذج والتي تحتوي على معلومات بيانات التعريف حول النموذج.
.png
مجموعات البيانات ذات الصلة
ملاحظة:
يقوم Oracle Analytics بإلحاق اسم مخرجات تدفق البيانات بنوع مجموعة البيانات ذات الصلة. على سبيل المثال، لنموذج CART، إذا كانت مخرجات تدفق البيانات بالاسم cart_model2، فستكون مجموعة البيانات بالاسم cart_model2_CART.CART
يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المتعلقة بـ CART (شجرة التصنيف والتراجع) التي تحتوي على الأعمدة التي تمثل الشروط ومعايير الشروط في شجرة القرارات بواقع تنبؤ لكل مجموعة وثقة التنبؤ. استخدم التمثيل المرئي للرسم البياني الشجري لتمثيل شجرة القرارات هذه مرئيًا.
يتم تكوين مجموعة بيانات CART عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزمية |
---|---|
قيمة رقمية | CART للتنبؤ الرقمي |
التصنيف الثنائي | CART |
التصنيف المتعدد | CART |
تقرير التصنيف
يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المرتبطة بتقرير التصنيف. على سبيل المثال، إذا كان العمود الهدف يمكن أن تكون له القيمتان المميزتان "نعم" أو "لا"، فإن مجموعة البيانات هذه تعرض مقاييس الدقة مثل F1، وPrecision (الدقة)، وRecall (الاستدعاء)، وSupport (الدعم) (عدد الصفوف في مجموعة بيانات التدريب التي تتضمن القيمة) لكل قيمة مميزة للعمود الهدف.
يتم تكوين مجموعة بيانات Classification (التصنيف) عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزميات |
---|---|
التصنيف الثنائي |
Naive Bayes الشبكة العصبية جهاز متجهات الدعم |
التصنيف المتعدد |
Naive Bayes الشبكة العصبية جهاز متجهات الدعم |
مصفوفة الارتباك
يقوم Oracle Analytics بتكوين جدول محوري لمجموعة البيانات المرتبطة بمصفوفة الارتباك التي تسمى أيضًا مصفوفة الخطأ. يمثل كل جدول طبعة لفئة تم التنبؤ بها، ويمثل كل عمود طبعة في فئة فعلية. يحتوى هذا الجدول على عدد من النتائج الإيجابية الخاطئة، والنتائج السلبية الخاطئة والنتائج الإيجابية الصحيحة والنتائج السلبية الصحيحة، ويتم استخدامها لحساب مقاييس الدقة F1 والاستدعاء والدقة.
يتم تكوين مجموعة بيانات Confusion Matrix (مصفوفة الارتباك) عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزميات |
---|---|
التصنيف الثنائي |
التراجع اللوجستي CART (شجرة القرارات) Naive Bayes الشبكة العصبية غابة عشوائية جهاز متجهات الدعم |
التصنيف المتعدد |
CART (شجرة القرارات) Naive Bayes الشبكة العصبية غابة عشوائية جهاز متجهات الدعم |
برامج التشغيل
يقوم Oracle Analytics بتكوين جدول من مجموعة البيانات المرتبطة بمحركات الأقراص، التي تحتوي على المعلومات حول الأعمدة التي تحدد قيم العمود الهدف. يتم استخدام التراجع الخطي لتعريف هذه الأعمدة. يتم تعيين قيم معاملات وارتباطية لكل عمود. توضح قيم المعاملات عمر-وزن العمود المستخدم لتحديد قيمة العمود الهدف. تشير قيمة الارتباط إلى العلاقة بين العمود الهدف والعمود التابع. على سبيل المثال، إذا كانت قيمة العمود الهدف تتزايد أو تتناقص تبعًا للعمود التابع.
يتم تكوين مجموعة بيانات محركات الأقراص عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزميات |
---|---|
قيمة رقمية |
التراجع الخطي التراجع الخطي للشبكة المرنة |
التصنيف الثنائي |
التراجع اللوجستي جهاز متجهات الدعم |
التصنيف المتعدد | جهاز متجهات الدعم |
Hitmap
يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المرتبط بالمخطط الحراري الذي يحتوي على المعلومات حول نقاط الاتصال الطرفية لشجرة القرار. يمثل كل صف في الجدول نقطة توصيل طرفية ويشتمل على معلومات توضح ماهية نقطة التوصيل الطرفية مثل حجم المقطع والثقة وعدد الصفوف المتوقعة. على سبيل المثال، عدد التنبؤات الصحيحة المتوقعة = حجم المقطع * الثقة.
يتم تكوين مجموعة بيانات المخطط الحراري عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزمية |
---|---|
قيمة رقمية | CART للتنبؤ الرقمي |
القيم المتبقية
يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المتعلقة بالقيم المتبقية التي تحتوي على معلومات حول جودة توقعات القيم المتبقية. القيمة المتبقية هي الفرق بين القيم التي تم التنبؤ بها والقيم التي تم التنبؤ بها لنموذج تراجع. تحتوي مجموعة البيانات هذه على قيمة مجمعة للفرق المطلق بين القيم الفعلية والقيم المتنبأ بها لكل الأعمدة في مجموعة البيانات.
يتم تكوين مجموعة بيانات القيم المتبقية عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزميات |
---|---|
القيم الرقمية |
التراجع الخطي التراجع الخطي للشبكة المرنة CART للتنبؤ الرقمي |
التصنيف الثنائي | CART (شجرة القرارات) |
التصنيف المتعدد | CART (شجرة القرارات) |
الإحصاءات
يقوم Oracle Analytics بتكوين جدول لمجموعة البيانات المرتبطة بالإحصائيات. تعتمد مقاييس مجموعة البيانات هذه على الخوارزمية المستخدمة في إنشائها. لاحظ قائمة المقاييس القائمة على الخوارزمية:
يتم تكوين مجموعة البيانات هذه عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزمية |
---|---|
قيمة رقمية |
التراجع الخطي التراجع الخطي للشبكة المرنة CART للتنبؤ الرقمي |
التصنيف الثنائي |
التراجع اللوجستي CART (شجرة القرارات) Naive Bayes الشبكة العصبية غابة عشوائية جهاز متجهات الدعم |
التصنيف المتعدد |
Naive Bayes الشبكة العصبية غابة عشوائية جهاز متجهات الدعم |
الملخص
يقوم Oracle Analytics بتكوين جدول لمجموعة بيانات متعلقة بالملخص الذي يحتوي على المعلومات مثل اسم النموذج واسم الهدف.
يتم تكوين مجموعة بيانات الملخص عند تحديد توليفات النماذج والخوارزميات هذه.
النموذج | الخوارزميات |
---|---|
التصنيف الثنائي |
Naive Bayes الشبكة العصبية جهاز متجهات الدعم |
التصنيف المتعدد |
Naive Bayes الشبكة العصبية جهاز متجهات الدعم |
يتم إنشاء مجموعات البيانات عند تدريب نموذج تنبؤ.
عند تكوين سيناريو في مصنف، تقوم بتطبيق نموذج تنبؤ على مجموعة بيانات المصنف للكشف عن الاتجاهات والأنماط التي تم تصميم النموذج للعثور عليها.
ملاحظة:
لا يمكن تطبيق نموذج تعلم آلة من Oracle على بيانات مصنف.