تقييم نماذج التعلم الآلي باستخدام مخططات الرفع والربح

تتيح لك مخططات الربح والرفع مقارنة نماذج التعلم الآلي المختلفة لتحديد النموذج الأكثر دقة.

نظرة عامة على استخدام مخططات الرفع والربح

تتيح لك مخططات الرفع والربح تقييم نماذج التعلم الآلي التنبئي من خلال وضع رسومات بيانية لإحصائيات النمذجة في تمثيل مرئي في Oracle Analytics.

عندما تستخدم تدفق بيانات لتطبيق نموذج تصنيف إلى مجموعة بيانات، يتيح لك Oracle Analytics حساب قيم الرفع والربح. يمكنك حينذاك تمثيل هذه البيانات مرئيًا لمساعدتك على تقييم دقة النماذج التنبئية وتحديد النموذج الأفضل لاستخدامه.

فيما يلي وصف GUID-BB91080A-9081-4AAD-8448-441240BDCEFE-default.png
.png

المتطلبات المسبقة

  • Oracle Database أو Oracle Autonomous Data Warehouse
  • نموذج تصنيف يتضمن احتمالية التوقع (على سبيل المثال، نموذج تصنيف متعدد تم تكوينه باستخدام اسكربت تدريب Naive Bayes).

    يمكنك الوصول إلى النماذج التنبئية الموجودة من خلال منطقة تعلم الآلة في Oracle Analytics.

الإحصائيات التي تم تكوينها لتحليل الربح والرفع

عندما تطبق نموذج تصنيف تنبئي على مجموعة بيانات، وتقوم بتكوين إحصائيات الرفع والربح، أنت تقوم بإنشاء مجموعة بيانات بالاسم <اسم تدفق البيانات>_LIFT بهذه الأعمدة:
  • PopulationPercentile - تقسيم عدد بيانات مجموعة البيانات إلى 100 مجموعة متساوية.
  • CumulativeGain - معدل العدد التراكمي للأهداف الإيجابية حتى تلك النسبة، لإجمالي عدد الأهداف الإيجابية. كلما اقترب خط المكاسب التراكمية من أعلى الركن الأيسر للرسم البياني، كلما زادت الأرباح، ونسبة المستجيبين الذين وصلوا إلى نسبة العملاء الذين تم الاتصال بهم الأقل.
  • GainChartBaseline - إجمالي معدل الاستجابة: يمثل السطر نسبة السجلات الإيجابية التي نتوقع الحصول عليها إذا اخترنا السجلات عشوائيًا. على سبيل المثال، في حملة تسويقية، إذا تواصلنا مع X% من العملاء عشوائيًا، فسنتلقى X% من إجمالي الردود الإيجابية.
  • LiftChartBaseline - قيمة 1 وتُستخدم كخط قاعدة لمقارنة الرفع.
  • LiftValue - الرفع التراكمي لنسبة. الرفع هو نسبة كثافة السجلات الإيجابية التراكمية للبيانات المحددة، مقابل الكثافة الإيجابية عبر كل بيانات الاختبار.
  • IdealModelLine - معدل العدد التراكمي للأهداف الإيجابية مقابل العدد الإجمالي للأهداف الإيجابية.
  • OptimalGain - يشير إلى العدد المثالي للعملاء الذي يجب الاتصال بهم. سيصبح منحنى الربح التراكمي مستويًا بعد هذه النقطة.

يمكنك تمثيل مجموعة البيانات <اسم تدفق البيانات>_LIFT مرئيًا في مخطط Oracle Analytics. على سبيل المثال، لتحليل الأرباح، يمكنك تخطيط PopulationPercentile على المحور س وCumulativeGain وGainChartBaseline وIdealModelLine وOptimalGain على المحور ص.

فيما يلي وصف GUID-86078629-A9D9-44D2-8D91-8B5F2FD96DA3-default.png
.png

تكوين بيانات تنبئية لمخططات الرفع والربح

عندما تستخدم تدفق بيانات لتطبيق نموذج تصنيف على مجموعة بيانات، يتيح لك Oracle Analytics حساب الإحصائيات التي يمكنك تمثيلها مرئيًا في مخططات الرفع والربح.

قبل البدء، قم بتكوين نموذج تصنيف يتضمن احتمالية التوقع (على سبيل المثال، نموذج تصنيف متعدد تم تكوينه باستخدام اسكربت تدريب Naive Bayes). يعرض Oracle Analytics النماذج المتوفرة في علامة تبويب النماذج في صفحة التعلم الآلي (من الصفحة الرئيسية، انقر على التعلم الآلي).
  1. في الصفحة الرئيسية، انقر على تكوين، ثم انقر على تدفق البيانات.
  2. حدد مصدر بيانات، ثم انقر على إضافة.
  3. انقر على إضافة خطوة، وحدد تطبيق نموذج.
  4. في تحديد نموذج، حدد نموذج تصنيف يتضمن احتمالية توقع، ثم انقر على موافق.
  5. في خطوة تطبيق نموذج، في قسم المعاملات:
    • في حساب الرفع والربح، حدد نعم.
    • في حساب العمود لحساب الرفع، حدد اسم عمود القيمة الجاري التنبؤ بها. على سبيل المثال، إذا كان نموذجك يتوقع إذا ما كان العملاء سيسجلون للحصول على عضوية باستخدام عمود بالاسم SIGNUP، فحدد SIGNUP.
    • في الفئة الإيجابية المطلوب حسابها، حدد قيمة البيانات الحساسة لحالة الأحرف التي تمثل الفئة الإيجابية (أو النتيجة المفضلة) في التنبؤ. على سبيل المثال، إذا كان نموذجك يتوقع إذا ما كان العملاء سيسجلون للحصول على العضوية باستخدام عمود بالاسم SIGNUP القيم YES أو NO، فحدد YES.
  6. أضف نقطة توصيل حفظ البيانات إلى تدفق البيانات الخاص بك.
  7. نفذ تدفق البيانات هذا.
يقوم تدفق البيانات هذا بتكوين مجموعة بيانات بالاسم <اسم تدفق البيانات>_LIFT التي تحتوي على إحصائيات الرفع والربح التي يمكنك تقييمها.

تقييم نموذج تعلم آلة باستخدام مخطط الرفع والربح

استخدم مخططًا لتحليل الإحصائيات التي تم تكوينها بواسطة نماذج تصنيف تعلم الآلة لتحديد أفضل نموذج تريد استخدامه.

قبل أن تبدأ، قم بتطبيق نموذج تنبئي على بياناتك وقم بتكوين إحصائيات الرفع والربح في مجموعة بيانات.
  1. في الصفحة الرئيسية، انقر على تكوين، قم انقر على مصنف.
  2. في إضافة مجموعة بيانات، حدد مجموعة بيانات <اسم تدفق البيانات>_LIFT التي قمت بتكوينها في المهمة السابقة، ثم انقر على إضافة إلى مصنف.
  3. في لوحة تمثيل مرئي، حدد الإحصائيات المطلوب تحليلها، ثم انقر بزر الماوس الأيمن وحدد تحديد تمثيل مرئي، ثم اختر مخطط خطي.
    على سبيل المثال، لتحليل الأرباح، يمكنك وضع PopulationPercentile على المحور س، وضع CumulativeGain وGainChartBaseline وIdealModelLine وOptimalGain على المحور ص.
    لتحليل الرفع، يمكنك وضع PopulationPercentile على المحور س، وضع LiftChartBaseline وLiftValue على المحور ص.