בצע הערכה למודלי למידת מכונה באמצעות תרשימי רווח ומינוף

תרשימי רווח ומינוף מאפשרים לך להשוות מודלי למידת מכונה שונים כדי לקבוע את המודל המדויק ביותר.

מבט כללי על שימוש בתרשימי רווח ומינוף

תרשימי רווח ומינוף מאפשרים לך להעריך מודלי חיזוי של למידת מכונה על-ידי יצירת תרשים של נתונים סטטיסטיים של מידול בהמחשה גרפית ב-Oracle Analytics.

כאשר אתה משתמש בזרימת נתונים להחלת מודל סיווג לסל נתונים, Oracle Analytics מאפשר לך לחשב ערכי רווח ומינוף. תוכל לאחר מכן להמחיש נתונים אלו בתרשים כדי לסייע לך להעריך את הדיוק של מודלי חיזוי ולקבוע את המודל הטוב ביותר לשימוש.

להלן תיאור של GUID-BB91080A-9081-4AAD-8448-441240BDCEFE-default.png
.png

דרישות מקדימות

  • Oracle Database או Oracle Autonomous Data Warehouse
  • מודל סיווג שמכיל הסתברות של תחזית (למשל מודל רב-סיווגי שנוצר באמצעות תסריט הדרכה של Naive Bayes).

    הגישה למודלים חיזויים קיימים היא באזור למידת המכונה ב-Oracle Analytics.

נתונים סטטיסטיים שהופקו לניתוח מינוף ורווח

כאשר אתה מחיל מודל סיווג חיזוי לסל נתונים ומפיק נתונים סטטיסטיים של רווח ומינוף, אתה מפיק סל נתונים בשם <Data flow name>_LIFT עם עמודות אלו:
  • PopulationPercentile - אוכלוסיית סל הנתונים התפצלה ל-100 קבוצות שוות.
  • CumulativeGain - היחס בו המספר מצטבר של יעדים חיוביים למאון זה, למספר הכולל של יעדים חיוביים. ככל שקו הרווחים המצטבר קרוב יותר לפינה השמאלית העליונה של התרשים, כך הרווח גדול יותר; כך יחס המגיבים גבוה יותר ליחס הנמוך יותר של לקוחות שנוצר איתם קשר.
  • GainChartBaseline - שיעור התגובות הכולל : הקו מייצג את האחוז של הרשומות החיוביות שאנו מצפים לקבל אם נבחר רשומות באופן אקראי. לדוגמה, בקמפיין שיווקי, אם ניצור קשר עם X% של לקוחות באופן אקראי, נקבל X% מסך התגובות החיוביות.
  • LiftChartBaseline - ערך של 1 ומשמש כנתונים התחלתיים להשוואת מינוף.
  • LiftValue - המינוף המצטבר למאון. מינוף הוא היחס בין צפיפות רשומות חיוביות מצטברות עבור הנתונים שנבחרו, לצפיפות החיובית בכל נתוני המבחן.
  • IdealModelLine - היחס המספר המצטבר של יעדים חיוביים למספר הכולל של יעדים חיוביים.
  • OptimalGain - זה מציין אם המספר האופטימלי של לקוחות ליצירת קשר. עקומת הרווח המצטבר תשתטח מעבר לנקודה זו.

לאחר מכן תוכל להמחיש את סל הנתונים <Data flow name>_LIFT בתרשים Oracle Analytics. לדוגמה, כדי לנתח רווחים, תוכל לבצע התווית נתונים של PopulationPercentile על ציר ה-x ו-CumulativeGain, GainChartBaseline, IdealModelLine ו-OptimalGain על ציר ה-y.

להלן תיאור של GUID-86078629-A9D9-44D2-8D91-8B5F2FD96DA3-default.png
.png

צור נתוני חיזוי לתרשימי רווח ומינוף

כאשר אתה משתמש בזרימת נתונים להחלת מודל סיווג לסל נתונים, Oracle Analytics מאפשר לך לחשב נתונים סטטיסטיים שתוכל להמחיש בתרשימי רווח ומינוף.

לפני שאתה מתחיל, צור מודל סיווג שמכיל הסתברות של תחזית (למשל מודל רב-סיווגי שנוצר באמצעות תסריט הדרכה של Naive Bayes). Oracle Analytics מציגה מודלים זמינים בכרטסייה מודלים בדף למידת מכונה (מדף הבית, לחץ על למידת מכונה).
  1. בדף הבית, לחץ על צור, ואחר כך על זרימת נתונים.
  2. בחר מקור נתונים ולאחר מכן לחץ על הוסף.
  3. לחץ על הוסף שלב (+), ובחר את החל מודל.
  4. בבחר מודל, בחר מודל סיווג שמכיל הסתברות תחזית, לאחר מכן לחץ על אוקיי.
  5. בהחל מודל, בפרק פרמטרים:
    • בחשב רווח ומינוף, בחר בכן.
    • בבחר על עמודה כדי לחשב מינוך, בחר את שם העמודה של הערך החזוי. לדוגמה, אם המודל שלך חוזה אם הלקוח יירשם לחברות באמצעות עמודה עם השם SIGNUP, לחץ על SIGNUP.
    • במחלקה חיובית לחישוב, ציין את ערך הנתונים הרגיש לרישיות המייצג את המחלקה החיובית (או את התוצאה המועדפת) בתחזית. לדוגמה, אם המודל שלך חוזה אם הלקוח יירשם לחברות באמצעות עמודה בשם SIGNUP עם הערכים YES או NO, ציין YES.
  6. הוסף צומת שמור נתונים לזרימת הנתונים שלך.
  7. בצע זרימת נתונים זו.
זרימת הנתונים מפיקה סל נתונים בשם <Data flow name>_LIFT המכיל נתונים סטטיסטיים של רווח ומינוף, שאתה יכול להעריך.

בצע הערכה למודל למידת מכונה באמצעות תרשים רווח ומינוף

השתמש בתרשים כדי לנתח נתונים סטטיסטיים שנוצרו על-ידי מודלים לסיווג למידת מכונה כדי לקבוע את המודל הטוב ביותר לשימוש.

לפני שאתה מתחיל, החל מודל חיזוי על הנתונים שלך והפק נתונים סטטיסטיים של רווח ומינוף בסל נתונים.
  1. בדף הבית, לחץ על צור ואחר כך על חוברת עבודה.
  2. בהוסף סל נתונים, בחר את סל הנתונים <Data flow name>_LIFT שיצרת במשימה הקודמת, לאחר מכן לחץ על הוסף לחוברת עבודה.
  3. בלוח המחש, בחר את הנתונים הסטטיסטיים לניתוח ולאחר מכן לחץ לחיצה ימנית על בחר המחשה ובחר בתרשים קו.
    לדוגמה, כדי לנתח רווחים, תוכל למקם את PopulationPercentile על ציר ה-x ואת CumulativeGain, GainChartBaseline, IdealModelLine ו-OptimalGain על ציר ה-y.
    כדי לנתח מינוף, תוכל למקם את PopulationPercentile על ציר ה-x, ואת LiftChartBaseline ו-LiftValue על ציר ה-y.