使用提升與增益圖表評估機器學習模型

您可以使用提升與增益圖表比較不同的機器學習模型,以判斷最準確的模型。

使用提升與增益圖表簡介

提升與增益圖表可讓您透過在 Oracle Analytics 中為視覺化項目的模型統計資料繪製圖表,評估預測機器學習模型。

當您使用資料流程將分類模型套用至資料集時,Oracle Analytics 可讓您計算提升與增益值。接著,您便可以在圖表中將此資料視覺化,以協助您評定預測模型的準確性並判斷要使用的最佳模型。

以下為 GUID-BB91080A-9081-4AAD-8448-441240BDCEFE-default.png 的說明
.png

先決條件

  • Oracle Database 或 Oracle Autonomous Data Warehouse
  • 一個包含預測機率的分類模型 (例如,使用 Naive Bayes 訓練命令檔建立的多重分類器模型)。

    您可以在 Oracle Analytics 的「機器學習」區域中存取現有的預測模型。

針對提升與增益分析產生的統計資料

當您將預測分類模型套用至資料集並產生提升與增益統計資料時,會產生一個名為 <資料流程名稱>_LIFT 並含有下列資料欄的資料集:
  • PopulationPercentile - 分割成 100 個相等群組的資料集母體。
  • CumulativeGain - 達到該百分位數之正值目標累計數目與正值目標總數的比例。累計增益線越靠近圖表的左上角,增益就越大;較低的客戶聯絡比例就會達到的較高的回應者比例。
  • GainChartBaseline - 整體回應率:此線代表在隨機選取記錄的情況下我們預期獲得的正值記錄百分比。例如,在行銷活動中,如果我們隨機聯絡 X% 的客戶,我們將收到總計 X% 的正面回應。
  • LiftChartBaseline - 值為 1 並用來作為提升比較的基準。
  • LiftValue - 百分位數的累計提升。提升係指所選資料之累計正值記錄密度與所有測試資料之正值密度的比例。
  • IdealModelLine - 正值目標累計數目與正值目標總數的比例。
  • OptimalGain - 這表示要聯絡的最佳客戶數。累計增益曲線在此點後將變平。

接著,您便可以在 Oracle Analytics 圖表中將 <資料流程名稱>_LIFT 資料集視覺化。例如,若要分析增益,您可以在 X 軸上繪製 PopulationPercentile,在 Y 軸上繪製 CumulativeGain、GainChartBaseline、IdealModelLine 及 OptimalGain。

以下為 GUID-86078629-A9D9-44D2-8D91-8B5F2FD96DA3-default.png 的說明
.png

產生提升與增益圖表的預測資料

當您使用資料流程將分類模型套用至資料集時,Oracle Analytics 可讓您計算能在提升與增益圖表中視覺化的統計資料。

開始之前,請先建立包含預測機率的分類模型 (例如,使用 Naive Bayes 訓練命令檔建立的多重分類器模型)。Oracle Analytics 會在機器學習頁面 (從「首頁」按一下機器學習) 的模型頁籤顯示可用的模型。
  1. 在「首頁」上,按一下建立,然後按一下資料流程
  2. 選取一個資料來源,然後按一下新增
  3. 按一下新增步驟,然後選取套用模型
  4. 選取模型選取一個包含預測機率的分類模型,然後按一下確定
  5. 套用模型參數區段中:
    • 計算提升與增益中,選取
    • 要計算提升的目標資料欄中,選取所預測之值的資料欄名稱。例如,如果您的模型使用名為 SIGNUP 的資料欄來預測客戶是否會註冊為成員,請選取 SIGNUP。
    • 要計算的正值類別中,指定在預測中代表正值類別 (或偏好的結果) 且區分大小寫的資料值。例如,如果您的模型使用名為 SIGNUP 且值為 YES 或 NO 的資料欄來預測客戶是否會註冊為成員,請指定 YES。
  6. 儲存資料節點新增至您的資料流程。
  7. 執行此資料流程。
此資料流程會產生一個名為 <資料流程名稱>_LIFT 且包含提升與增益統計資料的資料集,以供您評估。

使用提升與增益圖表評估機器學習模型

使用圖表來分析機器學習分類模型所產生的統計資料,以判斷要使用的最佳模型。

開始之前,請先對您的資料套用預測模型,並產生資料集內的提升與增益統計資料。
  1. 在「首頁」上,依序按一下建立工作簿
  2. 新增資料集中,選取您在上一個作業中產生的 <資料流程名稱>_LIFT 資料集,然後按一下新增至工作簿
  3. 視覺化面板中,選取要分析的統計資料,接著按一下滑鼠右鍵並選取選擇視覺化,然後選擇折線圖
    例如,若要分析增益,您可以將 PopulationPercentile 置於 X 軸,將 CumulativeGainGainChartBaselineIdealModelLineOptimalGain 置於 Y 軸。
    例如,若要分析提升,您可以將 PopulationPercentile 置於 X 軸,將 LiftChartBaselineLiftValue 置於 Y 軸。