33.2 例: 販売促進の候補の予測

この例では、クーポンとアフィニティ・カードを提供する特別な販売促進のためにブラジルの顧客をターゲットにするPREDICTION問合せを示します。

問合せでは、未婚/既婚、学歴および所得に関するデータを使用し、インセンティブを利用する可能性が最も高い顧客を予測します。問合せでは、dt_sh_clas_sampleというデシジョン・ツリー・モデルを適用して、顧客データをスコアリングします。このモデルはoml4sql-classification-decision-tree.sqlの例で作成します。

例33-1 アフィニティ・カードの最適な候補の予測

SELECT cust_id
  FROM mining_data_apply_v
  WHERE
      PREDICTION(dt_sh_clas_sample 
                   USING cust_marital_status, education, cust_income_level ) = 1
  AND country_name IN 'Brazil';

  

出力内容は次のようになります。


CUST_ID
----------
    100404
    100607
    101113

同じ問合せですが、不適切なネガティブより不適切なポジティブを優先するバイアスを使用したものを次に示します。

SELECT cust_id
  FROM mining_data_apply_v
  WHERE
      PREDICTION(dt_sh_clas_sample COST MODEL
                   USING cust_marital_status, education, cust_income_level ) = 1
  AND country_name IN 'Brazil';

出力内容は次のようになります。


CUST_ID
----------
    100139
    100163
    100275
    100404
    100607
    101113
    101170
    101463

COST MODELキーワードを使用すると、モデルに関連付けられたコスト・マトリックスが予測作成に使用されます。コスト・マトリックス(dt_sh_sample_costsという表に格納)は、不適切なネガティブは不適切なポジティブの8倍のコストがかかることを指定します。可能性の高い販促の候補の見落しは、可能性の低い候補を含めてしまう場合より、はるかにコストがかかります。

SELECT * FROM dt_sh_sample_cost;

出力内容は次のようになります。


ACTUAL_TARGET_VALUE PREDICTED_TARGET_VALUE       COST
------------------- ---------------------- ----------
                  0                      0          0
                  0                      1          1
                  1                      0          8
                  1                      1          0