33.2 例: 販売促進の候補の予測
この例では、クーポンとアフィニティ・カードを提供する特別な販売促進のためにブラジルの顧客をターゲットにするPREDICTION
問合せを示します。
問合せでは、未婚/既婚、学歴および所得に関するデータを使用し、インセンティブを利用する可能性が最も高い顧客を予測します。問合せでは、dt_sh_clas_sampleというデシジョン・ツリー・モデルを適用して、顧客データをスコアリングします。このモデルはoml4sql-classification-decision-tree.sql
の例で作成します。
例33-1 アフィニティ・カードの最適な候補の予測
SELECT cust_id FROM mining_data_apply_v WHERE PREDICTION(dt_sh_clas_sample USING cust_marital_status, education, cust_income_level ) = 1 AND country_name IN 'Brazil';
出力内容は次のようになります。
CUST_ID
----------
100404
100607
101113
同じ問合せですが、不適切なネガティブより不適切なポジティブを優先するバイアスを使用したものを次に示します。
SELECT cust_id FROM mining_data_apply_v WHERE PREDICTION(dt_sh_clas_sample COST MODEL USING cust_marital_status, education, cust_income_level ) = 1 AND country_name IN 'Brazil';
出力内容は次のようになります。
CUST_ID
----------
100139
100163
100275
100404
100607
101113
101170
101463
COST MODEL
キーワードを使用すると、モデルに関連付けられたコスト・マトリックスが予測作成に使用されます。コスト・マトリックス(dt_sh_sample_costs
という表に格納)は、不適切なネガティブは不適切なポジティブの8倍のコストがかかることを指定します。可能性の高い販促の候補の見落しは、可能性の低い候補を含めてしまう場合より、はるかにコストがかかります。
SELECT * FROM dt_sh_sample_cost;
出力内容は次のようになります。
ACTUAL_TARGET_VALUE PREDICTED_TARGET_VALUE COST
------------------- ---------------------- ----------
0 0 0
0 1 1
1 0 8
1 1 0