33.4 Oracle Machine Learning for SQLのスコアリング関数
OML4SQLの様々なスコアリング関数について説明します。
次に示すOML4SQLの関数を使用して、データをスコアリングします。これらの関数は、機械学習モデルのスキーマ・オブジェクトをデータに適用することも、分析句の実行によって動的にデータをマイニングすることもできます。SQL関数は、スコアリング操作をサポートするすべてのOML4SQLアルゴリズムに使用できます。次の表に示すすべてのOML4SQL関数は、対応するOML4SQL関数を使用して、R機械学習モデルで動作します。ただし、関数は、ここにリストされているものに限られません。
表33-4 OML4SQLの関数
ファンクション | 説明 |
---|---|
予測対象のクラスタのIDを戻す。 |
|
予測対象のクラスタに関する詳細情報を戻す。 |
|
予測対象のクラスタの重心からの距離を戻す。 |
|
特定のクラスタに属するケースの確率を戻す。 |
|
特定のケースが属している可能性のあるすべてのクラスタのリストと、ケースが含まれている確率を戻す。 |
|
FEATURE_COMPARE |
2つの異なるドキュメントまたはキーワード・フレーズ、あるいはその両方の組合せからの類似または非類似のテキスト・セットを比較する |
最も高い係数値を持つ特徴のIDを戻す。 |
|
予測対象の特徴に関する詳細情報を戻す。 |
|
考え得るすべての特徴が含まれているオブジェクトのリストとその係数を戻す。 |
|
予測対象の特徴の値を戻す。 |
|
ORA_DM_PARTITION_NAME |
パーティション化されたモデルのパーティション名を戻す |
ターゲットの最適な予測を戻す。 |
|
不正確な予測のコストの測度を戻す。 |
|
予測に関する詳細情報を戻す。 |
|
予測の確率を戻す。 |
|
分類モデルの結果を戻す(各ケースについての予測および関連する確率を含む)。 |
次の例では、CLUSTER_ID
関数の結果を戻す問合せを示しています。この問合せでは、特定の特性を共有する顧客のグループを検出するモデルem_sh_clus_sampleを適用します。この問合せでは、クラスタの識別子および各クラスタの顧客数が戻されます。em_sh_clus_sampleモデルは、oml4sql-singular-value-decomposition.sql
の例で作成します。
例33-9 CLUSTER_ID関数
-- -List the clusters into which the customers in this -- -data set have been grouped. -- SELECT CLUSTER_ID(em_sh_clus_sample USING *) AS clus, COUNT(*) AS cnt FROM mining_data_apply_v GROUP BY CLUSTER_ID(em_sh_clus_sample USING *) ORDER BY cnt DESC; SQL> -- List the clusters into which the customers in this SQL> -- data set have been grouped. SQL> -- SQL> SELECT CLUSTER_ID(em_sh_clus_sample USING *) AS clus, COUNT(*) AS cnt 2 FROM mining_data_apply_v 3 GROUP BY CLUSTER_ID(em_sh_clus_sample USING *) 4 ORDER BY cnt DESC; CLUS CNT ---------- ---------- 9 311 3 294 7 215 12 201 17 123 16 114 14 86 19 64 15 56 18 36
関連トピック