34.4 Oracle Machine Learning for SQLのスコアリング関数
OML4SQL関数のスコア・データを使用します。関数は、機械学習モデルのスキーマ・オブジェクトをデータに適用することも、分析句を使用して動的にデータをマイニングすることもできます。すべてのOML4SQLスコアリング・アルゴリズムにSQL関数が存在します。
表34-4 OML4SQLの関数
ファンクション | 説明 |
---|---|
予測対象のクラスタのIDを戻す。 |
|
予測対象のクラスタに関する詳細情報を戻す。 |
|
予測対象のクラスタの重心からの距離を戻す。 |
|
特定のクラスタに属するケースの確率を戻す。 |
|
特定のケースが属している可能性のあるすべてのクラスタのリストと、ケースが含まれている確率を戻す。 |
|
FEATURE_COMPARE |
2つの異なるドキュメントまたはキーワード・フレーズ、あるいはその両方の組合せからの類似または非類似のテキスト・セットを比較する |
最も高い係数値を持つ特徴のIDを戻す。 |
|
予測対象の特徴に関する詳細情報を戻す。 |
|
考え得るすべての特徴が含まれているオブジェクトのリストとその係数を戻す。 |
|
予測対象の特徴の値を戻す。 |
|
ORA_DM_PARTITION_NAME |
パーティション化されたモデルのパーティション名を戻す |
ターゲットの最適な予測を戻す。 |
|
不正確な予測のコストの測度を戻す。 |
|
予測に関する詳細情報を戻す。 |
|
予測の確率を戻す。 |
|
分類モデルの結果を戻す(各ケースについての予測および関連する確率を含む)。 |
|
様々なデータ型の単一のベクトル埋込みを生成します。 |
次の例では、CLUSTER_ID
関数の結果を戻す問合せを示しています。この問合せでは、特定の特性を共有する顧客のグループを検出するモデルem_sh_clus_sampleを適用します。この問合せでは、クラスタの識別子および各クラスタの顧客数が戻されます。em_sh_clus_sampleモデルは、oml4sql-clustering-expectation-maximization.sql
の例によって作成されます。
例34-9 CLUSTER_ID関数
-- -List the clusters into which the customers in this -- -data set have been grouped. -- SELECT CLUSTER_ID(em_sh_clus_sample USING *) AS clus, COUNT(*) AS cnt FROM mining_data_apply_v GROUP BY CLUSTER_ID(em_sh_clus_sample USING *) ORDER BY cnt DESC; -- List the clusters into which the customers in this -- data set have been grouped. -- SELECT CLUSTER_ID(em_sh_clus_sample USING *) AS clus, COUNT(*) AS cnt FROM mining_data_apply_v GROUP BY CLUSTER_ID(em_sh_clus_sample USING *) ORDER BY cnt DESC;
出力内容は次のようになります。
CLUS CNT
---------- ----------
9 311
3 294
7 215
12 201
17 123
16 114
14 86
19 64
15 56
18 36