5.4 モデルの詳細ビュー
GET_*
インタフェースはモデル・ビューに置き換えられるため、かわりにこのビューを利用することをお薦めします。
次に、新しいモデル・ビューを示します。
相関:
分類、回帰、異常検出:
クラスタリング:
特徴抽出:
特徴選択:
データの準備およびその他:
5.4.1 相関ルールのモデル・ディテール・ビュー
相関ルールのモデル・ディテール・ビューは、相関ルールのルール・ビューを説明しています。GET_ASSOCIATION_RULES
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
ルール・ビューDM$VR
model_nameは、相関ルールに対して生成されたルールを説明しています。モデルの設定によって、ルールの列セットは異なります。次のビューは、トランザクショナルおよび2次元の入力に対する集計なしで異なるグローバル設定が適用されたときに表示されます。
ASSO_AGGREGATES設定のないトランザクショナル入力
ODMS_ITEM_ID_COLUMN_NAME
が設定され、ITEM_VALUE
(ODMS_ITEM_VALUE_COLUMN_NAME
)が設定されていない場合、トランザクショナル・ビューは次のようになります。Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
ANTECEDENT SYS.XMLTYPE
表5-11 トランザクショナル入力のルール・ビュー列
列名 | 説明 |
---|---|
|
詳細を取得するパーティション化されたモデルのパーティション |
|
ターゲットの名前または識別子 |
|
ルールを満たすトランザクションの数。 |
|
トランザクションがルールを満たす確度。 |
|
ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度。 |
|
ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの。 |
|
トランザクションの合計数に対する、前件を満たすトランザクションの数の割合。 |
|
ルールの前件と後件で参照される属性の合計数。 |
|
トランザクションの合計数に対する、後件を満たすトランザクションの数の割合。 |
|
後件の名前 |
|
2次元の入力の場合、 2次元入力では、 ビューでは、後件用に3列が使用されます。ルール・ビューには次の列があります。
注意: 3つの部分のすべての型はVARCHAR2 です。ASSO_AGGREGATES が設定されている場合、この列は適用されません。
|
|
次のビューでは、
次のビューでは、
|
|
ルール内の独立の条件。この条件が存在する場合は、後件に依存条件も存在します。条件は、述語(
注意: DM_PREDICATE 属性があることは、トランザクションに項目が存在することを示しています。attribute_num_value またはattribute_str_value の実際の値に意味はありません。たとえば、次の述語は、属性値がNULLでもトランザクションにMouse Padが存在していることを示しています。
|
ASSO_AGGREGATES設定があるトランザクショナル入力
-
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が設定されていない場合のルール・ビュー。 -
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が量的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。 -
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が質的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。
ASSO_AGGREGATES
を含むビューには、集計出力の列(集計当たり4列)があります。2次元入力では、集計設定は許可されません。
例5-13 例
次の例は、集計対象として設定されている利益と売上を示しています。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
ANTECEDENT SYS.XMLTYPE
ANT_RULE_PROFIT BINARY_DOUBLE
CON_RULE_PROFIT BINARY_DOUBLE
ANT_PROFIT BINARY_DOUBLE
CON_PROFIT BINARY_DOUBLE
ANT_RULE_SALES BINARY_DOUBLE
CON_RULE_SALES BINARY_DOUBLE
ANT_SALES BINARY_DOUBLE
CON_SALES BINARY_DOUBLE
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が量的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。Name Null? Type
----------------------------------------- -------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
CONSEQUENT_VALUE NUMBER
ANTECEDENT SYS.XMLTYPE
ANT_RULE_PROFIT BINARY_DOUBLE
CON_RULE_PROFIT BINARY_DOUBLE
ANT_PROFIT BINARY_DOUBLE
CON_PROFIT BINARY_DOUBLE
ANT_RULE_SALES BINARY_DOUBLE
CON_RULE_SALES BINARY_DOUBLE
ANT_SALES BINARY_DOUBLE
CON_SALES BINARY_DOUBLE
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が質的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。
Name Null? Type
----------------------------------------- -------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
CONSEQUENT_VALUE VARCHAR2(4000)
ANTECEDENT SYS.XMLTYPE
ANT_RULE_PROFIT BINARY_DOUBLE
CON_RULE_PROFIT BINARY_DOUBLE
ANT_PROFIT BINARY_DOUBLE
CON_PROFIT BINARY_DOUBLE
ANT_RULE_SALES BINARY_DOUBLE
CON_RULE_SALES BINARY_DOUBLE
ANT_SALES BINARY_DOUBLE
CON_SALES BINARY_DOUBLE
相関ルールのグローバルな詳細
単一のグローバルな詳細は、相関モデルによって生成されます。次の表は、相関ルール・モデルに対して戻されるグローバルな詳細について説明しています。
表5-12 相関ルールのグローバルな詳細
名前 | 説明 |
---|---|
|
生成された項目セットの数 |
|
最大サポート |
|
ビルドで使用される合計行数 |
|
生成されるモデル内の相関ルールの数 |
|
入力データのトランザクションの数 |
5.4.2 高頻度項目セットのモデル・ディテール・ビュー
高頻度項目セットのモデル・ディテール・ビューは、高頻度項目セット・ビューを説明しています。GET_FREQUENT_ITEMSETS
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
高頻度項目セット・ビューDM$VI
model_nameには、次のスキーマがあります。
Name Type
------------- ------------------
PARTITION_NAME VARCHAR2 (128)
ITEMSET_ID NUMBER
SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
ITEMSET SYS.XMLTYPE
表5-13 高頻度項目ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
項目セット識別子 |
|
項目セットのサポート |
|
項目セット内の項目の数 |
|
高頻度項目セット
|
5.4.3 トランザクショナル項目セットのモデル・ディテール・ビュー
トランザクショナル項目セットのモデル・ディテール・ビューは、トランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。
集計のないトランザクショナル・データのよくあるケースとして、DM$VT
model_nameビューは、トランザクショナル形式の項目セット情報を提供します。このビューは、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上に役立ちます。トランザクショナル項目セット・ビューには次のスキーマがあります。
Name Type
----------------- -----------------
PARTITION_NAME VARCHAR2(128)
ITEMSET_ID NUMBER
ITEM_ID NUMBER
SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
ITEM_NAME VARCHAR2(4000)
表5-14 トランザクショナル項目セット・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
項目セット識別子 |
|
項目識別子 |
|
項目セットのサポート |
|
項目セット内の項目の数 |
|
アイテムの名前 |
5.4.4 トランザクショナル・ルールのモデル・ディテール・ビュー
トランザクショナル・ルールのモデル・ディテール・ビューは、トランザクショナル・ルール・ビューおよびトランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。
集計のないトランザクショナル・データには、トランザクショナル・ルール・ビューDM$VA
model_nameもあります。このビューにより、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上を図れます。トランザクショナル・ルール・ビューには次のスキーマがあります。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
ANTECEDENT_PREDICATE VARCHAR2(4000)
CONSEQUENT_PREDICATE VARCHAR2(4000)
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
RULE_ITEMSET_ID NUMBER
ANTECEDENT_SUPPORT NUMBER
CONSEQUENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
表5-15 トランザクショナル・ルール・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
ルール識別子 |
|
前件項目の名前。 |
|
後件項目の名前 |
|
ルールのサポート |
|
前件が含まれる場合にトランザクションがルールを満たす確度。 |
|
ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度 |
|
ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの |
|
項目セット識別子 |
|
トランザクションの合計数に対する、前件を満たすトランザクションの数の割合 |
|
トランザクションの合計数に対する、後件を満たすトランザクションの数の割合 |
|
ルール内の項目の数 |
5.4.5 分類アルゴリズムのモデル・ディテール・ビュー
分類アルゴリズムのモデル・ディテール・ビューは、すべての分類アルゴリズムに適用されるターゲット・マップ・ビューおよびスコアリング・コスト・ビューを説明しています。GET_*
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
ターゲット・マップ・ビューDM$VT
model_nameは、分類モデルに対するターゲット分布を説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
TARGET_COUNT NUMBER
TARGET_WEIGHT NUMBER
表5-16 ターゲット・マップ・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ターゲット値(量的または質的) |
|
特定の |
|
特定の |
スコアリング・コスト・ビューDM$VC
model_nameは、分類モデルに対するスコアリング・コスト・マトリックスを説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- --------------------------------
PARTITION_NAME VARCHAR2(128)
ACTUAL_TARGET_VALUE NUMBER/VARCHAR2
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
COST NUMBER
表5-17 スコアリング・コスト・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
有効なターゲット値 |
|
予測対象ターゲット値 |
|
実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト |
5.4.6 ディシジョン・ツリーのモデル・ディテール・ビュー
ディシジョン・ツリーのモデル・ディテール・ビューは、分岐情報ビュー、ノード統計ビュー、ノード説明ビューおよびコスト・マトリックス・ビューを説明しています。GET_MODEL_DETAILS_XML
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
分岐情報ビューDM$VP
model_nameは、ディシジョン・ツリー内の各レベルのツリー階層および分岐情報を説明しています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ---------------------------
PARTITION_NAME VARCHAR2(128)
PARENT NUMBER
SPLIT_TYPE VARCHAR2
NODE NUMBER
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2
VALUE SYS.XMLTYPE
表5-18 分岐情報ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
親のノードID |
|
メイン分岐またはサロゲート分岐 |
|
ノードID |
|
このノードを生成するために、親ノードで分岐基準として使用される属性。 |
|
分岐属性のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
分岐演算子 |
|
分岐基準として使用される値。これは、 たとえば、 |
ノード統計ビューDM$VI
model_nameは、個々のツリー・ノードに関連付けられている統計を説明しています。統計には、ノード内のデータのターゲット・ヒストグラムが含まれます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
NODE NUMBER
NODE_SUPPORT NUMBER
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
TARGET_VALUE NUMBER/VARCHAR2
TARGET_SUPPORT NUMBER
表5-19 ノード統計ビュー
パラメータ | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ノードID |
|
ノードに属するトレーニング・セット内のレコード数 |
|
予測対象ターゲット値 |
|
トレーニング・データ内に表示されるターゲット値 |
|
ノードに属し、 |
より高いレベルのノードの説明が、DM$VO
model_nameビューに表示されます。DM$VO
model_nameには、次のスキーマがあります。
ame Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
NODE NUMBER
NODE_SUPPORT NUMBER
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
PARENT NUMBER
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2
VALUE SYS.XMLTYPE
表5-20 ノードの説明ビュー
パラメータ | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ノードID |
|
ノードに属するトレーニング・セット内のレコード数 |
|
予測対象ターゲット値 |
|
親のID |
|
属性名を指定します |
|
属性サブ名を指定します |
|
属性述語演算子 - 次の値を使用する条件演算子。 IN、= 、<>、< 、>、<=、>= |
|
説明の基準として使用される値。これは、 たとえば、 |
DM$VM
model_nameビューは、ディシジョン・ツリーの作成によって使用されるコスト・マトリックスを説明しています。DM$VM
model_nameビューには、次のスキーマがあります。
Name Type
----------------------------------------- --------------------------------
PARTITION_NAME VARCHAR2(128)
ACTUAL_TARGET_VALUE NUMBER/VARCHAR2
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
COST NUMBER
表5-21 コスト・マトリックス・ビュー
パラメータ | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
有効なターゲット値 |
|
予測対象ターゲット値 |
|
実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト |
表5-22 モデル・グローバル・ビューのディシジョン・ツリー統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
5.4.7 一般化線形モデルのモデル・ディテール・ビュー
一般化線形モデル(GLM)のモデル・ディテール・ビューは、線形およびロジスティック回帰のモデル・ディテール・ビューおよび行診断ビューを説明します。GET_MODEL_DETAILS_GLM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
モデル・ディテール・ビューDM$VD
model_nameは、線形回帰モデルとロジスティック回帰モデルの両方の最終モデル情報を説明しています。
線形回帰の場合、DM$VD
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
FEATURE_EXPRESSION VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
STD_ERROR BINARY_DOUBLE
TEST_STATISTIC BINARY_DOUBLE
P_VALUE BINARY_DOUBLE
VIF BINARY_DOUBLE
STD_COEFFICIENT BINARY_DOUBLE
LOWER_COEFF_LIMIT BINARY_DOUBLE
UPPER_COEFF_LIMIT BINARY_DOUBLE
ロジスティック回帰の場合、DM$VD
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
FEATURE_EXPRESSION VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
STD_ERROR BINARY_DOUBLE
TEST_STATISTIC BINARY_DOUBLE
P_VALUE BINARY_DOUBLE
STD_COEFFICIENT BINARY_DOUBLE
LOWER_COEFF_LIMIT BINARY_DOUBLE
UPPER_COEFF_LIMIT BINARY_DOUBLE
EXP_COEFFICIENT BINARY_DOUBLE
EXP_LOWER_COEFF_LIMIT BINARY_DOUBLE
EXP_UPPER_COEFF_LIMIT BINARY_DOUBLE
表5-23 線形およびロジスティック回帰モデルのモデル・ビュー
列名 | 説明 |
---|---|
|
モデル内の特徴の名前 |
|
有効なターゲット値 |
|
サブ名がない場合は属性名、サブ名がある場合は属性名の最初の部分。 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 ネストした列が数値の場合、マイニング属性は、 |
|
質的列またはネストした質的列とみなすことができる一意の値。質的列では、マイニング属性は、一意の |
|
特徴選択が有効な場合、アルゴリズムによって作成される特徴名です。特徴選択が有効でない場合、この特徴名は、単に完全修飾された属性名になります(属性がネストした列内にあるときはattribute_name.attribute_subnameになる)。質的属性では、次のような形式の特徴名が作成されます。 fully-qualified_attribute_name.attribute_value 特徴生成が有効な場合、モデル内の用語は、単一のマイニング属性または最大3つのマイニング属性の積となります。コンポーネント・マイニング属性は、単一の用語内で繰り返すことができます。特徴生成が有効ではない場合、または特徴生成が有効であるが、複数のコンポーネントの用語が 注意: Oracle Database 12cリリース2では、アルゴリズムによって、量的コンポーネントから平均が減算されません。 |
|
推定係数。 |
|
係数推定値の標準誤差。 |
|
線形回帰の場合、係数推定値のt値。 ロジスティック回帰の場合、係数推定値のWaldカイ二乗値。 |
|
モデル内の用語が統計的に重要ではない(NULL)仮定の下の |
|
分散拡大要因。切片の場合、この値はゼロです。ロジスティック回帰の場合、 |
|
係数の標準化推定値。 |
|
係数の信頼限界値の下限。 |
|
係数の信頼限界値の上限。 |
|
ロジスティック回帰の場合は指数係数線形 回帰の場合、 |
|
ロジスティック回帰の場合、係数の信頼限界値の下限に対する指数係数。線形回帰の場合、 |
|
ロジスティック回帰の場合、係数の信頼限界値の上限に対する指数係数。線形回帰の場合、 |
行診断ビューDM$VA
model_nameは、線形回帰モデルとロジスティック回帰モデルの両方の行レベル情報を説明しています。線形回帰の場合、DM$VA
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CASE_ID NUMBER/VARHCAR2
TARGET_VALUE BINARY_DOUBLE
PREDICTED_TARGET_VALUE BINARY_DOUBLE
Hat BINARY_DOUBLE
RESIDUAL BINARY_DOUBLE
STD_ERR_RESIDUAL BINARY_DOUBLE
STUDENTIZED_RESIDUAL BINARY_DOUBLE
PRED_RES BINARY_DOUBLE
COOKS_D BINARY_DOUBLE
表5-24 線形回帰の行診断ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ケースIDの名前 |
|
入力行から取得される実際のターゲット値 |
|
行のモデル予測ターゲット値 |
|
ハット・マトリックスによって特定の入力行で識別されるn*n (n=行数)の対角線上の要素。入力データのモデル予測は、ハット・マトリックスと入力ターゲット値のベクターの積です。対角線上の要素(ハット値)は、i番目の適合した値上のi番目の行の影響を表します。大きいハット値は、i番目の行が影響力の大きいポイントであり、潜在的な外れ値であることを示すインジケータです。 |
|
特定の入力行の予測と実際のターゲット値間の差異。 |
|
標準残余誤差(ステューデント化残差とも呼ばれる)は、入力行の残差を比較可能にするために、残差を再スケーリングしてすべての入力行にわたる定数分散を得ます。このプロセスは、残差を行の重さの平方根で乗算し、平均平方誤差の積およびハット値から1減算した値で除算します。 |
|
スチューデント化削除残差は、現在の行の影響のために、標準残余誤差を調整します。 |
|
予測残差は、削除残差の重み付きの2乗であり、行の重みを残差の2乗で乗算し、ハット値から1を減算した値で除算して算出されます。 |
|
クックの距離は、すべての推定回帰係数上のi番目のケースの複合的影響のメジャーです。 |
ロジスティック回帰の場合、DM$VA
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CASE_ID NUMBER/VARHCAR2
TARGET_VALUE NUMBER/VARCHAR2
TARGET_VALUE_PROB BINARY_DOUBLE
Hat BINARY_DOUBLE
WORKING_RESIDUAL BINARY_DOUBLE
PEARSON_RESIDUAL BINARY_DOUBLE
DEVIANCE_RESIDUAL BINARY_DOUBLE
C BINARY_DOUBLE
CBAR BINARY_DOUBLE
DIFDEV BINARY_DOUBLE
DIFCHISQ BINARY_DOUBLE
表5-25 ロジスティック回帰の行診断ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ケースIDの名前 |
|
入力行から取得される実際のターゲット値 |
|
予測ターゲット値の確率のモデル推定値。 |
|
線形回帰のハット値の概念は、線形回帰ハッチ値をロジスティック回帰の分散関数で乗算することでロジスティック回帰に拡張され、予測確率は、予測確率から1を減算した値で乗算されます。 |
|
作業残差は、作業応答の残差です。作業応答は、線形化スケール上の応答です。ロジスティック回帰の場合、i番目の行の残差がi番目の行の予測の分散で除算される形式となります。予測の分散は、予測確率を予測確率から1を減算した値で乗算し算出されます。
|
|
ピアソン残差は、重みを考慮した、作業残差の再スケーリングされたバージョンです。ロジスティック回帰の場合、ピアソン残差は、残差を、重み平方根として計算される係数で乗算し、i番目の行の予測確率の分散で除算し算出されます。
|
|
|
|
削除されたもの(i番目のポイント)を含む、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、ハット値から1減算した値の2乗で除算して算出されます。 個々の観察による影響のスカラー測定を提供する、信頼区間の置換診断。 |
|
C およびCBAR は、ロジスティック回帰のクックの距離の拡張です。CBAR は、削除されたもの(i番目のポイント)を除く、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、(ハット値から1減算した値)で除算して算出されます。
個々の観察の削除による影響を測定する、信頼区間の置換診断。 |
|
観測値が入力から削除されたときに発生する逸脱度の変化を測定する統計。逸脱度残差の2乗に |
|
観測値が入力から削除されたときに発生するピアソンのカイ二乗の変化を測定する統計。 |
GLMのグローバルな詳細: 線形回帰
次の表は、線形回帰モデルによって戻されるグローバルな詳細について説明しています。
表5-26 線形回帰のグローバルな詳細
名前 | 説明 |
---|---|
|
調整済R2乗 |
|
赤池情報量規準 |
|
変動の係数 |
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
修正された総自由度。 |
|
修正された総平方和。 |
|
依存平均 |
|
誤差の自由度。 |
|
誤差平均平方 |
|
誤差の平方和。 |
|
モデルのF値の統計。 |
|
予測の推定平均平方誤差。多変量正規性を想定しています。 |
|
HockingのSp統計 |
|
SGD反復数を追跡します。ソルバーがSGDの場合にのみ適用できます。 |
|
JP統計(最終予測誤差)。 |
|
モデルの自由度。 |
|
モデルのF値の確率。 |
|
モデルの平均平方誤差 |
|
モデルの平方和誤差 |
|
パラメータ数(切片を含む係数の数)。 |
|
行の数 |
|
R2乗 |
|
多重共線性のためにモデルから除外された予測子の数 |
|
2乗平均平方根誤差。 |
|
Schwarzのベイズ情報量基準。 |
GLMのグローバルな詳細: ロジスティック回帰
次の表は、ロジスティック回帰モデルによって戻されるグローバルな詳細を示しています。
表5-27 ロジスティック回帰のグローバルな詳細
名前 | 説明 |
---|---|
|
切片のみのベースライン・モデルの適合度に関する赤池の基準 |
|
切片および共変量(予測子)モデルの適合度に関する赤池の基準。 |
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
依存平均 |
|
SGD反復数(IRLS反復数)を追跡します。ソルバーがSGDの場合にのみ適用できます。 |
|
尤度比の自由度。 |
|
尤度比のカイ二乗値。 |
|
尤度比のカイ二乗確率値。 |
|
切片のみのベースライン・モデルの-2対数尤度 |
|
モデルの-2対数尤度。 |
|
パラメータ数(切片を含む係数の数)。 |
|
行の数 |
|
正確な予測の割合。 |
|
不正確に予測された行の割合。 |
|
両方のターゲット・クラスの推定確率が等しくなる割合 |
|
擬似R二乗(CoxおよびSnell) |
|
擬似R2乗(Nagelkerke) |
|
多重共線性のためにモデルから除外された予測子の数 |
|
切片のみのベースライン・モデルの適合度に関するシュワルツの基準 |
|
切片および共変量(予測子)モデルの適合度に関するSchwarzの基準。 |
注意:
-
「リッジ回帰」が有効な場合、戻されるグローバルな詳細がより少なくなります。リッジの詳細は、『Oracle Data Mining概要』を参照してください。
-
パーティション化されたモデルで値が
NULL
の場合、例外がスローされます。値がNULLでない場合、目的のパーティション名が含まれる必要があります。
関連トピック
5.4.8 Naive Bayesのモデル・ディテール・ビュー
Naive Bayesのモデル・ディテール・ビューは、事前のビューおよび結果ビューを説明しています。GET_MODEL_DETAILS_NB
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
事前ビューDM$VP
model_nameは、Naïve Bayesに対するターゲットの事前の状態を説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
PRIOR_PROBABILITY BINARY_DOUBLE
COUNT NUMBER
表5-28 Naive Bayesの事前ビュー
列名 | 説明 |
---|---|
|
モデル内の特徴の名前 |
|
ターゲット列の名前 |
|
ターゲット値(量的または質的) |
|
特定の |
|
特定の |
Naïve Bayes結果ビューDM$VV
model_viewは、Naïve Bayesモデルの条件付き確率を説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
CONDITIONAL_PROBABILITY BINARY_DOUBLE
COUNT NUMBER
表5-29 Naive Bayesの結果ビュー
列名 | 説明 |
---|---|
|
モデル内の特徴の名前 |
|
ターゲット列の名前 |
|
ターゲット値(量的または質的) |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
列 |
|
特定のターゲットのマイニング属性の条件付き確率 |
|
特定のマイニング属性および特定のターゲットの行数 |
表5-30 モデル・グローバル・ビューのNaive Bayes統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
5.4.9 サポート・ベクター・マシンのモデル・ディテール・ビュー
サポート・ベクター・マシンのモデル・ディテール・ビューは、線形係数ビューを説明しています。GET_MODEL_DETAILS_SVM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
線形係数ビューDM$VL
model_nameは、線形SVMアルゴリズムの係数を説明しています。ビューのtarget_valueフィールドは分類にのみ存在し、ターゲットの型を持ちます。回帰モデルにはtarget_valueフィールドがありません。
reversed_coefficientフィールドは、自動データ準備変換を元に戻した後の係数の値が表示されます。データ準備が無効な場合、coefficientとreversed_coefficientの値は同じになります。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- --------------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
REVERSED_COEFFICIENT BINARY_DOUBLE
表5-31 サポート・ベクター・マシンの線形係数ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ターゲット値(量的または質的) |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性の値 |
|
予測係数値 |
|
元のスケールで変換された係数 |
表5-32モデル・グローバル・ビューのサポート・ベクター統計情報
名前 | 説明 |
---|---|
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。
|
|
作成中の反復回数 |
|
作成で使用される行の数 |
|
標準が0のために削除された行の数。このことは、1つのクラスの線形モデルにのみ適用されます。 |
5.4.10 クラスタリング・アルゴリズムのモデル・ディテール・ビュー
Oracle Data Miningは、期待値最大化、k-Meansおよび直交パーティショニング・クラスタリング(O-Cluster)などのクラスタリング・アルゴリズムをサポートしています。
すべてのクラスタリング・アルゴリズムで、次のビューが共有されます。
-
クラスタ説明
DM$VD
model_name -
属性統計
DM$VA
model_name -
ヒストグラム統計
DM$VH
model_name -
ルール統計
DM$VR
model_name
クラスタ説明ビューDM$VD
model_nameは、クラスタリング・モデルのクラスタ・レベル情報を説明しています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
RECORD_COUNT NUMBER
PARENT NUMBER
TREE_LEVEL NUMBER
LEFT_CHILD_ID NUMBER
RIGHT_CHILD_ID NUMBER
表5-33 クラスタリング・アルゴリズムのクラスタ説明ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
レコードの数を指定します。 |
|
親のID |
|
ルートからの分岐の数を指定します。 |
|
分岐の左側の子クラスタのID |
|
分岐の右側の子クラスタのID |
属性ビューDM$VA
model_nameは、クラスタリング・モデルの属性レベル情報を説明しています。特定のクラスタの平均、分散およびモードの値は、このビューから取得できます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
MEAN BINARY_DOUBLE
VARIANCE BINARY_DOUBLE
MODE_VALUE VARCHAR2(4000)
表5-34 クラスタリング・アルゴリズムの属性ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
属性名を指定します |
|
属性サブ名を指定します |
|
このフィールドにより、数値属性の平均値が戻されます |
|
数値属性の分散 |
|
モードとは、質的属性の最頻値です。 |
ヒストグラム・ビューDM$VH
model_nameは、クラスタリング・モデルのヒストグラム・レベル情報を説明しています。ビン情報およびビン数は、このビューから取得できます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
BIN_ID NUMBER
LOWER_BIN_BOUNDARY BINARY_DOUBLE
UPPER_BIN_BOUNDARY BINARY_DOUBLE
ATTRIBUTE_VALUE VARCHAR2(4000)
COUNT NUMBER
表5-35 クラスタリング・アルゴリズムのヒストグラム・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
属性名を指定します |
|
属性サブ名を指定します |
|
ビンID |
|
量的ビンの下限 |
|
量的ビンの上限 |
|
質的属性値 |
|
ヒストグラム数 |
ルール・ビューDM$VR
model_nameは、クラスタリング・モデルのルール・レベル情報を説明しています。情報は、属性の述語レベルで提供されます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2(2)
NUMERIC_VALUE NUMBER
ATTRIBUTE_VALUE VARCHAR2(4000)
SUPPORT NUMBER
CONFIDENCE BINARY_DOUBLE
RULE_SUPPORT NUMBER
RULE_CONFIDENCE BINARY_DOUBLE
表5-36 クラスタリング・アルゴリズムのルール・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
属性名を指定します |
|
属性サブ名を指定します |
|
属性述語演算子 - 次の値を使用する条件付き演算子: IN、=、<>、<、>、<=および>= |
|
量的ビンの下限 |
|
質的属性値 |
|
属性述語のサポート |
|
属性述語の信頼度 |
|
ルール・レベルのサポート |
|
ルール・レベルの信頼度 |
5.4.11 期待値最大化のモデル・ディテール・ビュー
期待値最大化(EM)のモデル・ディテール・ビューは、クラスタリング・ビューのそれに対するEMのビューにおける差異を説明しています。GET_MODEL_DETAILS_EM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
次のビューは、クラスタリング・ビューに対する期待値最大化のビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。
コンポーネント・ビューDM$VO
model_nameは、EMコンポーネントを説明しています。コンポーネント・ビューには、事前確率およびマップ先のクラスタに関する情報が含まれています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
COMPONENT_ID NUMBER
CLUSTER_ID NUMBER
PRIOR_PROBABILITY BINARY_DOUBLE
表5-37 コンポーネント・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
コンポーネントの一意の識別子 |
|
モデル内のクラスタのID |
|
コンポーネント事前確率 |
平均および分散コンポーネント・ビューDM$VM
model_nameは、ガウス分布モデル別の属性の平均および分散パラメータに関する情報を提供します。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
COMPONENT_ID NUMBER
ATTRIBUTE_NAME VARCHAR2(4000)
MEAN BINARY_DOUBLE
VARIANCE BINARY_DOUBLE
頻度コンポーネント・ビューDM$VF
model_nameは、EMモデルによって使用される複数値ベルヌーイ分布のパラメータに関する情報を提供します。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
COMPONENT_ID NUMBER
ATTRIBUTE_NAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
FREQUENCY BINARY_DOUBLE
表5-38 頻度コンポーネント・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
コンポーネントの一意の識別子 |
|
列名 |
|
質的属性値 |
|
|
2次元列の場合、EMは属性評価の属性ランク付けと類似したものを提供します。このランク付けは、列のペアに対して計算されたカルバック・ライブラー・ダイバージェンスにわたる、ランクで重み付けされた平均に基づきます。この監視なし属性評価は、DM$VI
model_nameビューに表示され、次のスキーマを含みます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_IMPORTANCE_VALUE BINARY_DOUBLE
ATTRIBUTE_RANK NUMBER
表5-39 期待値最大化の2次元属性ランク付け
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
列名 |
|
評価の値 |
|
評価の値に基づく属性ランク |
pairwise
カルバック・ライブラー・ダイバージェンスは、DM$VB
model_nameビューにレポートされます。このメトリックは、観察対象の2つの属性の結合分布が、独立性の仮定の下に、予想される分布とどの程度異なっているかを評価します。つまり、値が大きいほど、2つの属性がより依存していることになります。独立性の値は、各ペアワイズ計算に使用されるグリッドのサイズに基づいてスケーリングされます。このため、[0; 1]範囲内の全ての値が比較可能になります。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME_1 VARCHAR2(128)
ATTRIBUTE_NAME_2 VARCHAR2(128)
DEPENDENCY BINARY_DOUBLE
表5-40 期待値最大化のカルバック・ライブラー・ダイバージェンス
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
属性1の名前 |
|
属性2の名前 |
|
スケーリングされたペアワイズ・カルバック・ライブラー・ダイバージェンス |
予測表DM$VP
model_nameは、ネストした列をより下の次元空間にマップするために、ランダム予測によって使用される係数を示します。このビューには、作成データ内にネストしたデータまたはテキスト・データが存在する場合のみ行が含まれます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_NAME VARCHAR2(4000)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT NUMBER
表5-41 期待値の最大化の予測表
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値 |
|
予測係数。データ表現はまばらなため、ゼロ以外の係数のみが戻されます。 |
期待値の最大化のグローバルな詳細
次の表は、期待値の最大化のグローバルな詳細について説明しています。
表5-42 期待値の最大化のグローバルな詳細
名前 | 説明 |
---|---|
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。可能な値は次のとおりです:
|
|
作成データの対数尤度 |
|
モデルで生成されるコンポーネントの数 |
|
モデルで生成されるクラスタの数 |
|
作成で使用される行の数 |
|
モデル作成で使用される乱数シード値 |
|
モデルから除外する空のコンポーネントの数 |
関連トピック
5.4.12 k-Meansのモデル・ディテール・ビュー
k-Means (KM)のモデル・ディテール・ビューは、クラスタの説明ビューおよびスコアリング・ビューを説明しています。GET_MODEL_DETAILS_KM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
この項では、クラスタリング・ビューに対するk-Meansのビュー内の相違点を説明しています。様々なビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。k-Meansの場合、クラスタの説明ビューDM$VD
model_nameには、追加の列があります。
Name Type
---------------------------------- ----------------------------
DISPERSION BINARY_DOUBLE
表5-43 k-Meansのクラスタの説明
列名 | 説明 |
---|---|
|
標準の統計モデルと比較して、一連の確認された出現が分散しているかどうかを定量化するために使用されるメジャー。 |
スコアリング・ビューDM$VC
model_nameは、各リーフ・クラスタの重心を説明しています。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
VALUE BINARY_DOUBLE
表5-44 k-Meansのスコアリング・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値 |
|
重心の値を指定します |
表5-45 モデル・グローバル・ビューのk–Means統計情報
名前 | 説明 |
---|---|
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
作成で使用される行の数 |
|
標準が0のために削除された行の数。このことは、コサイン距離を使用するモデルにのみ適用されます。 |
関連トピック
5.4.13 O-Clusterのモデル・ディテール・ビュー
O-Clusterのモデル・ディテール・ビューは、統計ビューを説明しています。GET_MODEL_DETAILS_OC
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
次は、クラスタリング・ビューに対するO-Clusterのビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。OCアルゴリズムでは、期待値最大化(EM)およびk-Means (KM)と同じ記述統計ビューが使用されます。次に統計ビューを示します。
-
クラスタ説明
DM$VD
model_name -
属性統計
DM$VA
model_name -
ルール統計
DM$VR
model_name -
ヒストグラム統計
DM$VH
model_name
クラスタ説明ビューDM$VD
model_nameは、O-Clusterコンポーネントを説明しています。クラスタ説明ビューには、分岐述語を示す追加フィールドがあります。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2(2)
VALUE SYS.XMLTYPE
表5-46 説明ビュー
列名 | 説明 |
---|---|
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
分岐演算子 |
|
分岐値のリスト |
SYS.XMLTYPE
の構造は、次のとおりです。<Element>splitval1</Element>
OCアルゴリズムでは、ヒストグラム・ビューDM$VH
model_nameが、EMおよびk-Means (KM)とは異なるスキーマとともに使用されます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITON_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
BIN_ID NUMBER
LABEL VARCHAR2(4000)
COUNT NUMBER
表5-47 ヒストグラム・コンポーネント・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
コンポーネントの一意の識別子 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
一意の識別子 |
|
ビン・ラベル |
|
ビン・ヒストグラム数 |
表5-48 モデル・グローバル・ビューのO-Cluster統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
関連トピック
5.4.14 明示的セマンティック分析のモデル・ディテール・ビュー
明示的セマンティック分析(ESA)のモデル・ディテール・ビューは、属性統計ビューおよび特徴ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。
ESAアルゴリズムには、次の記述統計ビューがあります。
-
属性統計
DM$VA
model_name -
特徴
DM$VF
model_name
ビューDM$VA
model_nameには、次のスキーマがあります。
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
表5-49 明示的セマンティック分析の属性ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
トレーニング・データに表示される特徴の一意の識別子 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値 |
|
特徴に関する属性の重みのメジャー |
ビューDM$VF
model_nameには、1つのビュー内のすべての特徴に対して一意の行があります。この特徴は、モデルが事前作成されていて、ソース・トレーニング・データが使用不可の場合に役立ちます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER/VARCHAR2
表5-50 明示的セマンティック分析の特徴ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
トレーニング・データに表示される特徴の一意の識別子 |
表5-51 モデル・グローバル・ビューの明示的セマンティック分析統計情報
名前 | 説明 |
---|---|
|
入力行の合計数 |
|
フィルタによって削除された行の数 |
5.4.15 Non-Negative Matrix Factorizationのモデル・ディテール・ビュー
Non-Negative Matrix Factorization (NMF)のモデル・ディテール・ビューは、エンコーディングHマトリックス・ビューおよびH逆マトリックス・ビューを説明しています。GET_MODEL_DETAILS_NMF
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
NMFアルゴリズムには、2つのマトリックス・コンテンツ・ビューがあります。
-
エンコーディング(H)マトリックス
DM$VE
model_name -
H逆マトリックス
DM$VI
model_name
ビューDM$VE
model_nameは、NMFモデルのエンコーディング(H)マトリックスを説明しています。FEATURE_NAME
列の型は、NUMBER
またはVARCHAR2
のいずれかです。このビューには次のスキーマ定義が含まれます。
Name Type
------------------- --------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
表5-52 Non-Negative Matrix FactorizationのエンコーディングHマトリックス・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
属性の値を指定します |
|
特徴への寄与率を表す属性エンコーディング |
ビューDM$VI
model_viewは、NMFモデルの逆Hマトリックスを説明しています。FEATURE_NAME
列の型は、NUMBER
またはVARCHAR2
のいずれかです。このビューには次のスキーマが含まれます。
Name Type
----------------- ------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
表5-53 Non-Negative Matrix Factorizationの逆Hマトリックス・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
属性の値を指定します |
|
特徴への寄与率を表す属性エンコーディング |
表5-54 モデル・グローバル・ビューのNon-Negative Matrix Factorization統計情報
名前 | 説明 |
---|---|
|
収束エラー |
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
作成中の反復回数 |
|
ビルド入力データセットで使用される行の数 |
|
ビルドで使用される行の数 |
5.4.16 特異値分解のモデル・ディテール・ビュー
特異値分解(SVD)のモデル・ディテール・ビューは、Sマトリックス・ビュー、右特異ベクター・ビューおよび左特異ベクター・ビューを説明しています。GET_MODEL_DETAILS_SVD
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
DM$VE
model_nameは、SVDモデル内の各特異値には、関連付けられている主成分分析(PCA)モデル内に対応する主成分があるという事実を利用して、両方のモデル・クラスの共通情報セットを関連付けます。SVDモデルの場合、Sマトリックスのコンテンツを説明します。PCAスコアリングが作成設定として選択されている場合、対応する主成分の分散値および累積分散率も表示されます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
VALUE BINARY_DOUBLE
VARIANCE BINARY_DOUBLE
PCT_CUM_VARIANCE BINARY_DOUBLE
表5-55 Sマトリックス・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
マトリックスの入力値 |
|
コンポーネントに記述された分散値。この列は、 この列は、手動で、または |
|
コンポーネントに記述された分散の累積率。コンポーネントは、記述した分散値に従って降順でランク付けされます。 この列は、 この列は、手動で、または |
SVD DM$VV
model_viewは、SVDモデルの右特異ベクターを説明しています。PCAモデルの場合、主成分(固有ベクター)を説明しています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
VALUE BINARY_DOUBLE
表5-56 特異値分解の右特異ベクター
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値。量的属性の場合、 |
|
マトリックスの入力値 |
DM$VU
model_nameは、SVDモデルの左特異ベクターを説明しています。PCAモデルの場合、主成分内のデータの予測を説明しています。このビューは、設定dbms_data_mining.svds_u_matrix_output
がdbms_data_mining.svds_u_matrix_enable
に設定されていない場合、存在しません。このビューには次のスキーマが含まれます。Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CASE_ID NUMBER/VARHCAR2
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
VALUE BINARY_DOUBLE
表5-57 特異値分解の左特異ベクターまたは主成分内の予測データ
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
U マトリックス予測によって記述される作成データ内にある、一意の行識別子。 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
マトリックスの入力値 |
特異値分解のグローバルな詳細
次の表は、特異値分解のグローバルな詳細について説明しています。
表5-58 特異値分解のグローバルな詳細
名前 | 説明 |
---|---|
|
モデルで生成される特徴(コンポーネント)の数 |
|
ビルドで使用される合計行数 |
|
モデルの分散値のほとんどが、計算された上位何個の特徴で取得されているかを示す推奨カットオフ。このカットオフ値よりも少ない数の特徴を使用することが、次元削減における有効な方策です。 |
5.4.17 最小記述長のモデル・ディテール・ビュー
最小記述長(属性評価の計算用)のモデル・ディテール・ビューは、属性評価ビューを説明しています。GET_MODEL_DETAILS_AI
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
属性評価ビューDM$VA
model_nameは、属性評価および属性評価ランクについて説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_IMPORTANCE_VALUE BINARY_DOUBLE
ATTRIBUTE_RANK NUMBER
表5-59 最小記述長の属性評価ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
評価の値 |
|
評価に基づくランク |
表5-60 モデル・グローバル・ビューの最小記述長統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
5.4.18 ビニングのモデル・ディテール・ビュー
ビニング・ビューDM$VB
は、自動データ準備で使用されるビン境界を説明しています。
このビューには次のスキーマが含まれます。
Name Type
-------------------- --------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
BIN_ID NUMBER
LOWER_BIN_BOUNDARY BINARY_DOUBLE
UPPER_BIN_BOUNDARY BINARY_DOUBLE
ATTRIBUTE_VALUE VARCHAR2(4000)
表5-61 ビニングのモデル・ディテール・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
属性名を指定します |
|
属性サブ名を指定します |
|
ビンID (またはビン識別子) |
|
量的ビンの下限 |
|
量的ビンの上限 |
|
質的値 |
5.4.19 グローバル情報のモデル・ディテール・ビュー
グローバル情報のモデル・ディテール・ビューは、グローバル統計ビュー、アラート・ビューおよび計算済設定ビューを説明しています。GET_MODEL_DETAILS_GLOBAL
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
グローバル統計ビューDM$VG
model_nameは、モデル作成に関連するグローバル統計について説明しています。例として、作成に使用される行数、コンバージェンス・ステータスおよびモデルの質メトリックがあります。このビューには次のスキーマが含まれます。
Name Type
------------------- --------------------
PARTITION_NAME VARCHAR2(128)
NAME VARCHAR2(30)
NUMERIC_VALUE NUMBER
STRING_VALUE VARCHAR2(4000)
表5-62 グローバル統計ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
統計の名前 |
|
統計の量的値 |
|
統計の質的値 |
アラート・ビューDM$VW
model_nameは、モデルの作成中に発行されたアラートをリストします。このビューには次のスキーマが含まれます。
Name Type
------------------- ----------------------
PARTITION_NAME VARCHAR2(128)
ERROR_NUMBER BINARY_DOUBLE
ERROR_TEXT VARCHAR2(4000)
表5-63 アラート・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
エラー番号(イベントがエラーのとき有効) |
|
エラー・メッセージ |
計算済設定ビューDM$VS
model_nameは、アルゴリズムの計算済設定を示します。このビューには次のスキーマが含まれます。
Name Type
----------------- --------------------
PARTITION_NAME VARCHAR2(128)
SETTING_NAME VARCHAR2(30)
SETTING_VALUE VARCHAR2(4000)
表5-64 計算済設定ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
設定の名前 |
|
設定の値 |
5.4.20 正規化および欠損値の処理のモデル・ディテール・ビュー
正規化および欠損値の処理ビューDM$VN
は、自動データ準備(ADP)で使用される正規化パラメータ、およびNULL
値が発生したときの欠損値の置換を説明しています。欠損値の置換は、2次元の列にのみ適用され、ネストされた列には適用されません。
このビューには次のスキーマが含まれます。
Name Type
---------------------- -----------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
NUMERIC_MISSING_VALUE BINARY_DOUBLE
CATEGORICAL_MISSING_VALUE VARCHAR2(4000)
NORMALIZATION_SHIFT BINARY_DOUBLE
NORMALIZATION_SCALE BINARY_DOUBLE
表5-65 正規化および欠損値の処理ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
量的欠損値の置換 |
|
質的欠損値の置換 |
|
正規化シフト値 |
|
正規化スケール値 |