5.4 モデルの詳細ビュー

GET_*インタフェースはモデル・ビューに置き換えられるため、かわりにこのビューを利用することをお薦めします。

次に、新しいモデル・ビューを示します。

相関:

分類、回帰、異常検出:

クラスタリング:

特徴抽出:

特徴選択:

データの準備およびその他:

時系列:

指数平滑法モデルのモデル・ディテール・ビュー

5.4.1 相関ルールのモデル・ディテール・ビュー

相関ルールのモデル・ディテール・ビューでは、相関ルールのルール・ビューが示されます。GET_ASSOCIATION_RULESファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

ルール・ビューDM$VRmodel_nameは、相関ルールに対して生成されたルールを説明しています。モデルの設定によって、ルール・ビューの列セットは異なります。設定ODMS_ITEM_ID_COLUMN_NAMEODMS_ITEM_VALUE_COLUMN_NAMEによって、各項目の定義方法が決まります。ODMS_ITEM_ID_COLUMN_NAMEが設定されている場合、入力形式はトランザクショナル入力と呼ばれます。それ以外の場合、入力形式は2次元入力と呼ばれます。トランザクショナル入力では、ODMS_ITEM_VALUE_COLUMN_NAMEが設定されていない場合、各項目はITEM_NAMEで定義されます。それ以外の場合、各項目はITEM_NAMEITEM_VALUEで定義されます。2次元入力では、各項目はITEM_NAMEITEM_SUBNAMEおよびITEM_VALUEで定義されます。設定ASSO_AGGREGATESでは、集計する列を指定します。この集計がビューに表示されます。

ノート:

設定ASSO_AGGREGATESは、2次元入力には使用できません。
次に、様々な設定によるビューを示します。

ASSO_AGGREGATES設定のないトランザクショナル入力

設定ITEM_NAME (ODMS_ITEM_ID_COLUMN_NAME)が設定されていて、ITEM_VALUE (ODMS_ITEM_VALUE_COLUMN_NAME)が設定されていない場合、ビューは次のようになります。ここでは、後件項目が名前フィールドのみで定義されています。設定ITEM_VALUEも設定されている場合、ビューには値フィールドを指定する追加の列CONSEQUENT_VALUEが含まれるようになります。
Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE

表5-11 トランザクショナル入力のルール・ビュー列

列名 説明

PARTITION_NAME

詳細を取得するパーティション化されたモデルのパーティション

RULE_ID

ルールの識別子

RULE_SUPPORT

ルールを満たすトランザクションの数。

RULE_CONFIDENCE

トランザクションがルールを満たす確度。

RULE_LIFT

ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度。

RULE_REVCONFIDENCE

ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの。

ANTECEDENT_SUPPORT

トランザクションの合計数に対する、前件を満たすトランザクションの数の割合。

NUMBER_OF_ITEMS

ルールの前件と後件で参照される属性の合計数。

CONSEQUENT_SUPPORT

トランザクションの合計数に対する、後件を満たすトランザクションの数の割合。

CONSEQUENT_NAME

後件の名前

CONSEQUENT_VALUE

後件の値。設定Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)に数値型としてTYPEが設定されている場合、ビューにはCONSEQUENT_VALUE列が含まれます。

設定Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)にカテゴリ型としてTYPEが設定されている場合、ビューにはCONSEQUENT_VALUE列が含まれます。

ANTECEDENT

前件は、項目セットとして記述されます。項目セット・レベルで、集計数が指定されます。ゼロ(0)以外の場合は、集計対象の列名(およびASSO_AGG*へのマッピング)も指定されます。項目セットには、>= 1個の項目が含まれています。

  • 設定ODMS_ITEM_VALUE_COLUMN_NAMEが設定されていない場合、各項目はitem_nameで定義されます。たとえば、前件に1つの項目Bが含まれている場合は次のように表記されます。

    <itemset NUMAGGR="0"><item><item_name>B</item_name></item></itemset>

    もう1つの例として、前件に2つの項目AとCが含まれている場合は次のように表記されます。

    <itemset NUMAGGR="0"><item><item_name>A</item_name></item><item><item_name>C</item_name></item></itemset>
  • 設定ODMS_ITEM_VALUE_COLUMN_NAMEが設定されている場合、各項目はitem_nameitem_valueで定義されます。たとえば、前件に2つの項目(名前A、値1)と(名前C、値1)が含まれている場合は次のように表記されます。

    <itemset NUMAGGR="0"><item><item_name>A</item_name><item_value>1</item_value></item><item><item_name>C</item_name><item_value>1</item_value></item></itemset>

ASSO_AGGREGATES設定があるトランザクショナル入力

集計設定のないビューと類似していて、3つのケースがあります。
  • ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が設定されていない場合のルール・ビュー。

  • ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が量的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

  • ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が質的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

例については、『Oracle Data Mining概要』集計の計算例に関する項を参照してください。

ビューでは、2セットの集計結果がレポートされます。

  1. ANT_RULE_PROFITは、ルールに関する前件項目セットの利益合計を表します。前件項目セットの項目ごとの利益はANTECEDENT(XMLtype)列に示されます。CON_RULE_PROFITは、ルールに関する結果項目の利益合計を指します。

    この例では、ルール(A, B) => Cの場合、ルール項目セット(A, B, C)は顧客1と顧客3のトランザクションで発生します。ANT_RULE_PROFITは$21.20です。ANTECEDENTは次のように示され、項目Aの利益が5.00 + 3.00 = $8.00で、項目Bの利益が3.20 + 10.00 = $13.20であることがわかります。これらの利益がANT_RULE_PROFITに合計されています。

    <itemset NUMAGGR="1" ASSO_AGG0="profit"><item><item_name>A</item_name><ASSO_AGG0>8.0E+000</ASSO_AGG0></item><item><item_name>B</item_name><ASSO_AGG0>1.32E+001</ASSO_AGG0></item></itemset> 
    The CON_RULE_PROFIT is 12.00 + 14.00 = $26.00
  2. ANT_PROFITは前件項目セットの利益合計を表し、CON_PROFITは後件項目の利益合計を表します。CON_PROFITCON_RULE_PROFITの相違点は、CON_PROFITは後件が発生するすべてのトランザクションの後件項目の収益をすべて合計しますが、CON_RULE_PROFITではルール項目セットが発生するトランザクションのみを合計することです(ANT_PROFITANT_RULE_PROFITの場合も同様です)。

    たとえば、項目Cは顧客1、2、3のトランザクションで発生し、CON_PROFITは12.00 + 4.20 + 14.00 = $30.20になります。その一方で、CON_RULE_PROFITはルール項目セット(A, B, C)が発生する顧客1と3のトランザクションのみの合計になります。

    同様に、ANT_PROFITでは項目セット(A, B)が発生するすべてのトランザクションが合計され、ANT_RULE_PROFITではルール項目セット(A, B, C)が発生するトランザクションのみが合計されます。この例では、偶然にも、どちらも顧客1と3のトランザクションを合計していて、同じ値になっています。

例5-13 例

次の例は、設定ASSO_AGGREGATESで集計対象として利益列と売上列を指定している場合のビューを示しています。この例では、ITEM_VALUE列は指定されていません。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE
 ANT_RULE_PROFIT                           BINARY_DOUBLE
 CON_RULE_PROFIT                           BINARY_DOUBLE
 ANT_PROFIT                                BINARY_DOUBLE
 CON_PROFIT                                BINARY_DOUBLE
 ANT_RULE_SALES                            BINARY_DOUBLE
 CON_RULE_SALES                            BINARY_DOUBLE
 ANT_SALES                                 BINARY_DOUBLE
 CON_SALES                                 BINARY_DOUBLE

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が量的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が質的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

2次元入力

Oracle Data Miningでは、トランザクショナルまたは2次元のデータ形式を使用して相関モデルを作成できます。2次元入力の場合、各項目は3つのフィールドNAMEVALUEおよびSUBNAMEで定義されます。NAMEフィールドは列の名前です。VALUEフィールドは列の内容です。SUBNAMEフィールドは、入力データ表にネストされた表が含まれる場合に使用します。このような場合、SUBNAMEはネストされた表の列名になります。「例: マーケット・バスケット分析用のネストした列の作成」を参照してください。この例では、ネストした列があります。CONSEQUENT_SUBNAMEは、ネストした列のATTRIBUTE_NAME部分です。つまり、'O/S Documentation Set - English'およびCONSEQUENT_VALUEは、ネストした列の値部分であり、1です。

ビューでは、後件用に3列が使用されます。ルール・ビューには次の列があります。

Name                                      Type
 ----------------------- --------------------- 
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 CONSEQUENT_SUBNAME                        VARCHAR2(4000)
 CONSEQUENT_VALUE                          VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE

ノート:

3つの部分のすべての型はVARCHAR2です。ASSO_AGGREGATESは、2次元入力形式には適用できません。

次の表に、2次元入力のルール・ビュー列とその説明を示します(2次元入力に固有のフィールドのみ)。

表5-12 2次元入力のルール・ビュー

列名 説明
CONSEQUENT_SUBNAME

2次元の入力の場合、CONSEQUENT_SUBNAMEが、入力データ表内のネストした列に使用されます。

CONSEQUENT_VALUE

後件の値。設定Item_valueに数値型としてTYPEが設定されている場合、ビューにはCONSEQUENT_VALUE列が含まれます。

設定Item_valueにカテゴリ型としてTYPEが設定されている場合、ビューにはCONSEQUENT_VALUE列が含まれます。

ANTECEDENT

前件は、項目セットとして記述されます。項目セットには、>= 1個の項目が含まれています。各アイテムは、ITEM_NAMEITEM_SUBNAMEおよびITEM_VALUEを使用して定義されます。

たとえば、ネストされた表入力ではなく、前件には1つの項目(名前ADDRMA)が含まれているとします。この前件(XMLtype)は次のようになります。

<itemset NUMAGGR="0"><item><item_name>ADDR</item_name><item_subname></item_subna
me><item_value>MA</item_value></item></itemset>

ネストされた表がある2次元入力の場合、サブ名フィールドが設定されます。

相関ルールのグローバルな詳細

単一のグローバルな詳細は、相関モデルによって生成されます。次の表は、相関ルール・モデルに対して返されるグローバルな詳細について説明しています。

表5-13 相関ルールのグローバルな詳細

名前 説明

ITEMSET_COUNT

生成された項目セットの数

MAX_SUPPORT

最大サポート

NUM_ROWS

構築で使用される行の合計数

RULE_COUNT

モデルで生成された相関ルールの数

TRANSACTION_COUNT

入力データのトランザクションの数

5.4.2 高頻度項目セットのモデル・ディテール・ビュー

高頻度項目セットのモデル・ディテール・ビューは、高頻度項目セット・ビューを説明しています。GET_FREQUENT_ITEMSETSファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

高頻度項目セット・ビューDM$VImodel_nameには、次のスキーマがあります。

Name		          Type
 ------------- ------------------
 PARTITION_NAME   VARCHAR2 (128)
 ITEMSET_ID       NUMBER
 SUPPORT          NUMBER
 NUMBER_OF_ITEMS  NUMBER
 ITEMSET          SYS.XMLTYPE

表5-14 高頻度項目ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

ITEMSET_ID

項目セット識別子

SUPPORT

項目セットのサポート

NUMBER_OF_ITEMS

項目セット内の項目の数

ITEMSET

高頻度項目セット

SYS.XMLTYPE列項目セットの構造は、ルール・ビューの対応する前件列と同じです。

5.4.3 トランザクショナル項目セットのモデル・ディテール・ビュー

トランザクショナル項目セットのモデル・ディテール・ビューは、トランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

集計のないトランザクショナル・データのよくあるケースとして、DM$VTmodel_nameビューは、トランザクショナル形式の項目セット情報を提供します。このビューは、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上に役立ちます。トランザクショナル項目セット・ビューには次のスキーマがあります。

Name		            Type
 ----------------- -----------------
 PARTITION_NAME      VARCHAR2(128)
 ITEMSET_ID          NUMBER
 ITEM_ID             NUMBER
 SUPPORT             NUMBER
 NUMBER_OF_ITEMS     NUMBER
 ITEM_NAME           VARCHAR2(4000)

表5-15 トランザクショナル項目セット・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

ITEMSET_ID

項目セット識別子

ITEM_ID

項目識別子

SUPPORT

項目セットのサポート

NUMBER_OF_ITEMS

項目セット内の項目の数

ITEM_NAME

アイテムの名前

5.4.4 トランザクショナル・ルールのモデル・ディテール・ビュー

トランザクショナル・ルールのモデル・ディテール・ビューは、トランザクショナル・ルール・ビューおよびトランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

集計のないトランザクショナル・データには、トランザクショナル・ルール・ビューDM$VAmodel_nameもあります。このビューにより、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上を図れます。トランザクショナル・ルール・ビューには次のスキーマがあります。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 ANTECEDENT_PREDICATE                      VARCHAR2(4000)
 CONSEQUENT_PREDICATE                      VARCHAR2(4000)
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 RULE_ITEMSET_ID                           NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER

表5-16 トランザクショナル・ルール・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

RULE_ID

ルール識別子

ANTECEDENT_PREDICATE

前件項目の名前。

CONSEQUENT_PREDICATE

後件項目の名前

RULE_SUPPORT

ルールのサポート

RULE_CONFIDENCE

前件が含まれる場合にトランザクションがルールを満たす確度。

RULE_LIFT

ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度

RULE_REVCONFIDENCE

ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの

RULE_ITEMSET_ID

項目セット識別子

ANTECEDENT_SUPPORT

トランザクションの合計数に対する、前件を満たすトランザクションの数の割合

CONSEQUENT_SUPPORT

トランザクションの合計数に対する、後件を満たすトランザクションの数の割合

NUMBER_OF_ITEMS

ルール内の項目の数

5.4.5 分類アルゴリズムのモデル・ディテール・ビュー

分類アルゴリズムのモデル・ディテール・ビューは、すべての分類アルゴリズムに適用されるターゲット・マップ・ビューおよびスコアリング・コスト・ビューを説明しています。GET_*ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

ターゲット・マップ・ビューDM$VTmodel_nameは、分類モデルに対するターゲット分布を説明しています。このビューには次のスキーマが含まれます。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2 
 TARGET_COUNT                              NUMBER
 TARGET_WEIGHT                             NUMBER

表5-17 ターゲット・マップ・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

TARGET_VALUE

ターゲット値(量的または質的)

TARGET_COUNT

特定のTARGET_VALUEの行数

TARGET_WEIGHT

特定のTARGET_VALUEの重み

スコアリング・コスト・ビューDM$VCmodel_nameは、分類モデルに対するスコアリング・コスト・マトリックスを説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ACTUAL_TARGET_VALUE                       NUMBER/VARCHAR2  
 PREDICTED_TARGET_VALUE                    NUMBER/VARCHAR2  
 COST                                      NUMBER

表5-18 スコアリング・コスト・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ACTUAL_TARGET_VALUE

有効なターゲット値

PREDICTED_TARGET_VALUE

予測対象ターゲット値

COST

実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト

5.4.6 CUR行列分解のモデル・ディテール・ビュー

CUR行列分解のモデル・ディテール・ビューには、属性および行のスコアとランクが示されます。

CUR行列分解アルゴリズムには次のビューがあります。

属性の重要度とランク: DM$VCmodel_name

行の重要度とランク: DM$VRmodel_name

グローバル統計: DM$VG

属性の重要度とランク・ビューDM$VCmodel_nameには次のスキーマがあります。

Name                            Type               
-----------------              -----------------      
PARTITION_NAME                 VARCHAR2(128)       
ATTRIBUTE_NAME                 VARCHAR2(128)       
ATTRIBUTE_SUBNAME              VARCHAR2(4000)      
ATTRIBUTE_VALUE                VARCHAR2(4000)    
ATTRIBUTE_IMPORTANCE           NUMBER     
ATTRIBUTE_RANK                 NUMBER			

表5-19 属性評価およびランク・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME

属性名

ATTRIBUTE_SUBNAME

属性のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

属性の値

ATTRIBUTE_IMPORTANCE

属性レバレッジ・スコア

ATTRIBUTE_RANK

レバレッジ・スコアに基づく属性ランク

ビューDM$VRmodel_nameでは、ビューで選択したすべての行のレバレッジ・スコアとランクが示されます。このビューは、ユーザーが行の重要度を実行することを決定していて、CASE_ID列が存在するときに作成されます。このビューには次のスキーマが含まれます。

Name	                  Type		                   
---------------------	 ------------------------	   
PARTITION_NAME	          VARCHAR2(128)         	   
CASE_ID 	          Original cid data types,         
                          including NUMBER, VARCHAR2, 
                          DATE, TIMESTAMP, 
                          TIMESTAMP WITH TIME ZONE, 
                          TIMESTAMP WITH LOCAL TIME ZONE	
ROW_IMPORTANCE   	  NUMBER	                       
ROW_RANK                  NUMBER	

表5-20 行重要度およびランク・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CASE_ID

ケースID。サポートされているケースIDの型は、GLM、SVDおよびESAアルゴリズムでサポートされている型と同じです。

ROW_IMPORTANCE

行のレバレッジ・スコア

ROW_RANK

レバレッジ・スコアに基づいた行のランク

次の表では、CUR行列分解のグローバル統計情報について説明します。

表5-21 モデル・グローバル・ビューのCURマトリックス分解統計情報。

名前 説明

NUM_COMPONENTS

SVD成分の数(SVDランク)

NUM_ROWS

モデル構築に使用される行の数

5.4.7 デシジョン・ツリーのモデル・ディテール・ビュー

デシジョン・ツリーのモデル・ディテール・ビューは、分岐情報ビュー、ノード統計ビュー、ノード説明ビューおよびコスト・マトリックス・ビューを説明しています。GET_MODEL_DETAILS_XMLファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

分岐情報ビューDM$VPmodel_nameは、デシジョン・ツリー内の各レベルのツリー階層および分岐情報を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ---------------------------
 PARTITION_NAME                     VARCHAR2(128)
 PARENT                             NUMBER              
 SPLIT_TYPE                         VARCHAR2            
 NODE                               NUMBER              
 ATTRIBUTE_NAME                     VARCHAR2(128)       
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)      
 OPERATOR                           VARCHAR2            
 VALUE                              SYS.XMLTYPE 

表5-22 分岐情報ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

PARENT

親のノードID

SPLIT_TYPE

メイン分岐またはサロゲート分岐

NODE

ノードID

ATTRIBUTE_NAME

このノードを生成するために、親ノードで分岐基準として使用される属性。

ATTRIBUTE_SUBNAME

分岐属性のサブ名。この値は、ネストされていない列に対してはNULLです。

OPERATOR

分岐演算子

VALUE

分岐基準として使用される値。これは、<Element>タグを使用して記述されるXML要素です。

たとえば、<Element>Windy</Element><Element>Hot</Element>などとなります。

ノード統計ビューDM$VImodel_nameは、個々のツリー・ノードに関連付けられている統計を説明しています。統計には、ノード内のデータのターゲット・ヒストグラムが含まれます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 NODE                               NUMBER      
 NODE_SUPPORT                       NUMBER       
 PREDICTED_TARGET_VALUE             NUMBER/VARCHAR2
 TARGET_VALUE                       NUMBER/VARCHAR2 
 TARGET_SUPPORT                     NUMBER   

表5-23 ノード統計ビュー

パラメータ 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

NODE

ノードID

NODE_SUPPORT

ノードに属するトレーニング・セット内のレコード数

PREDICTED_TARGET_VALUE

予測対象ターゲット値

TARGET_VALUE

トレーニング・データ内に表示されるターゲット値

TARGET_SUPPORT

ノードに属し、TARGET_VALUE列で指定されている値を持つレコード数

より高いレベルのノードの説明が、DM$VOmodel_nameビューに表示されます。DM$VOmodel_nameには、次のスキーマがあります。

ame                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 NODE                               NUMBER                
 NODE_SUPPORT                       NUMBER                
 PREDICTED_TARGET_VALUE             NUMBER/VARCHAR2       
 PARENT                             NUMBER               
 ATTRIBUTE_NAME                     VARCHAR2(128)       
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)       
 OPERATOR                           VARCHAR2             
 VALUE                              SYS.XMLTYPE  

表5-24 ノードの説明ビュー

パラメータ 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

NODE

ノードID

NODE_SUPPORT

ノードに属するトレーニング・セット内のレコード数

PREDICTED_TARGET_VALUE

予測対象ターゲット値

PARENT

親のID

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

OPERATOR

属性述語演算子 - 次の値を使用する条件演算子。

IN= <>< ><=>=

VALUE

説明の基準として使用される値。これは、<Element>タグを使用して記述されるXML要素です。

たとえば、<Element>Windy</Element><Element>Hot</Element>などとなります。

DM$VMmodel_nameビューは、デシジョン・ツリーの作成によって使用されるコスト・マトリックスを説明しています。DM$VMmodel_nameビューには、次のスキーマがあります。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ACTUAL_TARGET_VALUE                       NUMBER/VARCHAR2 
 PREDICTED_TARGET_VALUE                    NUMBER/VARCHAR2 
 COST                                      NUMBER

表5-25 コスト・マトリックス・ビュー

パラメータ 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ACTUAL_TARGET_VALUE

有効なターゲット値

PREDICTED_TARGET_VALUE

予測対象ターゲット値

COST

実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト

次の表は、デシジョン・ツリーのグローバル・ビューについて説明しています。

表5-26 モデル・グローバル・ビューのデシジョン・ツリー統計情報

名前 説明

NUM_ROWS

構築で使用される行の合計数

5.4.8 一般化線形モデルのモデル・ディテール・ビュー

一般化線形モデル(GLM)のモデル・ディテール・ビューは、線形およびロジスティック回帰のモデル・ディテール・ビューおよび行診断ビューを説明します。GET_MODEL_DETAILS_GLMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

モデル・ディテール・ビューDM$VDmodel_nameは、線形回帰モデルとロジスティック回帰モデルの両方の最終モデル情報を説明しています。

線形回帰の場合、DM$VDmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FEATURE_EXPRESSION                 VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE
 STD_ERROR                          BINARY_DOUBLE
 TEST_STATISTIC                     BINARY_DOUBLE
 P_VALUE                            BINARY_DOUBLE
 VIF                                BINARY_DOUBLE
 STD_COEFFICIENT                    BINARY_DOUBLE
 LOWER_COEFF_LIMIT                  BINARY_DOUBLE
 UPPER_COEFF_LIMIT                  BINARY_DOUBLE

ロジスティック回帰の場合、DM$VDmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 TARGET_VALUE                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FEATURE_EXPRESSION                 VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE
 STD_ERROR                          BINARY_DOUBLE
 TEST_STATISTIC                     BINARY_DOUBLE
 P_VALUE                            BINARY_DOUBLE
 STD_COEFFICIENT                    BINARY_DOUBLE
 LOWER_COEFF_LIMIT                  BINARY_DOUBLE
 UPPER_COEFF_LIMIT                  BINARY_DOUBLE
 EXP_COEFFICIENT                    BINARY_DOUBLE
 EXP_LOWER_COEFF_LIMIT              BINARY_DOUBLE
 EXP_UPPER_COEFF_LIMIT              BINARY_DOUBLE

表5-27 線形およびロジスティック回帰モデルのモデル・ビュー

列名 説明

PARTITION_NAME

モデル内の特徴の名前

TARGET_VALUE

有効なターゲット値

ATTRIBUTE_NAME

サブ名がない場合は属性名、サブ名がある場合は属性名の最初の部分。ATTRIBUTE_NAMEは、ソース表またはビューの列の名前です。列が、ネストされていない数値列の場合、ATTRIBUTE_NAMEはマイニング属性の名前です。切片の場合、ATTRIBUTE_NAMEはNULLです。切片は、SVMモデルのバイアスに相当する用語です。

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ネストした列が数値の場合、マイニング属性は、ATTRIBUTE_NAME - ATTRIBUTE_SUBNAMEの組合せによって識別されます。列がネストしていない場合、ATTRIBUTE_SUBNAMEはNULLです。属性が切片の場合、ATTRIBUTE_NAMEATTRIBUTE_SUBNAMEの両方がNULLです。

ATTRIBUTE_VALUE

質的列またはネストした質的列とみなすことができる一意の値。質的列では、マイニング属性は、一意のATTRIBUTE_NAME.ATTRIBUTE_VALUEのペアによって識別されます。ネストした質的列では、マイニング属性は、ATTRIBUTE_NAME.ATTRIBUTE_SUBNAME.ATTRIBUTE_VALUEの組合せによって識別されます。量的属性の場合、ATTRIBUTE_VALUEはNULLです。

FEATURE_EXPRESSION

特徴選択が有効な場合、アルゴリズムによって作成される特徴名です。特徴選択が有効でない場合、この特徴名は、単に完全修飾された属性名になります(属性がネストした列内にあるときはattribute_name.attribute_subnameになる)。質的属性では、次のような形式の特徴名が作成されます。

fully-qualified_attribute_name.attribute_value

特徴生成が有効な場合、モデル内の用語は、単一のマイニング属性または最大3つのマイニング属性の積となります。コンポーネント・マイニング属性は、単一の用語内で繰り返すことができます。特徴生成が有効ではない場合、または特徴生成が有効であるが、複数のコンポーネントの用語がCREATEモデル・プロセスによって検出されない場合、FEATURE_EXPRESSIONはNULLになります。

ノート:

12cリリース2では、アルゴリズムによって、量的コンポーネントから平均が減算されません。

COEFFICIENT

推定係数。

STD_ERROR

係数推定値の標準誤差。

TEST_STATISTIC

線形回帰の場合、係数推定値のt値。

ロジスティック回帰の場合、係数推定値のWaldカイ二乗値。

P_VALUE

モデル内の用語が統計的に重要ではない(NULL)仮定の下のTEST_STATISTICの確率。低い確率は用語が重要であることを示し、高い確率は用語を破棄した方がよいことを示します。モデルの特定の属性の重要度を分析するのに使用されます。

VIF

分散拡大要因。切片の場合、この値はゼロです。ロジスティック回帰の場合、VIFはNULLです。

STD_COEFFICIENT

係数の標準化推定値。

LOWER_COEFF_LIMIT

係数の信頼限界値の下限。

UPPER_COEFF_LIMIT

係数の信頼限界値の上限。

EXP_COEFFICIENT

ロジスティック回帰の場合は指数係数線形

回帰の場合、EXP_COEFFICIENTはNULLです。

EXP_LOWER_COEFF_LIMIT

ロジスティック回帰の場合、係数の信頼限界値の下限に対する指数係数。線形回帰の場合、EXP_LOWER_COEFF_LIMITはNULLです。

EXP_UPPER_COEFF_LIMIT

ロジスティック回帰の場合、係数の信頼限界値の上限に対する指数係数。線形回帰の場合、EXP_UPPER_COEFF_LIMITはNULLです。

行診断ビューDM$VAmodel_nameは、線形回帰モデルとロジスティック回帰モデルの両方の行レベル情報を説明しています。線形回帰の場合、DM$VAmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2, DATE, TIMESTAMP, 
                                    TIMESTAMP WITH TIME ZONE,
                                    TIMESTAMP WITH LOCAL TIME ZONE
 TARGET_VALUE                       BINARY_DOUBLE
 PREDICTED_TARGET_VALUE             BINARY_DOUBLE
 Hat                                BINARY_DOUBLE
 RESIDUAL                           BINARY_DOUBLE
 STD_ERR_RESIDUAL                   BINARY_DOUBLE
 STUDENTIZED_RESIDUAL               BINARY_DOUBLE
 PRED_RES                           BINARY_DOUBLE
 COOKS_D                            BINARY_DOUBLE

表5-28 線形回帰の行診断ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CASE_ID

ケースIDの名前

TARGET_VALUE

入力行から取得される実際のターゲット値

PREDICTED_TARGET_VALUE

行のモデル予測ターゲット値

HAT

ハット・マトリックスによって特定の入力行で識別されるn*n (n=行数)の対角線上の要素。入力データのモデル予測は、ハット・マトリックスと入力ターゲット値のベクターの積です。対角線上の要素(ハット値)は、i番目の適合した値上のi番目の行の影響を表します。大きいハット値は、i番目の行が影響力の大きいポイントであり、潜在的な外れ値であることを示すインジケータです。

RESIDUAL

特定の入力行の予測と実際のターゲット値間の差異。

STD_ERR_RESIDUAL

標準残余誤差(ステューデント化残差とも呼ばれる)は、入力行の残差を比較可能にするために、残差を再スケーリングしてすべての入力行にわたる定数分散を得ます。このプロセスは、残差を行の重さの平方根で乗算し、平均平方誤差の積およびハット値から1減算した値で除算します。

STUDENTIZED_RESIDUAL

スチューデント化削除残差は、現在の行の影響のために、標準残余誤差を調整します。

PRED_RES

予測残差は、削除残差の重み付きの2乗であり、行の重みを残差の2乗で乗算し、ハット値から1を減算した値で除算して算出されます。

COOKS_D

クックの距離は、すべての推定回帰係数上のi番目のケースの複合的影響のメジャーです。

ロジスティック回帰の場合、DM$VAmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2, DATE, TIMESTAMP, 
                                    TIMESTAMP WITH TIME ZONE,
                                    TIMESTAMP WITH LOCAL TIME ZONE
 TARGET_VALUE                       NUMBER/VARCHAR2
 TARGET_VALUE_PROB                  BINARY_DOUBLE
 Hat                                BINARY_DOUBLE
 WORKING_RESIDUAL                   BINARY_DOUBLE
 PEARSON_RESIDUAL                   BINARY_DOUBLE
 DEVIANCE_RESIDUAL                  BINARY_DOUBLE
 C                                  BINARY_DOUBLE
 CBAR                        	    BINARY_DOUBLE
 DIFDEV                             BINARY_DOUBLE
 DIFCHISQ                           BINARY_DOUBLE

表5-29 ロジスティック回帰の行診断ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CASE_ID

ケースIDの名前

TARGET_VALUE

入力行から取得される実際のターゲット値

TARGET_VALUE_PROB

予測ターゲット値の確率のモデル推定値。

Hat

線形回帰のハット値の概念は、線形回帰ハッチ値をロジスティック回帰の分散関数で乗算することでロジスティック回帰に拡張され、予測確率は、予測確率から1を減算した値で乗算されます。

WORKING_RESIDUAL

作業残差は、作業応答の残差です。作業応答は、線形化スケール上の応答です。ロジスティック回帰の場合、i番目の行の残差がi番目の行の予測の分散で除算される形式となります。予測の分散は、予測確率を予測確率から1を減算した値で乗算し算出されます。

WORKING_RESIDUALは、作業応答と収束時の線形予測子間の差異です。

PEARSON_RESIDUAL

ピアソン残差は、重みを考慮した、作業残差の再スケーリングされたバージョンです。ロジスティック回帰の場合、ピアソン残差は、残差を、重み平方根として計算される係数で乗算し、i番目の行の予測確率の分散で除算し算出されます。

RESIDUALは、行の実際のターゲット値の予測確率から1を減算した値です。

DEVIANCE_RESIDUAL

DEVIANCE_RESIDUALは、i番目の観測のモデル逸脱度への寄与率です。ロジスティック回帰では、非参照クラスの場合、2の平方根×log(1 + e^eta) - etaの形式となり、参照クラスの場合2の平方根×log (1 + eta)となり、この場合のetaは線形予測(モデルが線形回帰とする場合の予測)です。

C

削除されたもの(i番目のポイント)を含む、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、ハット値から1減算した値の2乗で除算して算出されます。

個々の観察による影響のスカラー測定を提供する、信頼区間の置換診断。

CBAR

CおよびCBARは、ロジスティック回帰のクックの距離の拡張です。CBARは、削除されたもの(i番目のポイント)を除く、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、(ハット値から1減算した値)で除算して算出されます。

個々の観察の削除による影響を測定する、信頼区間の置換診断。

DIFDEV

観測値が入力から削除されたときに発生する逸脱度の変化を測定する統計。逸脱度残差の2乗にCBARを加算して算出されます。

DIFCHISQ

観測値が入力から削除されたときに発生するピアソンのカイ二乗の変化を測定する統計。CBARをハット値で除算して算出されます。

GLMのグローバルな詳細: 線形回帰

次の表は、線形回帰モデルによって返されるグローバルな詳細について説明しています。

表5-30 線形回帰のグローバルな詳細

名前 説明

ADJUSTED_R_SQUARE

調整済R2乗

AIC

赤池情報量基準

COEFF_VAR

変動の係数

CONVERGED

モデルの構築プロセスが指定の許容値に収束しているかどうかを示します。次は、返される値です。
  • YES

  • NO

CORRECTED_TOTAL_DF

修正された総自由度。

CORRECTED_TOT_SS

修正された総平方和。

DEPENDENT_MEAN

依存平均

ERROR_DF

誤差の自由度。

ERROR_MEAN_SQUARE

誤差平均平方

ERROR_SUM_SQUARES

誤差の平方和。

F_VALUE

モデルのF値の統計。

GMSEP

予測の推定平均平方誤差。多変量正規性を想定しています。

HOCKING_SP

HockingのSp統計

ITERATIONS

SGD反復数を追跡します。ソルバーがSGDの場合にのみ適用できます。

J_P

JP統計(最終予測誤差)。

MODEL_DF

モデルの自由度。

MODEL_F_P_VALUE

モデルのF値の確率。

MODEL_MEAN_SQUARE

平均平方誤差のモデル

MODEL_SUM_SQUARES

平方誤差の合計のモデル

NUM_PARAMS

パラメータ数(切片を含む係数の数)。

NUM_ROWS

行数

R_SQ

R2乗

RANK_DEFICIENCY

多重共線性のためにモデルから除外された予測子の数

ROOT_MEAN_SQ

2乗平均平方根誤差。

SBIC

Schwarzのベイズ情報量基準。

GLMのグローバルな詳細: ロジスティック回帰

次の表は、ロジスティック回帰モデルによって返されるグローバルな詳細を示しています。

表5-31 ロジスティック回帰のグローバルな詳細

名前 説明

AIC_INTERCEPT

ベースライン、インターセプトのみのモデルに適合する赤池の規準

AIC_MODEL

切片および共変量(予測子)モデルの適合度に関する赤池の基準。

CONVERGED

モデルの構築プロセスが指定の許容値に収束しているかどうかを示します。次は、返される値です。
  • YES

  • NO

DEPENDENT_MEAN

依存平均

ITERATIONS

SGD反復数(IRLS反復数)を追跡します。ソルバーがSGDの場合にのみ適用できます。

LR_DF

尤度比の自由度。

LR_CHI_SQ

尤度比のカイ二乗値。

LR_CHI_SQ_P_VALUE

尤度比のカイ二乗確率値。

NEG2_LL_INTERCEPT

ベースライン、インターセプトのみのモデルの-2対数尤度

NEG2_LL_MODEL

モデルの-2対数尤度。

NUM_PARAMS

パラメータ数(切片を含む係数の数)。

NUM_ROWS

行数

PCT_CORRECT

正確な予測の割合。

PCT_INCORRECT

不正確に予測された行の割合。

PCT_TIED

推定確率が両方のターゲット・クラスで等しい場合の割合

PSEUDO_R_SQ_CS

擬似R二乗(CoxおよびSnell)

PSEUDO_R_SQ_N

擬似R2乗(Nagelkerke)

RANK_DEFICIENCY

多重共線性のためにモデルから除外された予測子の数

SC_INTERCEPT

ベースライン、インターセプトのみのモデルに適合するSchwarzの規準

SC_MODEL

切片および共変量(予測子)モデルの適合度に関するSchwarzの基準。

ノート:

  • 「リッジ回帰」が有効な場合、戻されるグローバルな詳細がより少なくなります。リッジの詳細は、『Oracle Data Mining概要』を参照してください。

  • パーティション化されたモデルで値がNULLの場合、例外がスローされます。値がNULLでない場合、目的のパーティション名が含まれる必要があります。

5.4.9 Naive Bayesのモデル・ディテール・ビュー

Naive Bayesのモデル・ディテール・ビューは、事前のビューおよび結果ビューを説明しています。GET_MODEL_DETAILS_NBファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

事前ビューDM$VPmodel_nameは、Naïve Bayesに対するターゲットの事前の状態を説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_NAME                               VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 PRIOR_PROBABILITY                         BINARY_DOUBLE
 COUNT                                     NUMBER

表5-32 Naive Bayesの事前ビュー

列名 説明

PARTITION_NAME

モデル内の特徴の名前

TARGET_NAME

ターゲット列の名前

TARGET_VALUE

ターゲット値(量的または質的)

PRIOR_PROBABILITY

特定のTARGET_VALUEの事前確率

COUNT

特定のTARGET_VALUEの行数

Naïve Bayes結果ビューDM$VVmodel_viewは、Naïve Bayesモデルの条件付き確率を説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_NAME                               VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_VALUE                           VARCHAR2(4000)
 CONDITIONAL_PROBABILITY                   BINARY_DOUBLE
 COUNT                                     NUMBER

表5-33 Naive Bayesの結果ビュー

列名 説明

PARTITION_NAME

モデル内の特徴の名前

TARGET_NAME

ターゲット列の名前

TARGET_VALUE

ターゲット値(量的または質的)

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

ATTRIBUTE_NAMEのマイニング属性値またはネストした列ATTRIBUTE_SUBNAME (存在する場合)。

CONDITIONAL_PROBABILITY

特定のターゲットのマイニング属性の条件付き確率

COUNT

特定のマイニング属性および特定のターゲットの行数

次の表は、Naive Bayesのグローバル・ビューについて説明しています。

表5-34 モデル・グローバル・ビューのNaive Bayes統計情報

名前 説明

NUM_ROWS

構築で使用される行の合計数

5.4.10 ニューラル・ネットワークのモデル・ディテール・ビュー

ニューラル・ネットワークのモデル・ディテール・ビューでは、ニューロンの重み(入力層と非表示層)が示されます。モデル・ディテール・ビューを利用することをお薦めします。

ニューラル・ネットワーク・アルゴリズムは次のビューがあります。

重み: DM$VAmodel_name

ビューDM$VAmodel_nameには、次のスキーマがあります。

Name                           Type                                               
---------------------- -----------------------     
PARTITION_NAME                VARCHAR2(128)         
LAYER                         NUMBER                
IDX_FROM                      NUMBER                 
ATTRIBUTE_NAME                VARCHAR2(128)         
ATTRIBUTE_SUBNAME             VARCHAR2(4000)        
ATTRIBUTE_VALUE               VARCHAR2(4000)        
IDX_TO                        NUMBER                
TARGET_VALUE                  NUMBER/VARCHAR2       
WEIGHT                        BINARY_DOUBLE

表5-35 重みビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

LAYER

層ID (入力層の場合は0)

IDX_FROM

重みの接続元のノード索引(入力層の場合は属性ID)

ATTRIBUTE_NAME

属性名(入力層の場合のみ)

ATTRIBUTE_SUBNAME

属性のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

IDX_TO

重みの接続先のノード索引

TARGET_VALUE

ターゲット値。回帰の場合は値がNULLになります。

WEIGHT

重みの値

ビューDM$VGmodel_nameは既存のビューです。ビューには次の名前と値のペアが追加されます。

表5-36 モデル・グローバル・ビューのニューラル・ネットワーク統計情報

名前 説明

CONVERGED

モデルの構築プロセスが指定の許容値に収束しているかどうかを示します。次は、返される値です。

  • YES

  • NO

ITERATIONS

反復数

LOSS_VALUE

損失関数の値(NNET_REGULARIZER_HELDASIDE正則化が指定されている場合は、テスト・データに対する損失関数の値になります)

NUM_ROWS

モデル(またはパーティション化されたモデル)内の行数

5.4.11 ランダム・フォレストのモデルディテール・ビュー

ランダム・フォレストのモデル・ディテール・ビューでは、変数重要度のメジャーと統計がグローバル・ビューに示されます。モデル・ディテール・ビューを利用することをお薦めします。

ランダム・フォレスト・アルゴリズムには、次の統計ビューがあります。

  • 変数重要度の統計DM$VAmodel_name

  • モデル・グローバル・ビューのランダム・フォレスト統計DM$VGmodel_name

ランダム・フォレストのモデル構築からの重要な出力の1つとして、属性の相対的な重要度に基づいた属性のランキングがあります。これは、Mean Decrease Giniを使用して測定されます。ビューDM$VAmodel_nameには、次のスキーマがあります。

Name                                Type        
------------------------          --------------- 
PARTITION_NAME                     VARCHAR2(128)   
ATTRIBUTE_NAME                     VARCHAR2(128)   
ATTRIBUTE_SUBNAME                  VARCHAR2(128)   
ATTRIBUTE_IMPORTANCE               BINARY_DOUBLE  

表5-37 変数の重要度モデル・ビュー

列名 説明

PARTITION_NAME

パーティション名。パーティション化されていないモデルの場合、値はNULLです。

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_IMPORTANCE

フォレスト内の属性の重要度のメジャー(Mean Decrease Gini値)

ビューDM$VGmodel_nameは既存のビューです。ビューには次の名前と値のペアが追加されます。

表5-38 モデル・グローバル・ビューのランダム・フォレスト統計情報

名前 説明

AVG_DEPTH

フォレスト内のツリーの平均深度

AVG_NODECOUNT

ツリーごとのノードの平均数

MAX_DEPTH

フォレスト内のツリーの最大深度

MAX_NODECOUNT

ツリーごとのノードの最大数

MIN_DEPTH

フォレスト内のツリーの最小深度

MIN_NODECOUNT

ツリーごとのノードの最小数

NUM_ROWS

構築で使用される行の合計数

5.4.12 サポート・ベクター・マシンのモデル・ディテール・ビュー

サポート・ベクター・マシンのモデル・ディテール・ビューは、線形係数ビューを説明しています。GET_MODEL_DETAILS_SVMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

線形係数ビューDM$VLmodel_nameは、線形SVMアルゴリズムの係数を説明しています。ビューのtarget_valueフィールドは分類にのみ存在し、ターゲットの型を持ちます。回帰モデルにはtarget_valueフィールドがありません。

reversed_coefficientフィールドは、自動データ準備変換を元に戻した後の係数の値が表示されます。データ準備が無効な場合、coefficientreversed_coefficientの値は同じになります。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_VALUE                           VARCHAR2(4000)
 COEFFICIENT                               BINARY_DOUBLE
 REVERSED_COEFFICIENT                      BINARY_DOUBLE

表5-39 サポート・ベクター・マシンの線形係数ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

TARGET_VALUE

ターゲット値(量的または質的)

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性の値

COEFFICIENT

予測係数値

REVERSED_COEFFICIENT

元のスケールで変換された係数

次の表では、サポート・ベクター統計グローバル・ビューについて説明します。

表5-40モデル・グローバル・ビューのサポート・ベクター統計情報

名前 説明

CONVERGED

モデルの構築プロセスが指定の許容値に収束しているかどうかを示します。
  • YES

  • NO

ITERATIONS

構築中に実行される反復回数

NUM_ROWS

構築に使用される行の数

REMOVED_ROWS_ZERO_NORM

ノルムが0のために削除された行の数。これは、1クラス線形モデルにのみ適用されます。

5.4.13 クラスタリング・アルゴリズムのモデル・ディテール・ビュー

Oracle Data Miningは、期待値最大化、k-Meansおよび直交パーティショニング・クラスタリング(O-Cluster)などのクラスタリング・アルゴリズムをサポートしています。

すべてのクラスタリング・アルゴリズムで、次のビューが共有されます。

  • クラスタ説明DM$VDmodel_name

  • 属性統計DM$VAmodel_name

  • ヒストグラム統計DM$VHmodel_name

  • ルール統計DM$VRmodel_name

クラスタ説明ビューDM$VDmodel_nameは、クラスタリング・モデルのクラスタ・レベル情報を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2  
 RECORD_COUNT                       NUMBER
 PARENT                             NUMBER           
 TREE_LEVEL                         NUMBER           
 LEFT_CHILD_ID                      NUMBER           
 RIGHT_CHILD_ID                     NUMBER 

表5-41 クラスタリング・アルゴリズムのクラスタ説明ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

RECORD_COUNT

レコードの数を指定します。

PARENT

親のID

TREE_LEVEL

ルートからの分岐の数を指定します。

LEFT_CHILD_ID

分岐の左側の子クラスタのID

RIGHT_CHILD_ID

分岐の右側の子クラスタのID

属性ビューDM$VAmodel_nameは、クラスタリング・モデルの属性レベル情報を説明しています。特定のクラスタの平均、分散およびモードの値は、このビューから取得できます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 MEAN                               BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE
 MODE_VALUE                         VARCHAR2(4000)

表5-42 クラスタリング・アルゴリズムの属性ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

MEAN

このフィールドにより、数値属性の平均値が戻されます

VARIANCE

数値属性の分散

MODE_VALUE

モードとは、質的属性の最頻値です。

ヒストグラム・ビューDM$VHmodel_nameは、クラスタリング・モデルのヒストグラム・レベル情報を説明しています。ビン情報およびビン数は、このビューから取得できます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 BIN_ID                             NUMBER
 LOWER_BIN_BOUNDARY                 BINARY_DOUBLE                
 UPPER_BIN_BOUNDARY                 BINARY_DOUBLE         
 ATTRIBUTE_VALUE                    VARCHAR2(4000)       
 COUNT                              NUMBER  

表5-43 クラスタリング・アルゴリズムのヒストグラム・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

BIN_ID

ビンID

LOWER_BIN_BOUNDARY

量的ビンの下限

UPPER_BIN_BOUNDARY

量的ビンの上限

ATTRIBUTE_VALUE

質的属性値

COUNT

ヒストグラム数

ルール・ビューDM$VRmodel_nameは、クラスタリング・モデルのルール・レベル情報を説明しています。情報は、属性の述語レベルで提供されます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER              
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 OPERATOR                           VARCHAR2(2)         
 NUMERIC_VALUE                      NUMBER              
 ATTRIBUTE_VALUE                    VARCHAR2(4000)      
 SUPPORT                            NUMBER              
 CONFIDENCE                         BINARY_DOUBLE       
 RULE_SUPPORT                       NUMBER              
 RULE_CONFIDENCE                    BINARY_DOUBLE 

表5-44 クラスタリング・アルゴリズムのルール・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

OPERATOR

属性述語演算子 - 次の値を使用する条件付き演算子: IN=<><><=および>=

NUMERIC_VALUE

量的ビンの下限

ATTRIBUTE_VALUE

質的属性値

SUPPORT

属性述語のサポート

CONFIDENCE

属性述語の信頼度

RULE_SUPPORT

ルール・レベルのサポート

RULE_CONFIDENCE

ルール・レベルの信頼度

5.4.14 期待値最大化のモデル・ディテール・ビュー

期待値最大化(EM)のモデル・ディテール・ビューは、クラスタリング・ビューのそれに対するEMのビューにおける差異を説明しています。GET_MODEL_DETAILS_EMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

次のビューは、クラスタリング・ビューに対する期待値最大化のビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。

コンポーネント・ビューDM$VOmodel_nameは、EMコンポーネントを説明しています。コンポーネント・ビューには、事前確率およびマップ先のクラスタに関する情報が含まれています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 CLUSTER_ID                         NUMBER
 PRIOR_PROBABILITY                  BINARY_DOUBLE

表5-45 コンポーネント・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

COMPONENT_ID

コンポーネントの一意の識別子

CLUSTER_ID

モデル内のクラスタのID

PRIOR_PROBABILITY

コンポーネント事前確率

平均および分散コンポーネント・ビューDM$VMmodel_nameは、ガウス分布モデル別の属性の平均および分散パラメータに関する情報を提供します。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(4000)
 MEAN                               BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE

頻度コンポーネント・ビューDM$VFmodel_nameは、EMモデルによって使用される複数値ベルヌーイ分布のパラメータに関する情報を提供します。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FREQUENCY                          BINARY_DOUBLE

表5-46 頻度コンポーネント・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

COMPONENT_ID

コンポーネントの一意の識別子

ATTRIBUTE_NAME

列名

ATTRIBUTE_VALUE

質的属性値

FREQUENCY

ATTRIBUTE_NAMEおよびATTRIBUTE_VALUEによって指定されている属性/値の組合せの複数値ベルヌーイ分散の頻度。

2次元列の場合、EMは属性評価の属性ランク付けと類似したものを提供します。このランク付けは、列のペアに対して計算されたカルバック・ライブラー・ダイバージェンスにわたる、ランクで重み付けされた平均に基づきます。この教師なし属性評価は、DM$VImodel_nameビューに表示され、次のスキーマを含みます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_IMPORTANCE_VALUE                BINARY_DOUBLE
 ATTRIBUTE_RANK                            NUMBER

表5-47 期待値最大化の2次元属性ランク付け

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME

列名

ATTRIBUTE_IMPORTANCE_VALUE

評価の値

ATTRIBUTE_RANK

評価の値に基づく属性ランク

pairwiseカルバック・ライブラー・ダイバージェンスは、DM$VBmodel_nameビューにレポートされます。このメトリックは、観察対象の2つの属性の結合分布が、独立性の仮定の下に、予想される分布とどの程度異なっているかを評価します。つまり、値が大きいほど、2つの属性がより依存していることになります。独立性の値は、各ペアワイズ計算に使用されるグリッドのサイズに基づいてスケーリングされます。このため、[0; 1]範囲内の全ての値が比較可能になります。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME_1                          VARCHAR2(128)
 ATTRIBUTE_NAME_2                          VARCHAR2(128)
 DEPENDENCY                                BINARY_DOUBLE

表5-48 期待値最大化のカルバック・ライブラー・ダイバージェンス

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME_1

属性1の名前

ATTRIBUTE_NAME_2

属性2の名前

DEPENDENCY

スケーリングされたペアワイズ・カルバック・ライブラー・ダイバージェンス

予測表DM$VPmodel_nameは、ネストした列をより下の次元空間にマップするために、ランダム予測によって使用される係数を示します。このビューには、作成データ内にネストしたデータまたはテキスト・データが存在する場合のみ行が含まれます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_NAME                       VARCHAR2(4000)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 COEFFICIENT                        NUMBER

表5-49 期待値の最大化の予測表

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_NAME

特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

COEFFICIENT

予測係数。データ表現はまばらなため、ゼロ以外の係数のみが戻されます。

期待値の最大化のグローバルな詳細

次の表では、期待値最大化のグローバル詳細について説明します。

表5-50 期待値の最大化のグローバルな詳細

名前 説明

CONVERGED

モデルの構築プロセスが指定の許容値に収束しているかどうかを示します。可能な値は次のとおりです:

  • YES

  • NO

LOGLIKELIHOOD

構築データに対する尤度

NUM_COMPONENTS

モデルで生成されるコンポーネントの数

NUM_CLUSTERS

モデルで生成されるクラスタの数

NUM_ROWS

構築で使用される行の数

RANDOM_SEED

モデル・ビルドに使用されるランダム・シード値

REMOVED_COMPONENTS

モデルから除外する空のコンポーネントの数

5.4.15 k-Meansのモデル・ディテール・ビュー

k-Means (KM)のモデル・ディテール・ビューは、クラスタの説明ビューおよびスコアリング・ビューを説明しています。GET_MODEL_DETAILS_KMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

この項では、クラスタリング・ビューに対するk-Meansのビュー内の相違点を説明しています。様々なビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。k-Meansの場合、クラスタの説明ビューDM$VDmodel_nameには、追加の列があります。

Name                                Type
 ---------------------------------- ----------------------------
 DISPERSION                         BINARY_DOUBLE

表5-51 k-Meansのクラスタの説明

列名 説明

DISPERSION

標準の統計モデルと比較して、一連の確認された出現が分散しているかどうかを定量化するために使用されるメジャー。

スコアリング・ビューDM$VCmodel_nameは、各リーフ・クラスタの重心を説明しています。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 VALUE                              BINARY_DOUBLE

表5-52 k-Meansのスコアリング・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

VALUE

重心の値を指定します

次の表では、k–Meansのグローバル・ビューについて説明します。

表5-53 モデル・グローバル・ビューのk–Means統計情報

名前 説明

CONVERGED

モデルの構築プロセスが指定の許容値に収束しているかどうかを示します。次は、返される値です。

  • YES

  • NO

NUM_ROWS

構築で使用される行の数

REMOVED_ROWS_ZERO_NORM

ノルムが0のために削除された行の数。これは、コサイン距離を使用してモデルにのみ適用されます。

5.4.16 O-Clusterのモデル・ディテール・ビュー

O-Clusterのモデル・ディテール・ビューは、統計ビューを説明しています。GET_MODEL_DETAILS_OCファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

次は、クラスタリング・ビューに対するO-Clusterのビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。OCアルゴリズムでは、期待値最大化(EM)およびk-Means (KM)と同じ記述統計ビューが使用されます。次に統計ビューを示します。

  • クラスタ説明DM$VDmodel_name

  • 属性統計DM$VAmodel_name

  • ルール統計DM$VRmodel_name

  • ヒストグラム統計DM$VHmodel_name

クラスタ説明ビューDM$VDmodel_nameは、O-Clusterコンポーネントを説明しています。クラスタ説明ビューには、分岐述語を示す追加フィールドがあります。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 OPERATOR                           VARCHAR2(2)        
 VALUE                              SYS.XMLTYPE

表5-54 説明ビュー

列名 説明

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

OPERATOR

分岐演算子

VALUE

分岐値のリスト

SYS.XMLTYPEの構造は、次のとおりです。
<Element>splitval1</Element>

OCアルゴリズムでは、ヒストグラム・ビューDM$VHmodel_nameが、EMおよびk-Means (KM)とは異なるスキーマとともに使用されます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITON_NAME                      VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 BIN_ID                             NUMBER
 LABEL                              VARCHAR2(4000)   
 COUNT                              NUMBER          

表5-55 ヒストグラム・コンポーネント・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CLUSTER_ID

コンポーネントの一意の識別子

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

BIN_ID

一意の識別子

LABEL

ビン・ラベル

COUNT

ビン・ヒストグラム数

次の表は、O-Clusterのグローバル・ビューについて説明しています。

表5-56 モデル・グローバル・ビューのO-Cluster統計情報

名前 説明

NUM_ROWS

構築で使用される行の合計数

5.4.17 明示的セマンティック分析のモデル・ディテール・ビュー

明示的セマンティック分析(ESA)のモデル・ディテール・ビューは、属性統計ビューおよび特徴ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

ESAアルゴリズムには次のビューがあります。

  • 明示的セマンティック分析のマトリックスDM$VAmodel_name: このビューのスキーマは、特徴抽出分類で異なります。特徴抽出の場合、このビューには、特徴ごとのモデル属性の係数が示されます。分類の場合、このビューには、ターゲット・クラスごとのモデル属性の係数が示されます。

  • 明示的セマンティック分析の特徴DM$VFmodel_name: この表示は、特徴抽出にのみ適用されます。

ビューDM$VAmodel_nameには、特徴抽出に関する次のスキーマが含まれます。

 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER/VARHCAR2, DATE, TIMESTAMP, 
                                    TIMESTAMP WITH TIME ZONE,
                                    TIMESTAMP WITH LOCAL TIME ZONE 
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE

表5-57 特徴抽出の明示的セマンティック分析マトリックス

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

トレーニング・データに表示される特徴の一意の識別子

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

COEFFICIENT

特徴に関する属性の重みのメジャー

DM$VAmodel_nameビューは、すべてのターゲット・クラスの属性係数で構成されます。

ビューDM$VAmodel_nameには、分類に関する次のスキーマが含まれます。

Name                                Type
---------------------------------- ----------------------------
PARTITION_NAME                     VARCHAR2(128)
TARGET_VALUE                       NUMBER/VARCHAR2
ATTRIBUTE_NAME                     VARCHAR2(128)
ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
ATTRIBUTE_VALUE                    VARCHAR2(4000)
COEFFICIENT                        BINARY_DOUBLE

表5-58 分類の明示的セマンティック分析マトリックス

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

TARGET_VALUE

ターゲットの値

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

COEFFICIENT

特徴に関する属性の重みのメジャー

ビューDM$VFmodel_nameには、1つのビュー内のすべての特徴に対して一意の行があります。この特徴は、モデルが事前作成されていて、ソース・トレーニング・データが使用不可の場合に役立ちます。このビューには次のスキーマが含まれます。

 Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER/VARHCAR2, DATE, TIMESTAMP, 
                                    TIMESTAMP WITH TIME ZONE,
                                    TIMESTAMP WITH LOCAL TIME ZONE

表5-59 明示的セマンティック分析の明示的セマンティック分析機能

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

トレーニング・データに表示される特徴の一意の識別子

次の表では、明示的セマンティック分析のグローバル・ビューについて説明します。

表5-60 モデル・グローバル・ビューの明示的セマンティック分析統計情報

名前 説明

NUM_ROWS

入力行の合計数

REMOVED_ROWS_BY_FILTERS

フィルタによって削除された行の数

5.4.18 Non-Negative Matrix Factorizationのモデル・ディテール・ビュー

Non-Negative Matrix Factorization (NMF)のモデル・ディテール・ビューは、エンコーディングHマトリックス・ビューおよびH逆マトリックス・ビューを説明しています。GET_MODEL_DETAILS_NMFファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

NMFアルゴリズムには、2つのマトリックス・コンテンツ・ビューがあります。

  • エンコーディング(H)マトリックスDM$VEmodel_name

  • H逆マトリックスDM$VImodel_name

ビューDM$VEmodel_nameは、NMFモデルのエンコーディング(H)マトリックスを説明しています。FEATURE_NAME列の型は、NUMBERまたはVARCHAR2のいずれかです。このビューには次のスキーマ定義が含まれます。

 Name		     Type
 ------------------- --------------------------
 PARTITION_NAME       VARCHAR2(128)
 FEATURE_ID           NUMBER
 FEATURE_NAME         NUMBER/VARCHAR2
 ATTRIBUTE_NAME       VARCHAR2(128)
 ATTRIBUTE_SUBNAME    VARCHAR2(4000)
 ATTRIBUTE_VALUE      VARCHAR2(4000)
 COEFFICIENT          BINARY_DOUBLE

表5-61 Non-Negative Matrix FactorizationのエンコーディングHマトリックス・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

属性の値を指定します

COEFFICIENT

特徴への寄与率を表す属性エンコーディング

ビューDM$VImodel_viewは、NMFモデルの逆Hマトリックスを説明しています。FEATURE_NAME列の型は、NUMBERまたはVARCHAR2のいずれかです。このビューには次のスキーマが含まれます。

 Name	           Type
 ----------------- ------------------------
 PARTITION_NAME     VARCHAR2(128)
 FEATURE_ID         NUMBER
 FEATURE_NAME       NUMBER/VARCHAR2
 ATTRIBUTE_NAME     VARCHAR2(128)
 ATTRIBUTE_SUBNAME  VARCHAR2(4000)
 ATTRIBUTE_VALUE    VARCHAR2(4000)
 COEFFICIENT        BINARY_DOUBLE

表5-62 Non-Negative Matrix Factorizationの逆Hマトリックス・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

属性の値を指定します

COEFFICIENT

特徴への寄与率を表す属性エンコーディング

次の表では、Non-Negative Matrix Factorizationのグローバル統計について説明します。

表5-63 モデル・グローバル・ビューのNon-Negative Matrix Factorization統計情報

名前 説明

CONV_ERROR

収束誤差

CONVERGED

モデルの構築プロセスが指定の許容値に収束しているかどうかを示します。次は、返される値です。
  • YES

  • NO

ITERATIONS

構築中に実行される反復回数

NUM_ROWS

作成用の入力データセットで使用される行の数

SAMPLE_SIZE

構築で使用される行の数

5.4.19 特異値分解のモデル・ディテール・ビュー

特異値分解(SVD)のモデル・ディテール・ビューは、Sマトリックス・ビュー、右特異ベクター・ビューおよび左特異ベクター・ビューを説明しています。GET_MODEL_DETAILS_SVDファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

DM$VEmodel_nameビューは、SVDモデル内の各特異値には、関連付けられている主成分分析(PCA)モデル内に対応する主成分があるという事実を利用して、両方のモデル・クラスの共通情報セットを関連付けます。SVDモデルの場合、Sマトリックスのコンテンツを説明します。PCAスコアリングが作成設定として選択されている場合、対応する主成分の分散値および累積分散率も表示されます。このビューには次のスキーマが含まれます。

 Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 VALUE                              BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE  
 PCT_CUM_VARIANCE                   BINARY_DOUBLE 

表5-64 Sマトリックス・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

VALUE

マトリックスの入力値

VARIANCE

コンポーネントに記述された分散値。この列は、dbms_data_mining.svds_scoring_modedbms_data_mining.svds_scoring_pcaに設定されているSVDにのみ存在します

この列は、手動で、またはdbms_data_mining.prep_autodbms_data_mining.prep_auto_onへの設定により、作成データが中央にある場合のみNull以外になります。

PCT_CUM_VARIANCE

コンポーネントに記述された分散の累積率。コンポーネントは、記述した分散値に従って降順でランク付けされます。

この列は、dbms_data_mining.svds_scoring_modedbms_data_mining.svds_scoring_pcaに設定されているSVDにのみ存在します

この列は、手動で、またはdbms_data_mining.prep_autodbms_data_mining.prep_auto_onへの設定により、作成データが中央にある場合のみNull以外になります。

SVD DM$VVmodel_viewは、SVDモデルの右特異ベクターを説明しています。PCAモデルの場合、主成分(固有ベクター)を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 VALUE                              BINARY_DOUBLE

表5-65 特異値分解の右特異ベクター

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値。量的属性の場合、ATTRIBUTE_VALUEはNULLです。

VALUE

マトリックスの入力値

ビューDM$VUmodel_nameは、SVDモデルの左特異ベクターを説明しています。PCAモデルの場合、主成分内のデータの予測を説明しています。このビューは、設定dbms_data_mining.svds_u_matrix_outputdbms_data_mining.svds_u_matrix_enableに設定されていない場合、存在しません。このビューには次のスキーマが含まれます。
Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2, DATE, TIMESTAMP, 
                                    TIMESTAMP WITH TIME ZONE,
                                    TIMESTAMP WITH LOCAL TIME ZONE
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 VALUE                              BINARY_DOUBLE

表5-66 特異値分解の左特異ベクターまたは主成分内の予測データ

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CASE_ID

U マトリックス予測によって記述される作成データ内にある、一意の行識別子。

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

VALUE

マトリックスの入力値

特異値分解のグローバルな詳細

次の表は、特異値分解のグローバルな詳細について説明しています。

表5-67 特異値分解のグローバルな詳細

名前 説明

NUM_COMPONENTS

モデルで生成される特徴(コンポーネント)の数

NUM_ROWS

構築で使用される行の合計数

SUGGESTED_CUTOFF

モデルの分散値のほとんどが、計算された上位何個の特徴で取得されているかを示す推奨カットオフ。このカットオフ値よりも少ない数の特徴を使用することが、次元削減における有効な方策です。

5.4.20 最小記述長のモデル・ディテール・ビュー

最小記述長(属性評価の計算用)のモデル・ディテール・ビューは、属性評価ビューを説明しています。GET_MODEL_DETAILS_AIファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

属性評価ビューDM$VAmodel_nameは、属性評価および属性評価ランクについて説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_IMPORTANCE_VALUE                BINARY_DOUBLE
 ATTRIBUTE_RANK                            NUMBER

表5-68 最小記述長の属性評価ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_IMPORTANCE_VALUE

評価の値

ATTRIBUTE_RANK

評価に基づくランク

次の表は、最小記述長のグローバル・ビューについて説明しています。

表5-69 モデル・グローバル・ビューの最小記述長統計情報

名前 説明

NUM_ROWS

構築で使用される行の合計数

5.4.21 ビニングのモデル・ディテール・ビュー

ビニング・ビューDM$VBは、自動データ準備で使用されるビン境界を説明しています。

このビューには次のスキーマが含まれます。

Name                                Type
 --------------------       --------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)   
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)  
 BIN_ID                             NUMBER           
 LOWER_BIN_BOUNDARY                 BINARY_DOUBLE          
 UPPER_BIN_BOUNDARY                 BINARY_DOUBLE   
 ATTRIBUTE_VALUE                    VARCHAR2(4000) 

表5-70 ビニングのモデル・ディテール・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

BIN_ID

ビンID (またはビン識別子)

LOWER_BIN_BOUNDARY

量的ビンの下限

UPPER_BIN_BOUNDARY

量的ビンの上限

ATTRIBUTE_VALUE

質的値

5.4.22 グローバル情報のモデル・ディテール・ビュー

グローバル情報のモデル・ディテール・ビューは、グローバル統計ビュー、アラート・ビューおよび計算済設定ビューを説明しています。GET_MODEL_DETAILS_GLOBALファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

グローバル統計ビューDM$VGmodel_nameは、モデル作成に関連するグローバル統計について説明しています。例として、作成に使用される行数、コンバージェンス・ステータスおよびモデルの質メトリックがあります。このビューには次のスキーマが含まれます。

Name                                Type
 -------------------         --------------------
 PARTITION_NAME                     VARCHAR2(128)
 NAME                               VARCHAR2(30)     
 NUMERIC_VALUE                      NUMBER           
 STRING_VALUE                       VARCHAR2(4000) 

表5-71 グローバル統計ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

NAME

統計の名前

NUMERIC_VALUE

統計の量的値

STRING_VALUE

統計の質的値

アラート・ビューDM$VWmodel_nameは、モデルの作成中に発行されたアラートをリストします。このビューには次のスキーマが含まれます。

Name                                Type
 -------------------       ----------------------
 PARTITION_NAME                     VARCHAR2(128)
 ERROR_NUMBER                       BINARY_DOUBLE
 ERROR_TEXT                         VARCHAR2(4000)  

表5-72 アラート・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ERROR_NUMBER

エラー番号(イベントがエラーのとき有効)

ERROR_TEXT

エラー・メッセージ

計算済設定ビューDM$VSmodel_nameは、アルゴリズムの計算済設定を示します。このビューには次のスキーマが含まれます。

Name                                Type
 -----------------          --------------------
 PARTITION_NAME                     VARCHAR2(128)
 SETTING_NAME                       VARCHAR2(30)
 SETTING_VALUE                      VARCHAR2(4000)

表5-73 計算済設定ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

SETTING_NAME

設定の名前

SETTING_VALUE

設定の値

5.4.23 正規化および欠損値の処理のモデル・ディテール・ビュー

正規化および欠損値の処理ビューDM$VNは、自動データ準備(ADP)で使用される正規化パラメータ、およびNULL値が発生したときの欠損値の置換を説明しています。欠損値の置換は、2次元の列にのみ適用され、ネストされた列には適用されません。

このビューには次のスキーマが含まれます。

Name                                Type
 ----------------------       -----------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 NUMERIC_MISSING_VALUE              BINARY_DOUBLE  
 CATEGORICAL_MISSING_VALUE          VARCHAR2(4000)  
 NORMALIZATION_SHIFT                BINARY_DOUBLE   
 NORMALIZATION_SCALE                BINARY_DOUBLE 

表5-74 正規化および欠損値の処理ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

NUMERIC_MISSING_VALUE

量的欠損値の置換

CATEGORICAL_MISSING_VALUE

質的欠損値の置換

NORMALIZATION_SHIFT

正規化シフト値

NORMALIZATION_SCALE

正規化スケール値

5.4.24 指数平滑法モデルのモデル・ディテール・ビュー

指数平滑法モデル(ESM)のモデル・ディテール・ビューには、モデル出力とグローバル情報のビューが示されます。モデル・ディテール・ビューを利用することをお薦めします。

指数平滑法モデル・アルゴリズムには次のビューがあります。

モデル出力: DM$VPmodel_name

モデル・グローバル情報: DM$VGmodel_name

モデル出力: このビューにより、ESMモデルの結果が得られます。出力には、レコードのセット(パーティション、CASE_ID、値、予測、下限、上限など)が含まれています。これらは、パーティションおよびCASE_ID(時間)で順序付けされています。各パーティションには、個別の平滑化モデルが含まれています。特定のパーティションでは、入力時系列でカバーされるそれぞれの時間(CASE_ID)ポイントで、値は時間ポイントでの観測値または累積値であり、予測はその時間ポイントでの1ステップ先予測です。入力時系列の範囲外のそれぞれの時間ポイント(将来の予測)では、値はNULLになり、予測はその時点のモデル予測になります。上限と下限は、予測に対してユーザーが指定した信頼区間の上限と下限です。

モデル・グローバル情報: このビューには、モデルのグローバル情報と、見積平滑定数、見積初期状態およびグローバル診断メジャーが示されます。

モデルのタイプに応じて、グローバル診断には指数平滑法に関する次の項目の一部またはすべてが含まれます。

表5-75 モデル・グローバル・ビューの指数平滑法モデル統計情報

名前 説明

–2 LOG-LIKELIHOOD

モデルの負の対数尤度

ALPHA

平滑化定数

AIC

赤池情報量規準

AICC

補正済赤池情報量規準

AMSE

ユーザー指定の時間ウィンドウの平均平方誤差

BETA

傾向の平滑化定数

BIC

ベイジアン情報量規準

GAMMA

季節性の平滑化定数

INITIAL LEVEL

観測された系列の開始より1つ前の時間間隔の値のモデル見積

INITIAL SEASON i

観測された系列の開始より1つ前の時間間隔である季節iに対する季節性効果のモデル見積

INITIAL TREND

観測された時系列の開始より1つ前の傾向のモデル見積

MAE

平均絶対誤差のモデル

MSE

平均平方誤差のモデル

PHI

減衰パラメータ

STD

モデル標準誤差

SIGMA

残差のモデル標準偏差