1.20 Oracle Machine LearningアルゴリズムのRDFデータへの適用

Oracle Machine LearningアルゴリズムはRDFデータに適用できます。

Oracle Data Miningでは、1つの表またはビューにデータが必要であり、各行は1つのケースを表します。したがって、RDFデータはこの構造体を模倣したビューとして定義する必要があります。これは次のようにして行います。

  1. 対象となる述語P1、P2、P3、…、Pnを確認します。

  2. 列(S、C1、C2、C3、…、Cn)のあるビューを作成します。ここで、列は主語P1、P2、…Pnに対応します。

    表に定義する必要のあるテキスト列など、要件に応じて表を作成することもできます。

    TO_NUMBERまたはCAST関数を使用して数値を変換します。

    たとえば、次のようにします。

    CREATE VIEW ML_TAB (S, C1, C2, C3, … , Cn)
    AS 
    SELECT subj, O1, to_number(O2), CAST (O3 AS INTEGER), ... , On
    FROM TABLE(SEM_MATCH( 
    'SELECT ?subj ?O1 ?O2 ?O3 … ?On 
     WHERE { 
       OPTIONAL { ?subj P1 ?O1 } 
       OPTIONAL { ?subj P2 ?O2 } 
       OPTIONAL { ?subj P3 ?O3 } 
    ….
       OPTIONAL { ?subj Pn ?On } 
     }' 
    , SEM_MODELS('M1')
    ,null, null, null, null)); 
    

    ビューは次のように表示されます。

    SQL> SELECT * FROM ML_TAB;
    S	       C1                        C2		     C3
    ---------- -------------------- -------------------- --------------------
    S1	       O11		      O21		      O31
    S2	       O21				               O32
    S3	   		             O23
    

この構造を定義したら、このビューにOracle Machine Learningアルゴリズムを直接適用できます。Oracle Data Miningでは、次の3つのタイプの属性を扱います。

  • 量的属性
  • 質的属性
  • 非構造化テキスト

3つの属性タイプのデータ型に基づいて、データを3つのグループに分割する必要があります。