プライマリ・コンテンツに移動
Oracle® Data Mining概要
12cリリース1 (12.1) B72966-03
目次へ移動
目次
索引へ移動
索引

前
次
次へ

8 相関

監視なしマイニング機能である相関を通じて相関ルールを検出する方法を学習します。

関連項目:

監視なしデータ・マイニングの概要は、「Oracle Data Miningの基礎」を参照してください

相関とは

相関は、ある集合内の項目が同時に発生する確率を見つけるデータ・マイニング機能です。同時に発生する項目間の関係は、相関ルールで表されます。

相関ルール

相関モデルの結果は、データ内の相関のパターンを識別するルールです。Oracle Data Miningでは、相関モデルのスコアリング操作はサポートしていません。

相関ルールを次のように適用できます。

  • 支持度: 各項目がデータで同時に発生する頻度。
  • 信頼度: 後件が前件を含むトランザクションで発生する頻度。
  • 価値: ビジネス価値と項目の相関との関係度

マーケット・バスケット分析

相関ルールは、よく販売トランザクションの分析に使用されます。たとえば、食料品店でシリアルを購入する顧客は同時に牛乳も購入することが多いことがわかっているとします。実際に相関分析を行うと、精算時にシリアルと牛乳の両方が含まれている確率は85%である、という結果が得られます。この関係は、次のルールで表すことができます。

Cereal implies milk with 85% confidence 

相関モデルのこうした応用は、マーケット・バスケット分析と呼ばれています。マーケット・バスケット分析は、ダイレクト・マーケティングや販促活動、ビジネス上の傾向の把握などに役立ちます。また、店舗レイアウト、カタログのデザイン、抱合せ販売などにも活用できます。

相関ルールとE-Commerce

相関モデルは、その他の分野でも重要な用途に応用されています。たとえば、E-Commerceにおいて、Webページのパーソナライズに相関ルールを使用することがあります。相関モデルから、ページAとページBにアクセスするユーザーは70%の確率で同じセッション内でページCにアクセスすることがわかったとします。このルールに基づいて、ページCに関心を持ちそうなユーザー向けに動的なリンクを作成することが可能です。この相関ルールは次のように表されます。

A and B imply C with 70% confidence 

関連項目:

「信頼度」

トランザクショナル・データ

他のデータ・マイニング機能と異なり、相関はトランザクションに基づくマイニング機能です。トランザクション処理では、清算カウンタにおけるマーケット・バスケットの内容などの項目の集まりがケースに含まれます。トランザクションの項目の集まりが、そのトランザクションの1つの属性です。トランザクションに関連するタイムスタンプやユーザーIDなどがその他の属性となります。

マーケット・バスケット・データとも呼ばれるトランザクショナル・データは、レコード(行)のセットでケースが構成されるため、複数レコード・ケースの形式であると言えます。たとえば、次の図で、ケース11は3つの行で構成され、ケース12および13はそれぞれ4つの行で構成されています。

図8-1 トランザクショナル・データ

図8-1の説明が続きます
「図8-1 トランザクショナル・データ」の説明

トランザクショナル・データ以外のデータは、単一レコード(行)でケースが構成されるため、単一レコード・ケースの形式であると言えます。Oracle Data Miningでは、相関モデルは、トランザクショナル・データまたは非トランザクショナル・データのいずれかを使用して作成されます。データは、トランザクショナルではない場合、相関マイニング・アクティビティを実行する前に、ネストした列に変換してトランザクショナルにすることができます。

関連項目:

相関のアルゴリズム

Oracle Data Miningは、高頻度項目セット内の項目に関する相関ルールを計算するときにAprioriアルゴリズムを使用します。