Oracle Data Miningを使用すると、データベース内の隠れたナレッジを自動的に発見できます。この機能では、異なるデータ属性間の隠れた関連性の発見、一部のサンプルに基づいたデータの分類、およびクラスタ化による固有のパターンの識別が行われます。空間データをマテリアライズして、データ・マイニング・アプリケーションに含めることができます。そのため、Oracle Data Miningを使用すると、特定の区域(近隣、市または地域)内の住民に対する販売予測で、これらの区域の住民は特定のテレビ番組を見る可能性が高いこと、または特定の広告による勧誘に好意的に反応する可能性が高いことを発見できる場合があります。(住所は経度/緯度の点にジオコードされ、Oracle Spatial and Graphジオメトリ・オブジェクトに格納されます。)
多くのアプリケーションで、特定の位置に存在するデータは、近隣のデータの影響を受けます。たとえば、家の価値は、近隣の他の家の価値によって大きく左右されます。この現象は、空間相関(または近隣の影響)と呼ばれます(「空間相関のマテリアライズ」を参照)。Oracle Spatial and Graphの空間分析およびマイニング機能を使用すると、データ項目の位置属性を使用してデータを地域別にビニング(区分)したり(データを北、南、東および西の地域別に分類するなど)、近隣(各店舗から半径2マイル以内の顧客数など)の影響をマテリアライズしたり、同じ場所に存在するデータ項目(ビデオ・レンタル店やピザ・レストランなど)を識別して、空間相関を活用することができます。
空間データのマイニングを実行するには、テーマ・レイヤーを使用して、一連の空間データに対する空間条件および関係をマテリアライズします。各レイヤーには、公園やレクリエーション施設、デモグラフィックな収入データなど、特定の種類の空間データに関するデータ(特定の「テーマ」を持つデータ)が含まれています。空間のマテリアライズは、データ・マイニングを実行する前の前処理手順として実行するか、または空間マイニングの中間手順として実行できます(図8-1を参照)。
図8-1では、次のことに注意してください。
空間データおよび非空間データを含む元のデータが、マテリアライズされたデータを生成するために処理されます。
元のデータ内の空間データが、マテリアライズされたデータを生成するために空間マイニング・ファンクションによって処理されます。この処理には、空間のビニング、近接性、コロケーション・マテリアライズなどの操作が含まれます。
Oracle Data Miningエンジンが、マテリアライズされたデータ(空間および非空間)を処理して、マイニング結果を生成します。
空間情報を処理に加えることでメリットを得る可能性があるデータ・マイニング・アプリケーションの例を次に示します。
ビジネス予測: 他のフランチャイズ店と同じ場所で営業する(ピザ・ハット・レストランとブロックバスター・ビデオ店が同じ場所で営業するなど)ことによって売上が増えるかどうかを判断します。
店舗予測: 大都市から50マイル以内で、消費税制度がない州内の、店舗の立地に適した場所を検索します。(消費税の支払いを回避するために50マイルを運転するのは遠すぎる可能性がありますが、半径50マイルの範囲内で消費税制度がない州の近くに、多くの顧客が住んでいる場合があります。)
病院予測: 近隣に住む患者の人口に基づいて、新しく病院を設立するのに最適な場所を特定します。
空間地域に基づいた分類またはパーソナライズ: 米国南東部に住む特定の年代または所得層の顧客が、ソフト・ロック音楽とハード・ロック音楽のどちらを好むかを判断します。
自動車保険: 任意の顧客の自宅または職場の住所が、事故や自動車盗難の発生率が高い地域内にあるかどうかを判断します。
プロパティ分析: コロケーション・ルールを使用して、高速道路に近接していることと、家の価値または店舗の売上の間の隠れた関連性を発見します。
プロパティ評価: 近隣に立っている類似の家の価値を調べて、差異と空間相関に基づいて家の価値を見積もります。