Explainを使用したデータの分析

Explainは、機械学習を使用してデータに関する有益なインサイトを検出します。

Explainとは

Explainは、選択された列をそのデータ・セットのコンテキスト内で分析し、検出したインサイトに関するテキスト説明を生成します。たとえば、任意の列に対して、基本的なファクト、キー・ドライバ、列を説明するセグメントおよび異常が見つかります。

Explainでは、Oracleの機械学習を使用して、データに関する正確で高速で強力な情報を生成し、プロジェクトのキャンバスに追加できる対応するビジュアライゼーションを作成します。

Explainは、検索するデータ・トレンドがわからない可能性があるが、キャンバスに列をドラッグ・アンド・ドロップしたり、データ・フローを使用して予測モデルをトレーニングおよび適用する試験的作業に時間を費やしたくないデータ・アナリストを対象としています。

Explainは、データ・アナリストにとって、データ内で検索するトレンドを確認し、その情報を使用して他のデータ・セットに適用する予測モデルを作成およびチューニングするための有益な開始ポイントでもあります。

インサイトとは

インサイトは、データ・セットのコンテキスト内で選択された列を説明するカテゴリです。

Explainが提供するインサイトは、選択した列タイプまたは集計に基づいており、選択したメトリックに対して設定された集計ルールに従って変化します。Explainでは、選択した列タイプにとって意味のあるインサイトのみが生成されます。

インサイト・タイプ 説明
基本ファクト 列の値の基本分布を表示します。列データは、各データ・セットのメジャーに対して分類されます。
このインサイトは、すべての列タイプで使用できます。
  • 選択したメトリックについて、このインサイトは、各属性列の各メンバーに対する集計メトリック値の分布を示します。
  • 選択した属性について、このインサイトは、その属性のメンバー値全体におけるデータ・セットの各メトリックの値を示します。
キー・ドライバ 選択した列の結果と最高度の相関を持つデータ・セットの列を表示します。相関する各属性値全体における選択値の分布がチャートに表示されます。

このタブが表示されるのは、属性列を説明する場合か、平均集計ルールを持つメトリック列を説明する場合のみです。

セグメント 列値のキー・セグメント(またはグループ)を表示します。Explainは、データに分類アルゴリズムを実行してデータ値の共通部分を特定し、属性の指定された結果について最高確率を生成するすべてのディメンション全体にわたる値の範囲を識別します。

たとえば、一定の地域に居住する一定の年数教育を受けた一定の年齢範囲の個人グループは、特定の製品を非常に高い確率で購入するセグメントを形成します。

このタブが表示されるのは、属性列を説明する場合のみです。

異常 いずれかの(集計)値が回帰アルゴリズムの予想から大幅に逸脱している一連の値を識別します。

Explainを使用したデータ・インサイトの確認

列を選択してExplain機能を選択すると、Oracle Analyticsは機械学習を使用してデータ・セットのコンテキスト内で列を分析します。たとえば、Explainは、選択されたデータでキー・ドライバおよび異常を検索します。

Explainでは、その検索結果がテキスト説明およびビジュアライゼーションとしてユーザーに表示されます。これをプロジェクトのキャンバスに追加できます。
Explainを列上で実行し、相関する高ランクの列が結果に非常に多く含まれる場合(たとえば、都道府県や市区町村と組み合された郵便番号)、データ・セットから一部の列を除外して、Explainがよりわかりやすいドライバを識別できるようにします。列の非表示または削除を参照してください。

Explainは、機械学習をローカルのOracle Analytics Desktopディレクトリにインストールした後に使用可能になります。「デスクトップのMachine Learningのインストール方法」を参照してください

  1. ホーム・ページで、「作成」をクリックしてから「プロジェクト」をクリックし、新しいプロジェクトを作成します。
  2. 「ビジュアル化」をクリックして、「ビジュアル化」ページを開きます。
  3. 「データ・パネル」で、列を右クリックして「<データ要素>の説明」を選択します。
    Explainで属性の分析を正常に行うには、その属性に3から99個までの個別値が含まれる必要があります。
    「説明」ダイアログに、選択した列に関する基本ファクトや異常などの情報が表示されます。
  4. オプション: 「セグメント」ビューで、選択した列の結果を予測するセグメント(またはグループ)を選択します。
    • 1つ以上の列をクリックして、それらがどの程度列の結果に影響を与えるかを参照できます。

    • 「セグメント」での情報の表示方法をソートできます。たとえば、信頼度を高から低へ、または低から高へソートできます。

  5. プロジェクトのキャンバスに含めるビジュアライゼーションごとに、それにカーソルを合せて「キャンバスについて選択」をクリックします。
    選択したアイテムの横に緑色のチェックが表示されます。
  6. 「選択項目の追加」をクリックします。
    キャンバスに手動で作成した他のビジュアライゼーションと同様に、Explain (データ・インサイト)ビジュアライゼーションを管理できます。