Explainを使用したデータの分析

Explainは、機械学習を使用してデータに関する有益なインサイトを検出します。

Explainとは

Explainは、選択された列をそのデータセットのコンテキスト内で分析し、検出したインサイトに関するテキスト説明を生成します。たとえば、任意の列に対して、基本的なファクト、キー・ドライバ、列を説明するセグメントおよび異常が見つかります。

Explainでは、Oracleの機械学習を使用して、データに関する正確で高速で強力な情報を生成し、ワークブックのキャンバスに追加できる対応するビジュアライゼーションを作成します。

Explainは、検索するデータ・トレンドがわからない可能性があるが、キャンバスに列をドラッグ・アンド・ドロップしたり、データ・フローを使用して予測モデルをトレーニングおよび適用する試験的作業に時間を費やしたくないデータ・アナリストを対象としています。

Explainは、データ・アナリストにとって、データ内で検索するトレンドを確認し、その情報を使用して他のデータセットに適用する予測モデルを作成およびチューニングするための有益な開始ポイントでもあります。

インサイトとは

インサイトは、データセットのコンテキスト内で選択された列を説明するカテゴリです。

Explainが提供するインサイトは、選択した列タイプまたは集計に基づいており、選択したメトリックに対して設定された集計ルールに従って変化します。Explainでは、選択した列タイプにとって意味のあるインサイトのみが生成されます。

インサイト・タイプ 説明
基本ファクト 列の値の基本分布を表示します。列データは、各データセットのメジャーに対して分類されます。
このインサイトは、すべての列タイプで使用できます。
  • 選択したメトリックについて、このインサイトは、各属性列の各メンバーに対する集計メトリック値の分布を示します。
  • 選択した属性について、このインサイトは、その属性のメンバー値全体におけるデータセットの各メトリックの値を示します。
キー・ドライバ 選択した列の結果と最高度の相関を持つデータセットの列を表示します。相関する各属性値全体における選択値の分布がチャートに表示されます。

このタブが表示されるのは、属性列を説明する場合か、平均集計ルールを持つメトリック列を説明する場合のみです。

セグメント 列値のキー・セグメント(またはグループ)を表示します。Explainは、データに分類アルゴリズムを実行してデータ値の共通部分を特定し、属性の指定された結果について最高確率を生成するすべてのディメンション全体にわたる値の範囲を識別します。

たとえば、一定の地域に居住する一定の年数教育を受けた一定の年齢範囲の個人グループは、特定の製品を非常に高い確率で購入するセグメントを形成します。

このタブが表示されるのは、属性列を説明する場合のみです。

異常 いずれかの(集計)値が回帰アルゴリズムの予想から大幅に逸脱している一連の値を識別します。

Explainを使用したデータ・インサイトの確認

列を選択してExplain機能を選択すると、Oracle Analyticsは機械学習を使用してデータセットのコンテキスト内で列を分析します。たとえば、Explainは、選択されたデータでキー・ドライバと異常を検索します。

Explainでは、その検索結果がテキスト説明およびビジュアライゼーションとしてユーザーに表示されます。これをワークブックのキャンバスに追加できます。
Explainを列上で実行し、相関する高ランクの列が結果に非常に多く含まれる場合(たとえば、都道府県や市区町村と組み合された郵便番号)、データセットから一部の列を除外して、Explainがよりわかりやすいドライバを識別できるようにします。列の非表示または削除を参照してください。
  1. ホーム・ページで、「作成」「ワークブック」の順にクリックして新しいワークブックを作成します。
  2. 「ビジュアル化」をクリックして、「ビジュアル化」ページを開きます。
  3. 「データ・パネル」で、列を右クリックして「<データ要素>の説明」を選択します。
    「<Data Element>の説明」オプションを表示するには、データセットに対する書込みアクセス権が必要です。
    Explainで属性の分析を正常に行うには、その属性に3から99個までの個別値が含まれる必要があります。
    「説明」ダイアログに、選択した列に関する基本ファクトや異常などの情報が表示されます。
  4. オプション: 「セグメント」ビューで、選択した列の結果を予測するセグメント(またはグループ)を選択します。
    • 1つ以上の列をクリックして、それらがどの程度列の結果に影響を与えるかを参照できます。

    • 「セグメント」での情報の表示方法をソートできます。たとえば、信頼度を高から低へ、または低から高へソートできます。

  5. ワークブックのキャンバスに含めるビジュアライゼーションごとに、それにカーソルを合せて「キャンバスについて選択」をクリックします。
    選択したアイテムの横に緑色のチェックが表示されます。
  6. 「選択項目の追加」をクリックします。
    キャンバスに手動で作成した他のビジュアライゼーションと同様に、Explain (データ・インサイト)ビジュアライゼーションを管理できます。

Explainで使用するデータセットの作成

Explainは、Oracle Analyticsインスタンスに格納されたサブジェクト領域で使用することはできません。ただし、ローカル・サブジェクトからデータセットを作成してから、Explainを使用してデータセットの列を分析できます。

  1. ホーム・ページで、「作成」,、「データセット」の順にクリックします。
  2. 「データセットの作成」ダイアログで、ローカル・サブジェクト領域を選択します。
  3. オプション: 「列の選択」を選択して、使用可能なサブジェクト領域および列を表示、参照および検索します。列を選択して「選択項目の追加」をクリックし、データセットに追加します。
  4. オプション: または、「論理SQLの入力」を選択して問合せを作成するか、「列の選択」領域で選択した列の問合せを変更します。
  5. オプション: 「フィルタを追加するにはここをクリックします」を選択して、列のフィルタ基準を指定します。
  6. 「追加」をクリックしてデータセットを保存し、変換エディタに移動してデータセットのデータを変換およびエンリッチします。
  7. オプション: 「ワークブックの作成」をクリックして、データセットを含むワークブックを作成してから、Explainを使用します。