Explainを使用したデータの分析

Explainは、機械学習を使用してデータに関する有益なインサイトを検出します。

Explainとは

Explainは、選択された列をそのデータ・セットのコンテキスト内で分析し、検出したインサイトに関するテキスト説明を生成します。Explainは、プロジェクトのキャンバスに追加できる、関連するビジュアライゼーションを作成します。

Explainは、Oracleの機械学習を使用して、データに関する正確で迅速かつ強力な情報を生成します。Explainを使用するには、データ・セットの列を選択して「説明」オプションを選択します。Explainでは、機械学習の統計分析が自動的に適用され、データ内で最も重要なパターン、相関(ドライバ)、分類および異常が検出されます。その後、Explainによって、検出されたインサイトを表示するビジュアライゼーションが返されます。ユーザーは、ビジュアライゼーションを選択してプロジェクト・エディタを開き、ビジュアライゼーションをカスタマイズしてデータを詳細にドリルできます。

たとえば、会社の従業員減少に関する情報を検索するとします。まだ組織にいる従業員に対し、組織を退職した従業員について、減少情報および様々なプロファイル属性を含むデータ・セットを使用してプロジェクトを作成します。減少列で「説明」を選択すると、従業員減少のキー・ドライバの1つが婚姻ステータスであることがわかります。

Explainは、検索するデータ・トレンドがわからない可能性があるが、キャンバスに列をドラッグ・アンド・ドロップしたり、データ・フローを使用して予測モデルをトレーニングおよび適用する試験的作業に時間を費やしたくないデータ・アナリストを対象としています。

Explainは、データ・アナリストにとって、データ内で検索するトレンドを確認し、その情報を使用して他のデータ・セットに適用する予測モデルを作成およびチューニングするための有益な開始ポイントでもあります。

インサイトとは

インサイトは、データ・セットのコンテキスト内で選択された列を説明するカテゴリです。

Explainが提供するインサイトは、選択した列タイプまたは集計に基づいており、選択したメトリックに対して設定された集計ルールに従って変化します。Explainでは、選択した列タイプにとって意味のあるインサイトのみが生成されます。

インサイト・タイプ 説明
基本ファクト 列の値の基本分布を表示します。列データは、各データ・セットのメジャーに対して分類されます。
このインサイトは、すべての列タイプで使用できます。
  • 選択したメトリックについて、このインサイトは、各属性列の各メンバーに対する集計メトリック値の分布を示します。
  • 選択した属性について、このインサイトは、その属性のメンバー値全体におけるデータ・セットの各メトリックの値を示します。
キー・ドライバ 選択した列の結果と最高度の相関を持つデータ・セットの列を表示します。相関する各属性値全体における選択値の分布がチャートに表示されます。

このタブが表示されるのは、属性列を説明する場合か、平均集計ルールを持つメトリック列を説明する場合のみです。

セグメント 列値のキー・セグメント(またはグループ)を表示します。Explainは、データに分類アルゴリズムを実行してデータ値の共通部分を特定し、属性の指定された結果について最高確率を生成するすべてのディメンション全体にわたる値の範囲を識別します。

たとえば、一定の地域に居住する一定の年数教育を受けた一定の年齢範囲の個人グループは、特定の製品を非常に高い確率で購入するセグメントを形成します。

このタブが表示されるのは、属性列を説明する場合のみです。

異常 いずれかの(集計)値が回帰アルゴリズムの予想から大幅に逸脱している一連の値を識別します。

Explainを使用したデータ・インサイトの確認

列を選択してExplain機能を選択すると、Oracle Analyticsは機械学習を使用してデータ・セットのコンテキスト内で列を分析します。たとえば、Explainは、選択されたデータでキー・ドライバと異常を検索します。

Explainでは、その検索結果がテキスト説明およびビジュアライゼーションとしてユーザーに表示されます。キー・ビジュアライゼーションを選択してプロジェクトのキャンバスに追加できます。
  1. ホーム・ページで、「作成」をクリックしてから「プロジェクト」をクリックし、新しいプロジェクトを作成します。
  2. 「ビジュアル化」をクリックして「ビジュアル化」キャンバスを開きます。
  3. 「データ・パネル」で、列を右クリックして「<データ要素>の説明」を選択します。
    「<Data Element>の説明」オプションを表示するには、データ・セットに対する書込みアクセス権が必要です。
    Explainで属性の分析を正常に行うには、その属性に3から99個までの個別値が含まれる必要があります。
    「説明」ダイアログに、選択した列に関する基本ファクトや異常などの情報が表示されます。
  4. オプション: 「セグメント」ビューで、選択した列の結果を予測するセグメント(またはグループ)を選択します。
    • 1つ以上の列をクリックして、それらがどの程度列の結果に影響を与えるかを参照できます。

    • 「セグメント」での情報の表示方法をソートできます。たとえば、信頼度を高から低へ、または低から高へソートできます。

  5. オプション: 相関する高ランクの列が結果に非常に多く含まれる場合(たとえば、都道府県や市区町村と組み合された郵便番号)、データ・セットから一部の列を除外して、より意味のあるドライバをExplainが識別できるようにします。
    これを行うには、Explainを終了し、「準備」キャンバスに移動して列を非表示にするか削除して、「ビジュアル化」キャンバスに戻り、列を特定して右クリックし、「<データ要素>の説明」を選択します。
  6. プロジェクトのキャンバスに含めるビジュアライゼーションごとに、それにカーソルを合せてチェックマークをクリックします。
  7. キャンバスに含めるすべてのビジュアライゼーションを選択したら、「選択項目の追加」をクリックします。キャンバスに手動で作成した他のビジュアライゼーションと同様に、Explain (データ・インサイト)ビジュアライゼーションを管理できます。

Explainで使用するローカル・サブジェクト領域の作成

Explainは、サブジェクト領域では使用できません。この問題を回避するには、サブジェクト領域を使用してローカル・サブジェクト領域を作成します。その後、Explainを使用してローカル・サブジェクト領域の列を分析できます。

  1. 「ホーム」ページで、「作成」「データ・セット」の順にクリックします。
  2. 「ローカル・サブジェクト領域」をクリックします。
  3. 「データ・セットの追加」エディタで、サブジェクト領域をダブルクリックし、ローカル・サブジェクト領域に列を追加します。
  4. オプション: 「フィルタ」ステップをクリックし、フィルタを設定する列と値を選択します。
  5. オプション: 「サンプル」ステップをクリックし、「説明」フィールドの説明を更新します。
  6. 「追加」をクリックします。
    「結果」ダイアログですぐに「プロジェクトの作成」ボタンをクリックすることも、後でホーム・ページの「作成」ボタンをクリックしてプロジェクトを作成することもできます。プロジェクトの「準備」キャンバスで、列を右クリックして「<データ要素>の説明」を選択します。