機械翻訳について

モデルの有効性の解釈

モデルを作成すると、そのモデルに関する情報およびデータがどのように解釈されるかを調べることができます。 その情報を使用してモデルを変更できます。

トレイン・モデル・データ・フローを実行すると、解釈可能な出力が生成され、それに基づいてモデルを調整できます。
  1. ナビゲータ・アイコンをクリックし、「機械学習」を選択します。
    機械学習には、「スクリプト」タブと「モデル」タブが表示されます。
  2. トレイン・モデルのデータ・フロー出力を表示するには、「モデル」タブを表示します。
    これにより、作成されたすべてのモデルが表示されます。
  3. モデルのメニュー・アイコンをクリックし、「検査」オプションを選択します。
    3つのタブが表示されます: 一般品質、および関連です。
  4. (オプション)「一般」をクリックします。
    このページには、次のモデルに関する情報が表示されます:
    • 「予測」 - モデルが予測しようとしているものの名前(たとえば、IncomeLevelについてのもの)。

    • 「トレーニングされた」 - モデルをトレーニングするために使用しているデータセットの名前。

    • 「スクリプト」 - モデルで使用されるスクリプトの名前。

    • 「クラス」 - スクリプトのクラス(例えば、バイナリ分類)。

  5. (オプション)「品質」をクリックします。
    トレーニング・データ・セットの(構成可能な)一部は検証の目的で確保されています。 モデルが構築されると、既知のラベルがある検証データ・セットに適用されます。 精度やリコールといった各種のメトリック・セットは実績(ラベル)および予測値に基づいて計算されます。 情報はマトリックスとしても表示され、これを使用すると、検証時に検出された内容の簡単なサマリーを簡単に表示できます。 たとえば、検証データ・セット内の特定の割合(X)の人が$50000を超えると予測されますが、モデルでは同じになっている人々のy%と予測されます。

    「品質」ページに次のように表示されます。

    • 標準メトリックのリスト。表示されるメトリックは選択したモデルに関連します。 各メトリックは、トレイン・モデルを適用する選択されたデータ・セット列の予測精度に関して、モデルがどの程度良好であるかを判断するのに役立ちます。

      たとえば、だれかの所得水準が$50000を超える可能性が高い場合に、所得レベル列を(各人の他の値の範囲に基づいて)モデル化して予測できます。

    • マトリックスには、予測の作成に使用されたデータの状態が表示されます。

      マトリックスでは実際の値と予測値が対比され、予測値が実際の値に近いかどうかを知るのに役立ちます。

    この情報を使用して、モデルに戻って必要に応じて変更を加えることができます。

  6. (オプション)「関連」をクリックします。
    関連タブは、モデルを構築するために実行されたときにマシン学習スクリプトによって生成されたデータセットを取得します。 データ・セットではスクリプト・ロジックに関連する特定の情報が取得されるため、上級ユーザー(データ・サイエンティスト)は作成されたモデルについてより深いインサイトを得ることができます。
    このページには、次のトレーニング・データが表示されます:
    • 「トレーニング・データ」 - データセットはモデルを訓練するために使用されます。

    • 「生成されたデータ」 - トレーニング・モデル用に使用するスクリプトによって作成されたデータセット(たとえば、obiee.CART.train)。 モデルのトレーニングに他のスクリプトを選択した場合、表示されるデータ・セットは異なる可能性があります。