機械翻訳について

モデルの有効性の解釈

モデルを作成した後、モデルが予測を行う精度を判断するためにモデルを評価します。 たとえば、Naive Bayesスクリプトがサンプル・データに対して2項分類を実行する方法を評価すると、そのスクリプトを使用するか別のスクリプトを使用するかを決定できます。

トレーニング・モデルのデータ・フローを実行すると、モデルの解釈や絞込みに使用する出力が生成されます。
  1. ナビゲータ・アイコンをクリックし、「機械学習」を選択します。
    機械学習には、「スクリプト」タブと「モデル」タブが表示されます。
  2. トレーニング・モデルのデータ・フロー出力を表示するには、「モデル」タブを表示します。
    すべてのモデルが表示されます。
  3. モデルのメニュー・アイコンをクリックし、「検査」オプションを選択します。
    3つのタブが表示されます: 一般品質、および関連です。
  4. (オプション)「一般」をクリックします。
    このページには、次のモデルに関する情報が表示されます:
    • 「予測」 - モデルが予測しようとしているものの名前(たとえば、IncomeLevelについてのもの)。

    • 「トレーニングされた」 - モデルをトレーニングするために使用しているデータセットの名前。

    • 「スクリプト」 - モデルで使用されるスクリプトの名前。

    • 「クラス」 - スクリプトのクラス(例えば、バイナリ分類)。

  5. (オプション)「品質」をクリックします。
    トレーニング・データ・セットの(構成可能な)一部は検証の目的で確保されています。 モデルが構築されると、既知のラベルがある検証データ・セットに適用されます。 精度やリコールといった各種のメトリック・セットは実績(ラベル)および予測値に基づいて計算されます。 情報はマトリックスとしても表示され、これを使用すると、検証時に検出された内容の簡単なサマリーを簡単に表示できます。 たとえば、給与が$ 50,000を超える検証データにおける個人の特定の比率(X)の場合、給与が$ 50,000を超える個人についてモデルでy %と予測されます。

    「品質」ページに次のように表示されます。

    • 標準メトリックのリスト。表示されるメトリックは選択したモデルに関連します。 各メトリックは、トレーニング・モデルを適用する選択されたデータ・セット列の予測精度に関して、モデルがどの程度良好であるかを判断するのに役立ちます。

      たとえば、1人の給与が$ 50,000より多いと思われる場合に、所得レベル列をモデル化して(各個人の他の値の範囲に基づいて)予測できます。

    • マトリックスには、予測の作成に使用されたデータの状態が表示されます。

      マトリックスでは実際の値と予測値が対比され、予測値が実際の値に近いかどうかを知るのに役立ちます。

    この情報を使用して、モデルに戻って必要に応じて変更を加えることができます。

  6. (オプション)「関連」をクリックします。
    「関連」タブには、機械学習スクリプトで作成されたデータ・セットが表示されます。 データ・セットには、上級ユーザー(データ科学)がモデルを理解するために使用できるスクリプト・ロジックに関連する特定の情報が含まれます。
    このページには、次のトレーニング・データが表示されます:
    • 「トレーニング・データ」 - データセットはモデルを訓練するために使用されます。

    • 「生成されたデータ」 - トレーニング・モデル用に使用するスクリプトによって作成されたデータセット(たとえば、obiee.CART.train)。 モデルのトレーニングに他のスクリプトを選択した場合、表示されるデータ・セットは異なる可能性があります。