機械翻訳について

3.4.4 評価

診断メトリックを表示し、品質チェックを実行してモデルを評価します。

ディクショナリ・ビューおよびモデル・ディテール・ビューを問い合せれば、モデルのパフォーマンスを測定するのに十分な場合もあります。 ただし、条件付きログ発生確率、平均平方根誤差(AMSE)、赤池情報基準(AIC)などのテスト・メトリックを計算することで、モデルを評価できます。

モデル設定に関する情報

モデルの構築後に生成された様々な統計を調べて、モデルを評価します。 統計はモデルの品質を示します。

  • 予測モデルの設定の確認

    モデル設定、属性係数、適合詳細など、GLMモデル・オブジェクトを介して使用可能なモデル詳細については、次のスクリプトを実行します。

    z.show(ESM_MOD)

    モデル詳細を表示します。

  • グローバルな診断とモデルの品質を確認

    グローバル診断およびモデル設定の確認: 次のスクリプトを実行して、モデルのグローバル統計を表示します。

    z.show(ESM_MOD.global_stats)

    esmモデルのグローバル統計を表示します。

    前述の属性は次のとおりです:

    • -2 Log_LIKELIHOOD: これは、モデルがデータにどの程度適合するかを評価する統計メジャーです。 具体的には、モデルの負の対数発生確率の2倍として計算されます。 通常、値が小さいほど、より適切なモデルが示されます。 多くの場合、モデル全体のパフォーマンスを評価するために、AICやBICなどの基準とともにモデルを比較するために使用されます。
    • AIC: Akaike Information Criterion (AIC)は、モデルの比較に使用されます。 モデルの複雑さを損なう。 AICが低いほど、モデルが向上します。
    • AICC: 修正済赤池情報基準(AICc)は、特にデータ分析のコンテキストでモデル選択に使用される統計メジャーです。 Akaike Information Criterion (AIC)を小さなサンプル・サイズに合わせて調整し、予想されるKullback-Leiblerの不一致をより正確に推定します。 AICcは数学的に定義され、サンプル・サイズに対して多数のパラメータを持つモデルを処理する場合に特に役立ちます。
    • ALPHA: これは、パラメータであり、0から1の範囲です。 指数平滑化algorithm(Holt-Winters)の場合、データの最近の変更に対するキャストの感度を示します。 値が大きいほど感度が高くなります。
    • AMSE: AMSEまたは平均平方根誤差は、実績値と予測値の差異を測定します。 過度の過ちを罰します。 AMSE値が小さいほど、キャスト精度が向上します。

予測

ここでは、次の4四半期の売上を予測します。

  1. 予測売却金額

    モデルESM_MODは、LOWERおよびUPPERの境界を使用して、将来に4つの値を予測します。 結果は降順の時間シーケンスでソートされ、最新のポイントが最初に表示されます。

    z.show(ESM_MOD.prediction.sort_values(by='TIME_SEQ',
              ascending=False))

    esmモデルの予測を示します。

  2. 信頼区間のあるチャート予測AMOUNT_SOLD値

    OML Notebooksで予測を視覚的に表示するには、次の設定を使用して前述の同じ問合せを実行します。

    z.show(ESM_MOD.prediction.sort_values(by='TIME_SEQ'))

    esmモデル予測チャートの設定。


    予測のチャートを表示します。

これで、予測ステップが完了します。 モデルは、次の4四半期の売上を予測することに成功しました。 これにより、売上を追跡でき、製品の仕入れに関するアイデアを得ることもできます。