MSET-SPRTモデルのスコアリング

MSET-SPRTモデルを使用したデータのスコアリングは分類アルゴリズムを使用したスコアリングに似ていますが、SPRTの方法では、複数のMSET予測にわたり段階的な変化を追跡するため、順序付けされたデータに依存しています。

これは、行間で状態情報を保持しないという、Oracle Database SQL予測関数の一般的な使用方法とは異なります。

サポートされている関数は、PREDICTIONPREDICTION_COSTPREDICTION_DETAILSPREDICTION_PROBABILITYおよびPREDICTION_SETです。Oracle Database 21cでは、これらの関数は、MSET-SPRTモデルのスコアリングのための構文が新しくなっています。この構文には、履歴データをソートし対象範囲指定するORDER BY句が含まれています。

予測関数からは、次の情報が返されます。

  • PREDICTIONは、レコードに異常のフラグが付いているかどうかを示します。これには、1クラスSVMモデルと同様の自動生成されたラベルが使用されます(正常の場合は1、異常の場合は0)。
  • PREDICTION_COSTは、自動コスト分析またはユーザー指定コストの役割を果たします。通常、ユーザー指定コストでは、不適切なポジティブに、不適切なネガティブより高いコストが割り当てられます。
  • PREDICTION_DETAILSは、予測をサポートするシグナルを重みとともに示します。
  • PREDICTION_PROBABILITYは、統合ロジックに基づいて確実性の測度を示します。
  • PREDICTION_SETは、各観測について、予測のセット(0, 1)、および対応する予測確率を返します。

ノート:

ORDER BY句で指定された1つ以上の列内の値が一意でない場合やデータ・サンプル値の実際の出現順序と等しくない場合は、SPRT予測の有効性や問合せ実行間での一貫性は保証されません。

他の分類モデルと異なり、MSET-SPRTモデルでは、一般に、レコードの異常ラベルに明確な確率測度は関連付けられていません。ただし、統合ロジックによって、確率のかわりに不確実性の測度を生成できます。たとえば、観測5回の期間に2つの異常があるとアラートが生成される場合は、観測5回の期間内に2つの異常が検出されると、確実性として0.5がレポートされます。確実性は、3つより多く異常が検出された場合は向上し、異常が検出されない場合は減少します。

PREDICTION_DETAILS関数は、様々な形式の出力に対応しており、警告をトリガーした個々のシグナルに関して、必要な情報を示すことができます。ランダム投影が実行される場合は、PREDICTIONPREDICTION_PROBABILITYの全体のみが計算され、PREDICTION_DETAILSはレポートされません。

MSETモデルをデプロイする前に、不適切アラートとミス率または統合ロジックなどのSPRTパラメータを調整するために、履歴データをスコアリングする必要があります。SPRTパラメータは、デプロイメントを容易にするために、モデル・オブジェクト内に埋め込まれます。データベースでのスコアリングは履歴データのパラメータ調整および法医学的分析に必要ですが、センサー・データのストリームの監視は、データベースの外部で、IoTサービス内またはエッジ・デバイス自体で、より簡単に実行されます。

モデル作成に使用する列と同じ列が入力スコアリング・データ・セットに存在する場合は、パーティション化されたモデルとしてMSET-SPRTモデルを作成およびスコアリングできます。これらの列が存在しない場合、問合せではエラーが発生します。

関連トピック