瞭解偵測異常值以預測失敗

異常偵測是資料中很少見的項目、事件或監測項目的識別,與預期值大致不同。這在許多產業中都用於資產監控與維護。

建立的資產維護方法為反應 (失敗時取代) 或規定 (根據使用狀況或時間取代)。除了取代或維修資產的實際成本外,組織還必須負擔與可靠性、停機時間及供應鏈未交訂單相關聯的成本。提供即將失敗之提早警告的異常偵測服務可以降低這些成本。

Oracle Cloud Infrastructure Anomaly Detection 服務可協助您偵測時間序列資料中的異常,而不需要靜態或機器學習專家。它提供預先建立的演算法,並自動解決資料問題。這是可透過 REST API 存取的雲端原生服務,可連線至許多資料來源。OCI 主控台、CLI 以及 SDK 可讓您輕鬆地在端對端解決方案中使用。

架構

此架構顯示「異常偵測」服務在工作流程中適用的位置。

視需求而定,會使用 OCI 串流處理、OCI 資料整合服務或兩者來擷取資料。系統可以處理批次工作負載和串流工作負載。

工作流程有兩個主要階段:訓練和偵測。在訓練階段,資料會被清除並準備進行訓練,然後模型會受到訓練和部署。在偵測階段,「異常偵測」會偵測生產環境資料中的異常。系統會報告異常值,並根據預測採取動作。

overview.png 的描述如下
overview.png 圖解描述

以下是程序的說明,廣泛的詞彙包括:

  1. 系統會從一或多個資料來源擷取資料,並儲存在物件儲存中。
  2. 一或多個工具可用來準備訓練階段期間模型的資料,以及實際執行階段可能需要的任何前置處理。結果會儲存在物件儲存中 (不顯示)。
  3. 「異常偵測」服務會在訓練階段建置模型,並在生產階段執行異常偵測演算法。
  4. 異常偵測處理作業的結果會傳送給一或多個使用該資料的應用程式,並準備供一般使用者呈現。

概觀

「異常偵測」服務的核心演算法是一個稱為 MSET 的 Oracle 特別多變量時間序列異常偵測演算法。

MSET 是一種非線性非參數式異常偵測機器學習技術,可根據受監督信號一般作業順序的歷史資料,校正系統的預期行為。它會將系統的已知行為併入代表一般預估行為的永久模型中。它原本是由 Oracle Labs 所開發,並已順利用於數個產業以進行診斷分析。

異常偵測服務概念

  • 案:專案工作區是組織資料資產、模型、建置項目以及偵測入口網站的協作工作區。
  • 資料資產:一個資料資產是資料來源的抽象資料表示法。資料資產位於物件儲存中。這可以是針對模型訓練階段清除和準備的訓練資料。它可以是實際環境執行資料,它可以在訓練並建置模型之後呈現給「異常偵測服務」。
  • 模型:從訓練資料資產建立的機器學習模型。
  • 置:完成模型訓練時,會加以建置。這可讓它用於異常偵測處理作業。
  • 測:這是向已建置模型展示生產資料,以便在生產環境資料中尋找異常的處理作業。

異常偵測處理

在高層級中,這是完成使用異常偵測服務之完整週期的程序。

  1. 建立專案。專案是您收集與組織相同工作區中不同資產、模型及部署的地方。
  2. 建立資料資產。這是呈現給「異常偵測服務」以進行分析的生產資料。
  3. 訓練模型。指定訓練資料資產和訓練參數之後,請訓練異常偵測模型。訓練可能需要五分鐘或更長的時間,視資料資產的大小以及您選擇的假警示機率而定。
  4. 部署模型。訓練好模型之後,請加以部署。
  5. 使用新資料偵測。將與訓練資料相同屬性的生產資料傳送至部署端點,或將其上傳至部署 UI。

請注意,一個專案可以有多個資料資產、多個模型、多個部署。