使用異常偵測來管理資產和預測性維護

異常偵測是資料中很少見的項目、事件或監測項目的識別,與預期值大致不同。這在許多產業中都用於資產監控與維護。

「異常偵測服務」可協助您不需統計或機器學習專家,即可偵測時間序列資料的異常。它提供預先建立的演算法,並自動解決資料問題。這是可透過 REST API 存取的雲端原生服務,可連線至許多資料來源。OCI 主控台、CLI 以及 SDK 可讓您輕鬆地在端對端解決方案中使用。

在此參照架構中,我們會標示與其他 OCI 資料服務搭配運作的 Oracle Cloud Infrastructure 異常偵測服務如何協助下列使用案例:

資產管理
資產管理著重於資產的最佳作業,以確保符合營運單位標準與重要績效指標,如總產出/輸出、報廢、品質、安全及良品率。
預測性維護
預測性維護是關於成本避免和最小化提高費用的作業性疾患,例如排定額外班次、付款加班、運費費費用與其他成本。
智慧製造
智慧製造涉及尋找方式來改善營運效率,以增加收入與利潤。「異常偵測」可尋找模式以預測製造週期中早期的良品率與產品瑕疵,以及追蹤產品以分析影響,進而增加總產出與輸出、改善品質及減少報廢。

架構

此參考架構有三個主要階段:「收集」、「分析」及「行動」。在這些階段內有八個技術階段。

下圖說明此參考架構。

architecture-anomaly-detection.png 的描述如下
architecture-anomaly-detection.png 圖解描述

架構包含下列元件:

託收
收集階段具有下列階段:
  • 產生資料的裝置、感應器和輸入項。
  • 收集資料的集線器、閘道或邊緣。
  • 以批次、串流處理、間隔、即時或其他方法處理的資料傳輸。
  • 存資料以供分析、管理和未來使用。
分析
  • 策展

    涉及管理資料,讓參與資料尋找和分析的使用者更為有用。這包括來自各種來源的資料集合,並將其整合至儲存區域。資料策展包括資料驗證、封存、管理、保存擷取和表示法

  • 預先處理

    涉及修正與 IoT 時間序列資料收集關聯的一般問題,例如時鐘同步不相符、遺漏值以及低訊號對雜訊比率

  • 模型訓練

    演算法是針對完整且無異常的範例資料進行訓練。這會建立用來比較即時資料的模型。

  • 異常偵測

    識別資料中樣式與異常的機器學習演算法。

    「異常偵測服務」是一組可探勘大量資料並尋找樣式和異常的演算法。它是三種技術的組合:

    • 智慧型資料前置處理 (IDP):

      這些是專利演算法,設計用來修正與收集 IoT 時間序列感應器資料相關的一般問題。它們會視需要由服務自動套用。IDP 技術的範例包括:

      • 分析重新抽樣處理 (ARP)

        ARP 有助於處理不同抽樣率 (時鐘不相符問題)。它使用內插抽樣/降抽樣方法來產生所有遙測時間序列的統一抽樣間隔。

      • 遺漏值計算 (MVI)

        MVI 有助於以智慧方式強制遺漏值。它使用內插值與 MSET 預估的組合,以智慧型方式植入窗簾點 (遺漏值)。

      • UnQuantization (UnQ)

        UnQ 有助於將低解析度信號轉換成較高的解析度

    • 多變量狀態預估技術 (MSET)

      此演算法是用來學習時間序列資料集中多個訊號之間的關係,以獲得智慧型預估。

    • 循序機率比率測試 (SPRT)

      此測試使用 MSET 的資料提早偵測異常。

行動
  • 使用者介面

    用於簡報容易瞭解的 Applet、儀表板、圖形、具有「作業」、「管理」或「資料科學家」等角色的人員圖表。

  • 業務處理

    將結果併入標準業務交易應用程式的處理,以觸發建立服務要求、採購單、銷售訂單或遠端韌體更新等動作。與其他系統和工具的整合可以將錯誤降到最低、改善生產力,以及加速執行速度。

建議

您的需求可能會與此處描述的架構不同。使用下列建議作為起點。

下圖顯示可在此架構中使用的部分 Oracle 服務。

solution-anomaly-detection.png 描述如下
solution-anomaly-detection.png 圖解描述
  • 閘道

    這可以是針對特定感應器資料收集所設計的自訂中樞。它也可以是資料庫,例如 Oracle Autonomous Data Warehouse、Oracle NoSQL 或其他資料庫。

  • 傳輸

    資料整合:使用 Oracle Cloud Infrastructure Data Integration 將所有歷史記錄資料離線移轉至物件儲存。資料傳輸至物件儲存之後,即可供所有 OCI 服務存取。

    串流處理:使用「Oracle Cloud Infrastructure 串流處理」即時擷取物件儲存中所能使用或儲存的事件和資料。

  • 物件儲存

    Oracle Cloud Infrastructure Object Storage 是此架構中的預設儲存體。所有資料都必須儲存在所有服務的物件儲存中。所有結構化、半結構化及非結構化資料都可以儲存在物件儲存中。

  • UI 與業務處理整合
    • Oracle Analytics Cloud

      Analytics Cloud 可用來建立儀表板、Applet、視覺化、報表以及其他分析。

    • Oracle Cloud Infrastructure 資料科學

      這可用來讀取來自不同來源的資料,以便在記事本階段作業中使用 Python 程式庫來建立視覺化。

    • Oracle Cloud Infrastructure 資料整合

      這可用來將「異常偵測」解決方案整合至商業應用程式,以進行自動化工作流程處理、提供通知給人員,以及許多其他使用案例。

注意事項

建置異常偵測解決方案時,請考慮這些實行選項。

指引 建議 其他選項 理由
感應器 從設計且已安裝在設備上的感應器開始。您可以隨時新增非侵入性感應器,以提供其他監督功能。 Oracle 合作夥伴網路有許多銷售感應器的產業與區域整合商和重新執行者,可協助部署部分或全部的異常偵測解決方案。 將傳統感應器新增至目前安裝的設備通常很難。新感應器 (例如振動和聲響共振感應器 (VARS)) 不明且容易安裝。請考慮新增這些類型的感應器,而非傳統感應器。
傳輸 涉及資產管理、預測性維護或智慧製造的大部分異常偵測使用案例不需要即時監控。每幾分鐘批次傳輸一次資料是一個更容易設計及部署的架構。此外,在評估異常偵測解決方案時,請使用時間序列感應器資料的歷史檔案。
  • 串流服務可用於即時或接近即時異常偵測。
  • 您也可以在邊緣偵測異常,但增加額外的複雜性。
視感應器的類型、數目及抽樣率而定,架構可能會明顯有所不同。有些使用案例可以批次傳送資料以進行偵測,而其他使用案例則接近邊緣的即時偵測,可能與公有雲結合。其他使用案例需要即時偵測安全、安全、通知、無法使用或不可靠的通訊功能,或其他原因。這必須仔細評估並加以建構,才能到達成功的解決方案。
儲存 物件儲存是「異常偵測服務」的偏好儲存方法 Autonomous Data Warehouse 可用來儲存結構化資料,以加快擷取速度。您可以從資料整合、資料流程或任何其他服務將資料寫入資料倉儲。「資料倉儲」也是服務和展示存放區。 物件儲存是網際網路的高效能儲存平台,提供可靠且高效益的資料持久性。
異常偵測 若要確保「異常偵測服務」的效能最佳,請務必使用非異常資料來訓練 ADS 模型。這需要從歷史資料檔中移除異常,使其代表理想設備作業的「黃金映像檔」。   如果未從訓練模型資料中移除異常,則會假設那些異常仍為最佳化的一般作業。因此,因為已就地訓練模型,所以不會將它們識別為異常
UI 您可以使用 Oracle Analytics Cloud 來建立使用者介面,以解決偵測到的情況以及更正方式。通知可以是視覺化、工作流程、Applet、儀表板等。   偵測到異常之後,請務必瞭解要採取哪些動作來更正情況。可能有許多必須通知的個人。為這些個人開發適當的使用者介面會對您的異常偵測使用案例造成重大影響。
業務處理整合 使用 Oracle Integration Cloud 將您的「異常偵測」解決方案連線至可自動回應偵測到的異常的後端應用程式。  

將異常偵測解決方案連線至後端應用程式,可改善處理異常時回應的速度和準確性。根據異常的類型和嚴重度,以下是一些如何讓此整合成為重要值的範例:

  • 已識別低存貨層次會向自動產生的補貨採購單發出信號。
  • 已預測元件失敗,導致處理現場技術人員的服務回報項目。
  • 智慧工作流程會根據經歷時間自動呈報通知訊息。

更多資訊