了解如何检测异常以预测故障

分析检测是指识别数据中与期望有巨大差异的罕见项、事件或观察结果。这在许多行业中用于资产监视和维护。

已建立的资产维护方法为被动(失败时替换)或规范性(根据使用或时间替换)。除了资产更换或维修的实际成本之外,组织还必须承担可靠性、停机和供应链积压相关的成本。可提供即将发生的故障预警的异常检测服务可以降低这些成本。

Oracle Cloud Infrastructure 异常检测服务可帮助您检测时间序列数据中的异常,而无需统计人员或机器学习专家。它提供预构建的算法,并自动解决数据问题。它是一种可通过 REST API 访问的云原生服务,并且可以连接到多个数据源。利用 OCI 控制台、CLI 和 SDK,您可以轻松使用端到端的解决方案。

体系结构

此体系结构显示了异常检测服务在工作流中的位置。

根据具体需求,数据使用 OCI 流处理和 / 或 OCI 数据集成服务进行收集。系统可以处理批处理和流式处理工作量。

该工作流有两个主要阶段:培训和检测。在培训阶段,数据经过清理和准备进行培训,然后对模型进行培训和部署。在检测阶段,异常检测会检测生产数据中的异常。报告异常并根据预测执行操作。

概述 .png 的说明如下
插图 Overview.png 的说明

以下是进程的说明,大致如下:

  1. 数据摄取自一个或多个数据源并存储在对象存储中。
  2. 一个或多个工具用于准备数据,以便在培训阶段对模型进行培训,以及生产阶段可能需要的任何预处理。结果存储在对象存储中(未显示)。
  3. 异常检测服务在培训阶段构建模型,并在生产阶段运行异常检测算法。
  4. 异常检测过程的结果将发送到使用数据并准备呈现给最终用户的一个或多个应用程序。

概览

我们的异常检测服务的核心算法是 Oracle 许可的多变量时间序列异常检测算法,称为 MSET。

MSET 是一种非线性非参数化异常检测机器学习技术,可根据受监视信号正常运行序列中的历史数据校准系统的预期行为。它将系统的学习行为纳入表示正常估计行为的持久性模型。它最初由 Oracle Labs 开发,并在多个行业中成功用于预测分析。

异常检测服务概念

  • 项目:项目是用于组织数据资产、模型、部署和检测门户的协作工作区。
  • 数据资产:数据资产是数据源的抽象数据表示形式。数据资产位于对象存储中。它可以是为模型培训阶段清理和准备的培训数据。它可以是生产数据,在对模型进行培训和部署后提供给异常检测服务。
  • 模型:从培训数据资产创建的机器学习模型。
  • 部署:模型培训完成后,将部署该培训。这使其可用于异常检测过程。
  • 检测:这是向部署的模型呈现生产数据以查找生产数据异常的过程。

异常检测流程

在较高级别,以下是完成使用异常检测服务的完整周期的过程。

  1. 创建项目。项目是您在同一工作区中收集和组织不同资产、模型和部署的位置。
  2. 创建数据资产。这是提供给异常检测服务的生产数据,以供分析。
  3. 训练模型。指定培训数据资产和培训参数后,培训异常检测模型。培训可能需要五分钟或更多时间,具体取决于数据资产的规模以及您选择的假警报概率。
  4. 部署模型。对模型进行培训后,对其进行部署。
  5. 使用新数据进行检测。将具有与培训数据相同的属性的生产数据发送到部署端点,或者将其上载到部署 UI。

请注意,一个项目可以有多个数据资产、多个模型和多个部署。