Algorithmes de détection d'anomalies

Le service de détection d'anomalies utilise des algorithmes d'apprentissage automatique pour apprendre les modèles et détecter les anomalies d'un jeu de données.

Les algorithmes à une seule variable sont ceux qui fonctionnent avec un seul signal ou capteur. Typiquement, ces algorithmes construisent un modèle par signal qui sont utilisés pour identifier des anomalies dans le capteur ou le signal. Utilisez le service de détection d'anomalies pour entraîner un modèle unique pour plusieurs signaux dans un jeu de données en gérant le mappage du capteur ou du signal au modèle en interne.

Par défaut, l'entraînement du modèle est effectué à l'aide d'algorithmes à une seule variable. Toutefois, vous pouvez remplacer ce comportement à l'aide de l'API de détection d'anomalies.

Algorithme à une seule variable

Le service de détection d'anomalies vous aide à identifier les anomalies dans un jeu de données à une seule variable.

Les données d'entraînement et de test peuvent uniquement contenir des horodatages et d'autres attributs numériques qui représentent généralement des lectures de capteurs ou de signaux.

graphique montrant les niveaux de sucre dans le sang sur une période, y compris les horodatages
  • Types de modèles de série chronologique à une seule variable que le service de détection d'anomalies peut identifier avec précision :

    • Modèles saisonniers

    • Tendance fixe

    • Augmentation et diminution continues des jeux de données de tendance linéaire

  • Types d'anomalies que le service de détection d'anomalies peut identifier avec précision :

    • Anomalies de points

    • Spike

L'algorithme à une seule variable crée un modèle par signal et est l'un des meilleurs algorithmes d'apprentissage automatique classiques. Les signaux considérés comme des corrélations faibles par MSET2 sont automatiquement traités comme des signaux à une seule variable à l'aide de cet algorithme.

L'algorithme à une seule variable n'est pas autonome et utilise l'API existante basée sur plusieurs variables avec le même format d'entrée de données. Le modèle à une seule variable de chaque signal univariable est créé, optimisé et enregistré indépendamment. En outre, les modèles sont utilisés pour l'inférence séparément.

Capacité

Il détecte les anomalies dans un signal en considérant ses modèles de série chronologique et fonctionne sur des anomalies ponctuelles ou contextuelles.

Exigences
  • Le jeu de données de détection peut comporter des points de données anormaux.

  • Jeu de données d'entraînement et d'inférence contenant uniquement des valeurs numériques. Les valeurs catégorielles ou nominales ne sont pas prises en charge.
  • L'algorithme utilise une approche d'ingénierie des fonctions basée sur une fenêtre. Il nécessite une taille de fenêtre supplémentaire de données avant l'entraînement réel ou la détection de données pour apprendre les modèles ou les anomalies de détection. Le nombre minimum total est de 80 horodatages.
  • Tous les différents scénarios normaux sont inclus dans le jeu de données d'entraînement. Par exemple, au moins un cycle de gestion dans la partie entraînement.
Cas d'utilisation

Des cas d'utilisation de détection d'anomalie à une seule variable sont détectés dans tous les secteurs. Les signaux à une seule variable ne sont pas corrélés avec d'autres signaux et doivent être surveillés individuellement.

Restrictions
  • L'algorithme ne traite qu'un signal à la fois, de sorte que les anomalies collectives entre plusieurs signaux ne sont pas traitées.
  • L'algorithme à une seule variable n'est pas autonome et utilise l'API existante basée sur plusieurs variables avec le même format d'entrée de données.

Algorithme à plusieurs variables

L'algorithme à plusieurs variables vous aide à identifier les anomalies dans un jeu de données à plusieurs variables.

Le service de détection d'anomalies analyse automatiquement le jeu de données pour créer des modèles ou des signaux d'apprentissage automatique à plusieurs variables en tenant compte de leurs corrélations entre eux. La détection d'anomalies vous aide à surveiller des systèmes complexes avec un grand nombre de signaux.

Graphique de capteurs montrant l'alerte précoce MSET-2 fournie lors de la détection d'anomalies.

Le service de détection d'anomalies utilise MSET2 comme noyau principal pour détecter les anomalies de série temporelle à plusieurs variables à partir des jeux de données. MSET2 représente trois techniques :

  • Technique d'estimation d'état à plusieurs variables (MSET)

  • Test séquentiel du rapport des probabilités (SPRT)

  • Traitement intelligent des données (IDP)

Toutes ces techniques ont été inventées par Oracle Labs. Plusieurs industries ont choisi d'utiliser l'algorithme MSET2 pour l'analyse prévisionnelle.

Capacité

Il permet de détecter des anomalies ponctuelles, contextuelles et collectives dans des jeux de données à plusieurs variables avec des signaux numériques hautement corrélés. Il peut gérer le jeu de données avec un niveau modéré de valeurs manquantes, et fournit des valeurs estimatives.

Exigences
  • Le jeu de données d'entraînement et d'inférence peut contenir des valeurs numériques uniquement. Les valeurs catégorielles ou nominales ne sont pas prises en charge.
  • Les corrélations entre signaux sont relativement élevées. Par exemple, la corrélation de Pearson moyenne pour chaque paire entre un signal et le reste des signaux ne doit pas être inférieure à 0,1. Le noyau exclut les signaux présentant des corrélations inférieures et les traite avec une modélisation à une seule variable.
  • Le jeu de données d'entraînement doit être sans anomalie. Par exemple, le jeu de données contient des scénarios d'affaires et des valeurs de données normaux sans événements d'anomalie rares.
  • Tous les différents scénarios normaux sont inclus dans le jeu de données d'entraînement. Par exemple, au moins un cycle de gestion dans la partie entraînement. L'absence de certains modèles d'affaires normaux peut entraîner des faux positifs lors de l'inférence.
Cas d'utilisation

Les cas d'utilisation typiques de MSET2 sont dans les industries de la fabrication, IoT, du transport, du pétrole et du gaz, de l'énergie, car les données proviennent d'un système de signaux ou d'un actif avec des signaux bien corrélés.

Restrictions

Les cas d'utilisation avec des jeux de données qui ne sont pas numériques, hautement corrélés ou qui ne sont pas basés sur des séries chronologiques ne doivent pas utiliser MSET2 pour détecter des anomalies.