Détection d'anomalies

L'opérateur de détection d'anomalies est un outil à faible code permettant d'intégrer la détection d'anomalies dans n'importe quelle application d'entreprise.

Il utilise la détection d'anomalies constructives de séries chronologiques pour signaler les moments anormaux dans les données, par heure et par ID.

Pour plus d'informations, consultez la section sur la détection d'anomalies dans la documentation ADS.

Données d'entrée

L'opérateur de détection d'anomalies accepte un jeu de données avec :
  • Une colonne cible.
  • (Facultatif) Une ou plusieurs colonnes de série, de sorte que la cible est indexée par date/heure et série.
  • (Facultatif) Nombre arbitraire de variables supplémentaires.

Outre ces données d'entrée, vous pouvez spécifier des données de validation, si elles sont disponibles. Les données de validation doivent comporter toutes les colonnes des données d'entrée plus une colonne binaire intitulée anomaly. La colonne anomaly doit avoir une valeur inférieure à 1 pour les rangées anormales et à 1 pour les rangées normales.

Enfin, fournissez test_data pour recevoir les mesures de test et évaluer plus facilement la performance de l'opérateur. Les données de test doivent être indexées par date et (facultatif) par série. Les données de test doivent avoir la valeur moins 1 pour les lignes anormales et 1 pour les lignes normales.

Une tâche de détection d'anomalies peut être configurée avec le yaml suivant :
kind: operator
type: anomaly
version: v1
spec:
    input_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    model: autots
    target_column: y
Exécutez l'opérateur avec cette commande :
ads operator run -f anomaly.yaml

Détection d'anomalies à plusieurs variables

Si vous avez des variables supplémentaires qui, selon vous, pourraient être liées, utilisez la détection d'anomalies à plusieurs variables. Toutes les colonnes supplémentaires spécifiées dans les données d'entrée sont utilisées pour déterminer si la colonne cible est anormale.

Sélection automatique de modèle

Les utilisateurs opérateurs n'ont pas besoin de connaître les modèles sous-jacents pour les utiliser. Par défaut, nous réglons le modèle à auto. Toutefois, si vous voulez plus de contrôle sur les paramètres de modélisation, réglez le paramètre de modèle à autots ou à automlx, puis transmettez les paramètres directement à model_kwargs.