Anomaly Detection

L'opérateur de détection d'anomalies est un outil à code réduit permettant d'intégrer la détection d'anomalies dans n'importe quelle application d'entreprise.

Il utilise la détection d'anomalies constructive dans les séries temporelles pour signaler les moments anormaux dans les données, par heure et par ID.

Pour plus d'informations, reportez-vous à la section Détection d'anomalies de la documentation ADS.

Données d'entrée

L'opérateur de détection d'anomalies accepte un ensemble de données avec :
  • Colonne cible.
  • (Facultatif) Une ou plusieurs colonnes de série, de sorte que la cible est indexée par date/heure et par série.
  • (Facultatif) Nombre arbitraire de variables supplémentaires.

Outre ces données d'entrée, vous pouvez spécifier les données de validation, le cas échéant. Les données de validation doivent comporter toutes les colonnes des données d'entrée plus une colonne binaire intitulée anomaly. La colonne anomaly doit avoir la valeur moins 1 pour les lignes anormales et 1 pour les lignes normales.

Enfin, fournissez test_data pour recevoir des mesures de test et évaluer plus facilement les performances de l'opérateur. Les données de test doivent être indexées par date et (facultatif) série. Les données de test doivent avoir la valeur moins 1 pour les lignes anormales et 1 pour les lignes normales.

Un travail de détection d'anomalies peut être configuré avec le yaml suivant :
kind: operator
type: anomaly
version: v1
spec:
    input_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    model: autots
    target_column: y
Exécutez l'opérateur à l'aide de la commande suivante :
ads operator run -f anomaly.yaml

Détection d'anomalies mulitvariables

Si vous avez des variables supplémentaires qui, selon vous, pourraient être liées, utilisez la détection d'anomalies à plusieurs variables. Toutes les colonnes supplémentaires indiquées dans les données d'entrée sont utilisées pour rechercher si la colonne cible est anormale.

Sélection de modèle automatique

Les utilisateurs d'opérateurs n'ont pas besoin de connaître les modèles sous-jacents pour les utiliser. Par défaut, nous définissons le modèle sur auto. Toutefois, si vous souhaitez davantage de contrôle sur les paramètres de modélisation, définissez le paramètre de modèle sur autots ou automlx, puis transmettez les paramètres directement dans model_kwargs.