Anomaly Detection-Algorithmen
Anomalieerkennung verwendet ML-Algorithmen, um die Muster zu erlernen und Anomalien aus einem Dataset zu erkennen.
Univariate Algorithmen sind solche, die nur mit einem Signal oder Sensor arbeiten. Typischerweise erstellen diese Algorithmen ein Modell pro Signal, mit dem Anomalien im Sensor oder Signal identifiziert werden. Mit dem Service Anomaly Detection können Sie ein einzelnes Modell für mehrere Signale in einem Dataset trainieren, indem Sie die Zuordnung von Sensor oder Signal zu internem Modell verwalten.
Standardmäßig erfolgt das Modelltraining mit univariaten Algorithmen. Sie können dieses Verhalten jedoch mit der Anomaly Detection-API außer Kraft setzen.
Univariater Algorithmus
Mit Anomaly Detection können Sie Anomalien in einem univariaten Dataset identifizieren.
Die Trainings- und Testdaten können nur Zeitstempel und andere numerische Attribute enthalten, bei denen es sich in der Regel um Sensor- oder Signalablesungen handelt.

-
Typen univariater Zeitreihenmuster, die Anomalieerkennung genau identifizieren kann:
-
Saisonale Muster
-
Flattrend
-
Kontinuierliche Erhöhung und Reduzierung von linearen Trend-Datasets
-
-
Anomaltypen, die Anomalieerkennung genau identifizieren kann:
-
Punktanomalien
-
Hecht
-
Der univariate Algorithmus erstellt ein Modell pro Signal und ist einer der besten klassischen ML-Algorithmen. Signale, die von MSET2 als niedrige Korrelationen betrachtet werden, werden mit diesem Algorithmus automatisch als univariat behandelt.
Der univariate Algorithmus ist nicht eigenständig und verwendet die vorhandene multivariate-basierte API mit demselben Dateneingabeformat. Das univariate Modell für jedes univariate Signal wird unabhängig erstellt, optimiert und gespeichert. Darüber hinaus werden die Modelle zur separaten Inferenzierung verwendet.
- Fähigkeit
-
Sie erkennt Anomalien in einem Signal unter Berücksichtigung ihrer Zeitreihenmuster und arbeitet an punktuellen oder kontextuellen Anomalien.
- Anforderungen
-
-
Das Erkennungs-Dataset kann anomale Datenpunkte aufweisen.
- Das Trainings- und Inferenz-Dataset darf nur numerische Werte enthalten. Kategorische oder nominale Werte werden nicht unterstützt.
- Der Algorithmus verwendet einen fensterbasierten Feature Engineering-Ansatz. Sie erfordert eine zusätzliche Datenfenstergröße vor dem eigentlichen Training oder das Erkennen von Daten, um die Muster oder Erkennungsanomalien zu erlernen. Die Mindestanzahl von Zeitstempeln beträgt 80.
- Alle denkbaren normalen Geschäftsszenarios sind im Trainings-Dataset enthalten. Beispiel: Mindestens ein Geschäftszyklus im Trainingsabschnitt.
-
- Anwendungsfälle
-
Anwendungsfälle für die univariate Anomalieerkennung finden sich branchenübergreifend. Univariate Signale sind nicht mit anderen Signalen korreliert und müssen einzeln überwacht werden.
- Einschränkungen
-
- Der Algorithmus behandelt jeweils nur ein Signal, so dass kollektive Anomalien zwischen mehreren Signalen nicht adressiert werden.
- Der univariate Algorithmus ist nicht eigenständig und verwendet die vorhandene multivariate-basierte API mit demselben Dateneingabeformat.
Multivariater Algorithmus
Der mulitvariate-Algorithmus hilft Ihnen, Anomalien in einem multivariaten Dataset zu identifizieren.
Anomaly Detection analysiert das Dataset automatisch, um multivariate Modelle oder Signale für maschinelles Lernen zu erstellen, indem deren Korrelationen zwischen ihnen berücksichtigt werden. Anomaly Detection erleichtert es Ihnen, komplexe Systeme mit einer großen Anzahl von Signalen zu überwachen.

Der Anomaly Detection-Service verwendet MSET2 als Hauptkernel, um Anomalien bei multivariaten Zeitreihen aus Datasets zu erkennen. MSET2 steht für drei Methoden:
-
Multivariate State Estimation Technique (MSET)
-
Sequential Probability Ratio Test (SPRT)
-
IDP (Intelligent Data Processing)
All diese Methoden wurden von Oracle Labs entwickelt. Der Algorithmus MSET2 hat sich in mehreren Branchen bei der Prognoseanalyse bewährt.
- Fähigkeit
-
Es funktioniert, um punktuelle, kontextbezogene und kollektive Anomalien in multivariaten Datasets mit hoch korrelierten numerischen Signalen zu erkennen. Er eignet sich für Datasets, in denen eine geringe Anzahl von Werten fehlt, und stellt geschätzte Werte bereit.
- Anforderungen
-
- Das Trainings- und Inferenz-Dataset darf nur numerische Werte enthalten. Kategorische oder nominale Werte werden nicht unterstützt.
- Die Korrelationen zwischen Signalen sind relativ hoch. Beispiel: Die durchschnittliche paarweise Pearson-Korrelation zwischen einem Signal und dem Rest der Signale beträgt mindestens 0,1. Der Kernel schließt Signale mit niedrigeren Korrelationen aus und behandelt sie mit univariater Modellierung.
- Das Trainings-Dataset muss anomaliefrei sein. Beispiel: Das Dataset enthält normale Geschäftsszenarios und Datenwerte ohne seltene Anomalieereignisse.
- Alle denkbaren normalen Geschäftsszenarios sind im Trainings-Dataset enthalten. Beispiel: Mindestens ein Geschäftszyklus im Trainingsabschnitt. Das Fehlen einiger normaler Geschäftsmuster kann zu falschen positiven Ergebnissen während der Inferenzierung führen.
- Anwendungsfälle
-
Typische MSET2 Anwendungsfälle sind in der Fertigungs-, IoT-, Transport-, Öl- und Gasindustrie, weil die Daten aus einem Signalsystem oder Asset mit gut korrelierten Signalen stammen.
- Einschränkungen
-
Anwendungsfälle mit Datasets, die nicht numerisch, stark korreliert oder nicht auf Zeitreihen basieren, sollten MSET2 nicht verwenden, um Anomalien zu erkennen.