Algoritmi di rilevamento anomalie
Rilevamento delle anomalie utilizza algoritmi di Machine Learning (ML) per apprendere i pattern e rilevare anomalie da un data set.
Gli algoritmi univariati sono quelli che funzionano con un solo segnale o sensore. In genere, questi algoritmi creano un modello per segnale che viene utilizzato per identificare le anomalie nel sensore o nel segnale. Utilizzare il servizio Rilevamento anomalie per addestrare un singolo modello per più segnali all'interno di un data set gestendo internamente il mapping del sensore o del segnale al modello.
Per impostazione predefinita, l'addestramento del modello viene eseguito utilizzando algoritmi univariati. Tuttavia, è possibile eseguire l'override di questo funzionamento utilizzando l'API Rilevamento anomalie.
Algoritmo univariato
Rilevamento anomalie consente di identificare le anomalie in un set di dati univariato.
I dati di addestramento e test possono solo contenere indicatori orari e altri attributi numerici che in genere rappresentano letture di sensori o segnali.

-
Tipi di pattern di serie temporali univariati che Rilevamento anomalie può identificare con precisione:
-
Pattern stagionali
-
Andamento semplice
-
Dati di tendenza lineari in continua crescita e diminuzione
-
-
Tipi di anomalie che il rilevamento delle anomalie può identificare con precisione:
-
Anomalie punti
-
Spike
-
L'algoritmo univariato crea un modello per segnale ed è uno dei migliori algoritmi ML classici. I segnali considerati come basse correlazioni da MSET2 vengono trattati automaticamente come univariati utilizzando questo algoritmo.
L'algoritmo univariato non è standalone e utilizza l'API multivariata esistente con lo stesso formato di input dei dati. Il modello univariato per ogni segnale univariato viene costruito, ottimizzato e salvato in modo indipendente. Inoltre, i modelli vengono utilizzati per l'inferenza separatamente.
- Capacità
-
Rileva le anomalie in un segnale considerando i suoi modelli di serie temporali e funziona su anomalie appuntite o contestuali.
- Requisiti
-
-
Il data set di rilevamento può avere datapoint anomali.
- Set di dati di addestramento e inferenza contenente solo valori numerici. I valori nominali o di categoria non sono supportati.
- L'algoritmo utilizza un approccio di progettazione delle funzionalità basato su finestre. Richiede una dimensione di dati aggiuntiva di una finestra prima dell'allenamento effettivo o del rilevamento dei dati per apprendere i pattern o rilevare anomalie. Il numero totale minimo di indicatori orari è 80.
- Tutti i diversi scenari aziendali normali vengono inclusi nel set di dati di addestramento. Ad esempio, almeno un ciclo aziendale nella parte di formazione.
-
- Casi d'uso
-
Casi d'uso univariati di rilevamento delle anomalie si trovano in tutti i settori. I segnali univariati non sono correlati ad altri segnali e devono essere monitorati singolarmente.
- Limitazioni
-
- L'algoritmo tratta solo un segnale alla volta in modo che le anomalie collettive tra più segnali non vengano affrontate.
- L'algoritmo univariato non è standalone e utilizza l'API multivariata esistente con lo stesso formato di input dei dati.
Algoritmo multivariato
L'algoritmo mulitvariato consente di identificare le anomalie in un set di dati multivariato.
Rilevamento delle anomalie analizza automaticamente il data set per creare modelli o segnali di Machine Learning multivariati considerando le loro correlazioni tra di loro. Il rilevamento delle anomalie consente di monitorare sistemi complessi con un numero elevato di segnali.

Il servizio Rilevamento anomalie utilizza MSET2 come kernel principale per rilevare anomalie di serie temporali multivariate dai set di dati. MSET2 rappresenta tre tecniche:
-
Tecnica di stima dello stato multivariato (MSET)
-
Test rapporto probabilità sequenziale (SPRT)
-
Elaborazione intelligente dei dati (IDP)
Tutte queste tecniche sono state inventate da Oracle Labs. L'algoritmo MSET2 viene utilizzato con successo in diversi settori per l'analisi della prognosi.
- Capacità
-
Funziona per rilevare anomalie puntuali, contestuali e collettive in set di dati multivariati con segnali numerici altamente correlati. Può gestire il set di dati con un livello moderato di valori mancanti e fornisce valori stimati.
- Requisiti
-
- Il data set di addestramento e inferenza può contenere valori numerici solo. I valori nominali o di categoria non sono supportati.
- Le correlazioni tra i segnali sono relativamente alte. Ad esempio, la correlazione media Pearson in coppia tra un segnale e il resto dei segnali non è inferiore a 0,1. Il kernel esclude i segnali con correlazioni inferiori e li tratta con la modellazione univariata.
- Il data set di addestramento deve essere privo di anomalie. Ad esempio, il set di dati contiene scenari aziendali e valori di dati normali senza eventi anomali rari.
- Tutti i diversi scenari aziendali normali vengono inclusi nel set di dati di addestramento. Ad esempio, almeno un ciclo aziendale nella parte di formazione. La mancanza di alcuni modelli aziendali normali potrebbe portare a falsi positivi durante l'inferenza.
- Casi d'uso
-
I casi d'uso tipici di MSET2 si trovano nelle industrie manifatturiere, IoT, dei trasporti, del petrolio e del gas, dell'energia perché i dati provengono da un sistema di segnali o da un asset con segnali ben correlati.
- Limitazioni
-
I casi d'uso con set di dati non numerici, altamente correlati o non basati su serie temporali non devono utilizzare MSET2 per rilevare anomalie.