Panoramica sull'esecuzione dell'analisi di somiglianza in Oracle Analytics

In Oracle Analytics, è possibile eseguire l'analisi di somiglianza sui dati utilizzando una vasta gamma di modelli di incorporamento vettore. L'analisi di somiglianza consente di misurare la somiglianza tra due o più oggetti, data set, documenti o pattern in base a metriche o criteri definiti.

Ad esempio, è possibile rispondere alle domande seguenti:
  • Quali pazienti hanno sintomi simili a quelli di un determinato paziente?
  • Quali clienti hanno un profilo simile a un determinato cliente?
  • Quali sinistri assicurativi hanno un profilo simile a un determinato sinistro assicurativo?

Come funziona?

Oracle Database V23ai o versione successiva supporta la ricerca vettoriale e le funzioni SQL per calcolare la distanza tra i vettori, che viene utilizzata per quantificare il grado di somiglianza tra i record di dati. Oracle Analytics utilizza la ricerca vettoriale in background per eseguire analisi di somiglianza sui data set.

Considerazioni sulle prestazioni

Il tempo di elaborazione per l'analisi di somiglianza varia a seconda dei fattori seguenti:
  • numero di righe nel data set di origine;
  • numero di colonne selezionate per l'utilizzo nel flusso dati; tenere presente che non tutte le colonne nel data set di origine verranno utilizzate nel modello di analisi di somiglianza; si consiglia di utilizzare tra 10 e 15 colonne; la selezione di più di 15 colonne può influire negativamente sulle prestazioni del flusso dati utilizzato per applicare il modello;
  • numero di ECPU allocate all'istanza di Oracle Autonomous AI Lakehouse.

I flussi dati hanno un limite di timeout di 2,5 ore, che indica la quantità di dati che è possibile elaborare.