Présentation de l'exécution d'une analyse de similarité dans Oracle Analytics

Dans Oracle Analytics, vous pouvez effectuer une analyse de similarité sur vos données à l'aide de divers modèles de plongement vectoriel. L'analyse de similarité vous permet de mesurer à quel point plusieurs objets, ensembles de données, documents ou modèles se ressemblent (sont similaires) d'après des mesures ou des critères définis.

Par exemple, vous voulez répondre à des questions telles que les suivantes :

Quels patients présentent des symptômes semblables à ceux d'un patient donné ?
Quels clients présentent un profil semblable à celui d'un client donné ?
Quelles demandes de remboursement présentent un profil semblable à celui d'une demande de remboursement donnée ?

Fonctionnement

Oracle Database version 23ai ou ultérieure prend en charge la recherche vectorielle et les fonctions SQL afin de calculer la distance entre les vecteurs, qui est utilisée pour quantifier le degré de ressemblance entre des enregistrements de données. Oracle Analytics utilise la recherche vectorielle en arrière-plan pour effectuer une analyse de similarité sur les ensembles de données.

Remarques sur les performances

La durée de traitement de l'analyse de similarité varie en fonction des critères suivants :

Nombre de lignes de l'ensemble de données source.
Nombre de colonnes sélectionnées pour utilisation dans le flux de données. Toutes les colonnes de l'ensemble de données source ne seront pas utilisées dans le modèle d'analyse de similarité. Nous vous recommandons d'utiliser entre 10 et 15 colonnes. La sélection de plus de 15 colonnes peut nuire aux performances du flux de données utilisé pour appliquer le modèle.
Nombre d'ECPU allouées à l'instance Oracle Autonomous AI Lakehouse.

Le délai d'expiration des flux de données est de 2 h 30, ce qui détermine la quantité de données qui peut être traitée.