Aperçu de l'exécution de l'analyse de similarité dans Oracle Analytics

Dans Oracle Analytics, vous pouvez effectuer une analyse de similarité sur vos données à l'aide de divers modèles de plongement vectoriel. L'analyse de similarité vous permet de mesurer le degré de ressemblance entre deux ou plusieurs objets, jeux de données, documents ou modèles, en fonction de critères ou de mesures définis.

Vous pouvez par exemple répondre à des questions telles que :

Quels patients ont des symptômes similaires à ceux d'un patient donné?
Quels clients ont un profil similaire à celui d'un client donné?
Quelles réclamations d'assurance sont similaires dans leur profil à une réclamation d'assurance donnée?

Comment cela fonctionne-t-il?

Oracle Database V23ai ou ultérieure prend en charge la recherche vectorielle et les fonctions SQL pour calculer la distance entre les vecteurs, qui est utilisée pour quantifier le degré de ressemblance entre les enregistrements de données. Oracle Analytics utilise la recherche vectorielle en arrière-plan pour effectuer une analyse de similarité sur des jeux de données.

Considérations de rendement

Le temps de traitement de l'analyse de similarité varie selon les facteurs suivants :

Nombre de rangées dans votre jeu de données source.
Nombre de colonnes que vous sélectionnez pour une utilisation dans votre flux de données. Notez que toutes les colonnes de votre jeu de données source ne seront pas utilisées dans votre modèle d'analyse de similarité. Nous recommandons d'utiliser entre 10 et 15 colonnes. La sélection de plus de 15 colonnes peut nuire aux performances du flux de données qui est utilisé pour appliquer le modèle.
Nombre d'ECPU affectés à votre instance Oracle Autonomous AI Lakehouse.

Les flux de données ont une limite de temporisation de 2,5 heures, laquelle détermine la quantité de données qui peut être traitée.