Überblick über die Ähnlichkeitsanalyse in Oracle Analytics

In Oracle Analytics können Sie Ähnlichkeitsanalysen für Ihre Daten mit einer Vielzahl von Vektoreinbettungsmodellen durchführen. Mit der Ähnlichkeitsanalyse können Sie basierend auf definierten Kriterien oder Metriken messen, wie ähnlich sich zwei oder mehr Objekte, Datasets, Dokumente oder Muster sind.

Beispiel: Sie können Fragen wie die Folgenden beantworten:
  • Welche Patienten haben ähnliche Symptome wie ein bestimmter Patient?
  • Welche Kunden haben ein ähnliches Profil wie ein bestimmter Kunde?
  • Welche Versicherungsansprüche ähneln sich im Profil einem bestimmten Versicherungsanspruch?

Wie funktioniert das?

Oracle Database V23ai oder höher unterstützt Vektorsuche und SQL-Funktionen zur Berechnung des Abstands zwischen Vektoren. Damit wird der Grad der Ähnlichkeit zwischen Datensätzen quantifiziert. Oracle Analytics verwendet die Vektorsuche im Hintergrund, um Ähnlichkeitsanalysen für Datasets durchzuführen.

Hinweise zur Performance

Die Verarbeitungszeit für die Ähnlichkeitsanalyse variiert je nach folgenden Faktoren:
  • Die Anzahl an Zeilen im Quell-Dataset.
  • Die Anzahl an Spalten, die Sie für den Datenfluss auswählen. Beachten Sie, dass nicht alle Spalten im Quell-Dataset in Ihrem Ähnlichkeitsanalysemodell verwendet werden. Es wird empfohlen, zwischen 10 und 15 Spalten zu verwenden. Die Auswahl von mehr als 15 Spalten kann sich negativ auf die Performance des Datenflusses auswirken, mit dem Sie das Modell anwenden.
  • Die Anzahl der ECPUs, die Ihrer Oracle Autonomous AI Lakehouse-Instanz zugewiesen sind.

Datenflüsse haben ein Timeoutlimit von 2,5 Stunden, das die Datenmenge vorgibt, die verarbeitet werden kann.