Ergebnisse aus einem Ähnlichkeitsanalysemodell interpretieren

Wenn Sie einen Datenfluss ausführen, um eine Ähnlichkeitsanalyse auszuführen, generiert Oracle Analytics ein Dataset mit den Ergebnissen.

Sie können folgende Aktionen ausführen:
  • Suchen Sie das Ausgabe-Dataset auf der Datenseite von Oracle Analytics. Suchen Sie nach einem Dataset mit dem Namen, der im Schritt Daten speichern im Datenfluss angegeben wurde. Das Dataset enthält dieselben Ausgabespalten wie im Abschnitt Ausgaben des Schritts "Ähnlichkeitsanalyse" in Ihrem Datenfluss aufgeführt.

    Vom Ähnlichkeitsanalysemodell generierte Dataset-Spalten:

    • source_value: Gibt die Spalte mit einem einzelnen Wert innerhalb dieser Spalte zurück, die im Datenfluss als Quellobjekt ausgewählt wurde. Der Vektorabstand wird durch Vergleich dieses Wertes mit allen anderen Werten in dieser Spalte gemessen.
    • source_reference_column1: Gibt den ausgewählten Wert der Referenzspalte (wie in den Eigenschaften des Datenflussknotens festgelegt) für Datensätze zurück, die als Quelldatensätze für die Ähnlichkeitsanalyse ausgewählt wurden. Anhand dieser Ausgabe können Sie jetzt den Quelldatensatz ermitteln, für den Sie die nächstgelegenen oder am weitesten entfernten Datensätze gefunden haben.
    • results_reference_column1, 2 und 3: Gibt den Wert der jeweiligen Referenzspalten (wie in den Eigenschaften des Datenflussknotens festgelegt) für Datensätze zurück, die durch die Ähnlichkeitsanalyse als am nächsten oder am weitesten entfernt identifiziert wurden.
    • distance: Der berechnete Abstand zwischen dem Quellwert und dem Ergebnisdatensatz. Das heißt, wie ähnlich oder unterschiedlich die Daten in source_reference_col1, source_reference_col2 und source_reference_col3 gegenüber result_reference1, result_reference2 und result_reference3 sind.
    • profile_expression: Der in einer einzelnen Zeichenfolge verkettete Ausdruck aller Spalten, die im Ähnlichkeitsanalysemodell verwendet werden. Das sind die Spalten, für die Werte vom Einbettungsmodell vektorisiert wurden.

      Hinweis:

      Die ausgewählten Attributspalten sind Teil der Profilzeichenfolge, während Kennzahlen in Metrikspalten zunächst dynamisch in niedrige, mittlere und hohe Bins kategorisiert werden, sodass sie korrekt in den Vektoren dargestellt werden.
  • Erstellen Sie eine Arbeitsmappe basierend auf dem Ausgabe-Dataset, das vom Datenfluss der Ähnlichkeitsanalyse generiert wird.
  • Erstellen Sie Visualisierungen zur Analyse der Ergebnisse. Beispiel: