Datenbankanalysefunktionen

Mit Datenbankanalysefunktionen können Sie erweiterte Analysen und Data-Mining-Analysen ausführen, z.B. Anomalieerkennung, Daten-Clustering, Datensampling und Affinitätsanalysen. Analysefunktionen sind bei Verbindungen mit einer Oracle-Datenbank oder Oracle Autonomous Data Warehouse verfügbar.

Tutorialsymbol LiveLabs-Sprint

Um den Schritt Datenbankanalyse im Datenflusseditor anzuzeigen, müssen Sie eine Verbindung mit einer Oracle-Datenbank oder Oracle Autonomous Data Warehouse herstellen.

Funktionstypen Beschreibung

Dynamische Anomalieerkennung

Erkennen Sie Anomalien in den Eingabedaten ohne ein vordefiniertes Modell. Beispiel: Sie können ungewöhnliche Finanztransaktionen hervorheben.

Wenn Sie diese Funktion mit großen Datasets bereitstellen, konfigurieren Sie die Partitionsspalten für maximale Performance.

Dynamisches Clustering

Clustern Sie die Eingabedaten ohne ein vordefiniertes Modell. Beispiel: Sie können Kundensegmente für Marketingzwecke charakterisieren und erkennen.

Wenn Sie diese Funktion mit großen Datasets bereitstellen, konfigurieren Sie die Partitionsspalten für maximale Performance.

Häufiges Elementset

Ermitteln Sie Beziehungen innerhalb Ihrer Daten, indem Sie Artikelsets identifizieren, die häufig zusammen vorkommen. Diese Data-Mining-Technik wird auch als Assoziationsanalyse, Affinitätsanalyse oder in der Einzelhandelsbranche als Warenkorbanalyse bezeichnet. Wenn Sie häufige Elementsets als Warenkorbanalysetool verwenden, ergibt sich daraus beispielsweise, dass Kunden, die Shampoo kaufen, auch Pflegespülung kaufen.

Dieser Vorgang ist ressourcenintensiv und seine Performance hängt von mehreren Faktoren ab, wie eingegebene Dataset-Menge, Kardinalität der Transaktions-ID und Kardinalität der Artikelwertspalte. Um eine potenzielle Performancebeeinträchtigung für die Datenbank zu vermeiden, führen Sie den Vorgang mit einem höheren Prozentwert für die Mindestunterstützung (Standardwert ist 0,25) aus, und reduzieren Sie den Wert schrittweise, um mehr Artikelsets in Ihre Ausgabe aufzunehmen.

Datensampling

Wählt einen Prozentsatz von Daten als Stichprobe aus einer Tabelle aus. Dazu geben Sie einfach den Prozentsatz der Daten an, der als Stichprobe genutzt werden soll. Beispiel: Sie können 10 % der Daten als Stichprobe entnehmen.

Tokenisierung von Text

Analysieren Sie Textdaten, indem Sie den Text in einzelne Wörter aufschlüsseln und die Häufigkeit der Wörter zählen. Beim Ausführen des Datenflusses wird in Oracle Analytics eine Tabelle in der Datenbank DR$IndexName$I erstellt, die den Tokentext und Details zur Tokenanzahl enthält. Mit der Tabelle DR$IndexName$I können Sie ein Dataset erstellen.

  • Klicken Sie unter Ausgaben auf die Option Erstellen neben den einzelnen Feldern, um die zu indexierenden Spalten auszuwählen.

  • Wählen Sie unter Parameter die Option Textspalte aus. Klicken Sie dann auf Spalte auswählen, um das Feld auszuwählen, das Sie in einzelne Wörter aufschlüsseln möchten. Verwenden Sie die Optionen Referenzspalte<number>, um eine oder mehrere Spalten in das Ausgabe-Dataset einzubeziehen.

Für die Datenbankverbindung, die Sie für Ihren Datenfluss verwenden, sind spezielle Datenbankberechtigungen erforderlich. Vergewissern Sie sich bei Ihrem Administrator, dass folgende Voraussetzungen erfüllt sind:
  • Ihr Datenbankaccount verfügt über die Berechtigung grant EXECUTE on CTXSYS.CTX_DDL to schema name.
  • Sie verwenden eine Oracle Analytics-Verbindung mit demselben Benutzernamen wie das Schema, in dem die Quelltabelle vorhanden ist. Mit dieser Best Practice werden Zugriffsberechtigungsprobleme bei der Ausführung des Datenflusses vermieden.
  • In der zu analysierenden Datenbanktabellenspalte ist kein CONTEXT-Index vorhanden. Wenn in der zu analysierenden Datenbanktabelle ein CONTEXT-Index vorhanden ist, entfernen Sie diesen Index, bevor Sie den Datenfluss zur Tokenisierung von Text ausführen.

Zeitreihen

Eine Zeitreihe ist eine Data-Mining-Technik, mit der ein Zielwert basierend auf einer bekannten Historie von Zielwerten prognostiziert wird. Die Eingabe für Zeitreihenanalysen ist eine Sequenz von Zielwerten. Sie bietet Schätzungen des Zielwertes für die einzelnen Perioden eines Zeitfensters, das bis zu 30 Perioden über die historischen Daten hinaus enthalten kann.

Das Modell berechnet auch verschiedene Statistiken, die die Anpassung an historische Daten messen. Diese Statistiken sind als zusätzliches Ausgabe-Dataset über eine Parametereinstellung verfügbar.

Hinweis: Der Zeitreihenalgorithmus ist ab Oracle Database-Version 18c verfügbar.

Daten entpivotieren

Transponieren Sie in Spalten gespeicherte Daten in das Zeilenformat. Beispiel: Sie können mehrere Spalten, die jeweils einen Umsatzmetrikwert für ein Jahr enthalten, in eine einzelne Umsatzspalte mit mehreren Wertzeilen für die Year-Dimension transponieren. Dazu wählen Sie die gewünschten Metrikspalten aus und geben einen Namen für die neue Spalte an. Sie erhalten ein neues Dataset mit weniger Spalten und mehr Zeilen.

Hinweis: Wenn Sie Analysefunktionen verwenden möchten, stellen Sie sicher, dass der Administrator Analysefunktionen aktiviert hat (über Konsole, Systemeinstellungen, Performance und Kompatibilität, Datenbankanalyseknoten in Datenflüssen aktivieren).