Mit Datenbankanalysefunktionen können Sie erweiterte Analysen und Data-Mining-Analysen ausführen, z.B. Anomalieerkennung, Daten-Clustering, Datensampling und Affinitätsanalysen. Analysefunktionen sind bei Verbindungen mit einer Oracle-Datenbank oder Oracle Autonomous Data Warehouse verfügbar.
Um den Schritt Datenbankanalyse im Datenflusseditor anzuzeigen, müssen Sie eine Verbindung mit einer Oracle-Datenbank oder Oracle Autonomous Data Warehouse herstellen.
Funktionstypen | Beschreibung |
---|---|
Dynamische Anomalieerkennung |
Erkennen Sie Anomalien in den Eingabedaten ohne ein vordefiniertes Modell. Beispiel: Sie können ungewöhnliche Finanztransaktionen hervorheben. Wenn Sie diese Funktion mit großen Datasets bereitstellen, konfigurieren Sie die Partitionsspalten für maximale Performance. |
Dynamisches Clustering |
Clustern Sie die Eingabedaten ohne ein vordefiniertes Modell. Beispiel: Sie können Kundensegmente für Marketingzwecke charakterisieren und erkennen. Wenn Sie diese Funktion mit großen Datasets bereitstellen, konfigurieren Sie die Partitionsspalten für maximale Performance. |
Häufiges Elementset |
Ermitteln Sie Beziehungen innerhalb Ihrer Daten, indem Sie Artikelsets identifizieren, die häufig zusammen vorkommen. Diese Data-Mining-Technik wird auch als Assoziationsanalyse, Affinitätsanalyse oder in der Einzelhandelsbranche als Warenkorbanalyse bezeichnet. Wenn Sie häufige Elementsets als Warenkorbanalysetool verwenden, ergibt sich daraus beispielsweise, dass Kunden, die Shampoo kaufen, auch Pflegespülung kaufen. Dieser Vorgang ist ressourcenintensiv und seine Performance hängt von mehreren Faktoren ab, wie eingegebene Dataset-Menge, Kardinalität der Transaktions-ID und Kardinalität der Artikelwertspalte. Um eine potenzielle Performancebeeinträchtigung für die Datenbank zu vermeiden, führen Sie den Vorgang mit einem höheren Prozentwert für die Mindestunterstützung (Standardwert ist 0,25) aus, und reduzieren Sie den Wert schrittweise, um mehr Artikelsets in Ihre Ausgabe aufzunehmen. |
Datensampling |
Wählt einen Prozentsatz von Daten als Stichprobe aus einer Tabelle aus. Dazu geben Sie einfach den Prozentsatz der Daten an, der als Stichprobe genutzt werden soll. Beispiel: Sie können 10 % der Daten als Stichprobe entnehmen. |
Tokenisierung von Text |
Analysieren Sie Textdaten, indem Sie den Text in einzelne Wörter aufschlüsseln und die Häufigkeit der Wörter zählen. Beim Ausführen des Datenflusses wird in Oracle Analytics eine Tabelle in der Datenbank DR$IndexName$I erstellt, die den Tokentext und Details zur Tokenanzahl enthält. Mit der Tabelle DR$IndexName$I können Sie ein Dataset erstellen.
Für die Datenbankverbindung, die Sie für Ihren Datenfluss verwenden, sind spezielle Datenbankberechtigungen erforderlich. Vergewissern Sie sich bei Ihrem Administrator, dass folgende Voraussetzungen erfüllt sind:
|
Zeitreihen |
Eine Zeitreihe ist eine Data-Mining-Technik, mit der ein Zielwert basierend auf einer bekannten Historie von Zielwerten prognostiziert wird. Die Eingabe für Zeitreihenanalysen ist eine Sequenz von Zielwerten. Sie bietet Schätzungen des Zielwertes für die einzelnen Perioden eines Zeitfensters, das bis zu 30 Perioden über die historischen Daten hinaus enthalten kann. Das Modell berechnet auch verschiedene Statistiken, die die Anpassung an historische Daten messen. Diese Statistiken sind als zusätzliches Ausgabe-Dataset über eine Parametereinstellung verfügbar. Hinweis: Der Zeitreihenalgorithmus ist ab Oracle Database-Version 18c verfügbar. |
Daten entpivotieren |
Transponieren Sie in Spalten gespeicherte Daten in das Zeilenformat. Beispiel: Sie können mehrere Spalten, die jeweils einen Umsatzmetrikwert für ein Jahr enthalten, in eine einzelne Umsatzspalte mit mehreren Wertzeilen für die Year-Dimension transponieren. Dazu wählen Sie die gewünschten Metrikspalten aus und geben einen Namen für die neue Spalte an. Sie erhalten ein neues Dataset mit weniger Spalten und mehr Zeilen. |
Hinweis: Wenn Sie Analysefunktionen verwenden möchten, stellen Sie sicher, dass der Administrator Analysefunktionen aktiviert hat (siehe "Konsole", "Erweiterte Systemeinstellungen", "Performance und Kompatibilität", "Datenbankanalyseknoten in Datenflüssen aktivieren").