Daten durch Ersetzen transformieren

Transformieren Sie Daten in einer Spalte mit einem einfachen Musterabgleich oder einem regulären Ausdruck. Beispiel: In einer Spalte mit Bundesstaaten können Sie "CA" in "Kalifornien" ändern.

Sie können jeden mit Perl kompatiblen regulären Ausdruck verwenden (Perl Compatible Regular Expression, PCRE). Transformationen werden auf jede anwendbare Zeile in einem Dataset angewendet.
  1. Öffnen Sie auf der Homepage ein Dataset oder eine Arbeitsmappe.
    • Zeigen Sie mit der Maus auf das Dataset, klicken Sie auf Aktionen, und wählen Sie Öffnen aus. Klicken Sie im Datendiagramm oder Join-Diagramm mit der rechten Maustaste auf eine Datenquelle, und klicken Sie auf Öffnen, um den Transformationseditor anzuzeigen.
    • Zeigen Sie mit der Maus auf die Arbeitsmappe mit dem Dataset, klicken Sie auf Aktionen, und wählen Sie Öffnen aus. Klicken Sie dann auf Daten. Klicken Sie im Datendiagramm oder Join-Diagramm mit der rechten Maustaste auf eine Datenquelle, und klicken Sie auf Öffnen, um den Transformationseditor anzuzeigen.

    Hinweis:

    Oracle Analytics zeigt ein Datendiagramm für Datasets mit einer Tabelle oder ein Join-Diagramm für Datasets mit mehreren Tabellen an.
  2. Zeigen Sie mit der Maus auf die Textspalte, bzw. wählen Sie die Spalte aus, die Sie transformieren möchten.
  3. Klicken Sie unten in der Qualitätskachel auf Optionen und dann auf Ersetzen.
    Tipp: Um mehrere Werte gleichzeitig zu ersetzen, verwenden Sie die Option Werteliste ersetzen.
  4. Geben Sie im Schritteditor "Ersetzen" an, wie Werte verglichen werden sollen. Beispiel:
    • Klicken Sie auf Regulären Ausdruck verwenden, um Werte mit einem komplexen regulären Ausdruck (regex) abzugleichen.
    • Klicken Sie auf Nur ganze Werte abgleichen, damit "male" in "M", aber "female" nicht in "feM" geändert wird.
  5. Geben Sie in den Feldern Zu ersetzende Zeichenfolge und Neue Zeichenfolge den literalen Text oder die regulären Ausdrücke zum Suchen und Ersetzen an (Groß- und Kleinschreibung werden beachtet).
    Beispiele:
    • Um "2553 Bolman Court" in "2553 #Bolman# #Court#" zu ändern, wählen Sie Regulären Ausdruck verwenden aus, und geben Sie ([A-Za-z]+) im Feld Zu ersetzende Zeichenfolge und #$1# im Feld Neue Zeichenfolge ein.
    • Um "male" in "M" zu ändern, wählen Sie Nur ganze Werte abgleichen aus. Geben Sie male im Feld Zu ersetzende Zeichenfolge und M im Feld Neue Zeichenfolge ein. Dadurch wird "male" in "M", aber "female" nicht in "feM" geändert.

    Wenn Sie beide Felder ausfüllen, wird eine Vorschau der transformierten Daten im Vorschaubereich angezeigt. Passen Sie die Ersetzungsoptionen an, bis die gewünschte Transformation im Vorschaubereich angezeigt wird.
  6. Klicken Sie auf Schritt hinzufügen.
    Oracle Analytics fügt einen Schritt im Bereich "Vorbereitungsskript" hinzu.
  7. Um die Änderungen der Datenvorbereitung zu speichern und auf Ihre Daten anzuwenden, klicken Sie auf Speichern.

Beispiele für Ersetzungstransformationen mit regulären Ausdrücken

Hier werden einige Beispiele dafür genannt, wie Sie Daten mit regulären Ausdrücken transformieren können.

In diesen Beispielen enthält der Suchausdruck die Eingabe im Feld Zu ersetzende Zeichenfolge. Unter "Wert ersetzen" wird angezeigt, was in das Feld Neue Zeichenfolge eingegeben werden muss.

Tabelle 3-1 Beispiele für Ersetzungstransformationen

Suchausdruck Ersetzungswert Originaltext Ersetzter Text Hinweise
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com In diesem Beispiel werden Domaindetails in E-Mail-Adressen ersetzt.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Die Zeichen ^$ geben an, dass nur nach Übereinstimmungen mit der ganzen Zeichenfolge gesucht wird. Der vertikale Strich ist der reguläre Ausdruck für OR. In diesem Fall sucht der reguläre Ausdruck also nach "Gray" oder "Grey" und ersetzt beides durch "Silver".

Die Zeichenfolge "Graystone" wird nicht transformiert, da der reguläre Ausdruck nur nach Übereinstimmungen des ganzen Wertes sucht.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Dieser reguläre Ausdruck sucht nach einer ("\d") oder mehr ("+") Ziffern und ersetzt diese durch "9999". Der Wert wird auch ersetzt, wenn der Originaltext nur drei Ziffern enthält.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Dieser reguläre Ausdruck sucht nach einem ("[A-z]") oder mehr ("+") aufeinander folgenden Buchstaben gefolgt von einer ("\d") oder mehr ("+") Ziffern. Beide Ausdrücke sind durch Klammern gebunden, sodass zwei Gruppen erfasst werden: die erste Gruppe ([A-z]) und die zweite Gruppe (\d+). Diese Gruppen werden automatisch nummeriert und können dann unter Verwendung des Dollarzeichens für die zweite Gruppe bei der Ersetzung verwendet werden (z.B. "$2").
([A-z]+)(\d+) Postal Code: $2

UA101654

US829383

Postal Code: 101654

Postal Code: 829383

In diesem Beispiel wird derselbe Ausdruck für den Abgleich wie im vorherigen Beispiel verwendet. Allerdings wird hier gezeigt, wie Sie Ihren eigenen Ersetzungstext zusätzlich zu einer Gruppe einfügen. Text kann vor und nach einer erneut aufgerufenen Übereinstimmungsgruppe eingefügt werden.