Transformarea datelor utilizând funcţia de înlocuire

Transformaţi datele dintr-o coloană utilizând o corespondenţă de tipar simplă sau o expresie logică (regex). De exemplu, într-o coloană Stat, puteţi schimba CA în California.

Puteţi utiliza orice expresii logice compatibile cu Perl (PCRE), denumite şi expresii regex. Transformările sunt aplicate pentru fiecare rând corespunzător dintr-un set de date.
  1. Pe pagina home, treceţi cursorul peste un set de date pe care îl deţineţi, faceţi clic pe Acţiuni, iar apoi selectaţi Deschidere.
    Dacă setul de date conţine un singur tabel, veţi vedea Editorul de transformări. Dacă setul de date conţine mai multe tabele, veţi vedea Diagrama de join. În Diagrama de join, faceţi clic dreapta pe o sursă de date şi faceţi clic pe Deschidere pentru afişarea editorului de transformări.

  2. Treceţi cursorul sau selectaţi coloana de text pe care doriţi s-o transformaţi.
  3. Faceţi clic pe Opţiuni de la baza vinietei de calitate şi apoi faceţi clic pe Înlocuire.
    Sfat: Pentru a înlocui mai multe valori în acelaşi timp, utilizaţi opţiunea Înlocuire listă de valori.
  4. În editorul pentru pasul Înlocuire, specificaţi modul în care doriţi să realizaţi corespondenţa pentru valori. De exemplu:
    • Faceţi clic pe Utilizare expresie logică pentru a face asocierea utilizând o expresie logică complexă (regex).
    • Faceţi clic pe Se potrivesc doar valori întregi pentru a schimba "masculin" în "M" dar nu şi "feminin" în "feM".
  5. În câmpurile Şir de înlocuit şi Şir nou, specificaţi textul literal sau expresiile logice de căutat şi de înlocuit (concordanţă litere mari/mici).
    Exemple:
    • Pentru a schimba "2553 Bolman Court" în "2553 #Bolman# #Court#", selectaţi Utilizare expresie logică, introduceţi ([A-Za-z]+) în câmpul Şir de înlocuit şi introduceţi #$1# în câmpul Şir nou.
    • Pentru a schimba "masculin" cu "M", selectaţi Se potrivesc doar valori întregi, introduceţi male în câmpul Şir de înlocuit şi introduceţi M în câmpul Şir nou. Această acţiune schimbă "masculin" în "M" dar nu va schimba "feminin" în "feM".

    După ce completaţi ambele câmpuri, veţi vedea o previzualizare a datelor transformate în panoul de previzualizare. Ajustaţi opţiunile de înlocuire până când obţineţi transformarea dorită în panoul de previzualizare.
  6. Faceţi clic pe Adăugare pas.
    Oracle Analytics adaugă un pas în panoul Script de pregătire.
  7. Pentru a salva modificările aduse la pregătirea datelor şi a le aplica datelor dvs., faceţi clic pe Salvare.

Exemplu de transformare prin înlocuire utilizând expresii logice

Iată aici doar câteva exemple de utilizare a expresiilor logice (regex) pentru transformarea datelor.

În aceste exemple, Expresia de căutare arată ce trebuie să introduceţi în câmpul Şir de înlocuit, iar Înlocuire valoare arată ceea ce să introduceţi în câmpul Şir nou.

Tabelul 4-1 Exemplu de transformare prin înlocuire

Expresie căutare Înlocuire valoare Text iniţial Text înlocuit Note
@([a-z]+)(?=\.[a-z]{3}) @exemplu: MichelePFalk@yahoo.com MichelePFalk@example.com În acest exemplu se înlocuiesc detaliile legate de domeniu în adrese de e-mail.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Dacă se utilizează caracterele ^$, înseamnă că se vor căuta doar corespondenţele de şiruri întregi. Bara verticală reprezintă expresia logică pentru OR, deci, în acest caz, expresia logică caută "Gray" sau "Grey" şi efectuează înlocuirea cu "Silver".

Şirul Graystone nu este transformat, deoarece expresia logică va căuta doar corespondenţe de valori întregi.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Această expresie logică va căuta una ("\ d") sau mai multe ("+") cifre şi le va înlocui cu "9999". Înlocuirea funcţionează şi atunci când textul original are doar trei cifre.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Această expresie logică va căuta una ("[A-z]") sau mai multe ("+") litere consecutive urmate de una ("\ d") sau mai multe ("+") cifre. Fiecare dintre cele două expresii este delimitată prin paranteze, care captează două grupuri: primul este ([A-z]), iar cel de-al doilea este (\ d +). Aceste grupuri sunt numerotate automat şi pot fi utilizate apoi în înlocuire utilizând semnul dolar pentru cel de-al doilea grup, de exemplu, "$2".
([A-z]+)(\d+) Cod poştal: $2

UA101654

US829383

Cod poştal: 101654

Cod poştal: 829383

Acest exemplu utilizează aceeaşi expresie de potrivire ca cea din exemplul anterior, cu excepţia faptului că arată modul de inserare a propriului text de înlocuire în plus faţă de un grup. Textul poate fi inserat înainte şi după un grup de corespondenţă reapelat.