Μετασχηματισμός δεδομένων με χρήση αντικατάστασης

Μετασχηματίστε δεδομένα σε μια στήλη χρησιμοποιώντας μια απλή αντιστοίχιση μοτίβων ή μια κανονική έκφραση (regex). Για παράδειγμα, σε μια στήλη "Πολιτεία", μπορείτε να αλλάξετε το CA σε California.

Μπορείτε να χρησιμοποιήσετε οποιαδήποτε έκφραση Perl Compatible Regular Expression (PCRE), οι οποίες είναι γνωστές επίσης ως εκφράσεις regex. Οι μετασχηματισμοί εφαρμόζονται σε οποιαδήποτε κατάλληλη σειρά του συνόλου δεδομένων.
  1. Στην Αρχική σελίδα, τοποθετήστε τον δείκτη του ποντικιού πάνω σε ένα σύνολο δεδομένων που σας ανήκει, κάντε κλικ στο μενού Ενέργειες και επιλέξτε Άνοιγμα.
    Αν ένα σύνολο δεδομένων περιέχει έναν μεμονωμένο πίνακα, θα δείτε το πρόγραμμα επεξεργασίας μετασχηματισμού. Αν το σύνολο δεδομένων περιέχει πολλαπλούς πίνακες, θα δείτε το Διάγραμμα συνενώσεων. Στο Διάγραμμα συνενώσεων, κάντε δεξί κλικ σε μια προέλευση δεδομένων και κατόπιν κάντε κλικ στην επιλογή Άνοιγμα, για να εμφανιστεί το πρόγραμμα επεξεργασίας μετασχηματισμού.

  2. Επιλέξτε ή τοποθετήστε τον δείκτη του ποντικιού πάνω από τη στήλη κειμένου που θέλετε να μετασχηματίσετε.
  3. Κάντε κλικ στις Επιλογές στη βάση του πλακιδίου ποιότητας και έπειτα κάντε κλικ στην Αντικατάσταση.
    Συμβουλή: Για να αντικαταστήσετε περισσότερες από μία τιμές ταυτόχρονα, χρησιμοποιήστε την επιλογή Αντικατάσταση λίστας τιμών.
  4. Στο εργαλείο επεξεργασίας βημάτων αντικατάστασης, καθορίστε πώς θα θέλατε να αντιστοιχιστούν οι τιμές. Για παράδειγμα:
    • Κάντε κλικ στην επιλογή Χρήση κανονικής έκφρασης για να αντιστοιχίσετε τη χρήση μιας σύνθετης κανονικής έκφρασης (regex).
    • Κάντε κλικ στην επιλογή Αντιστοίχιση ολόκληρων τιμών μόνο για να αλλάξετε το "male" σε "M" αλλά όχι το "female" σε "feM".
  5. Στο πεδίο Συμβολοσειρά για αντικατάσταση και στο πεδίο Νέα συμβολοσειρά, καθορίστε το ακριβές κείμενο ή τις κανονικές εκφράσεις για αναζήτηση και αντικατάσταση (με διάκριση πεζών-κεφαλαίων).
    Παραδείγματα :
    • Για να αλλάξετε το "2553 Bolman Court" σε "2553 #Bolman# #Court#", επιλέξτε Χρήση κανονικής έκφρασης, εισαγάγετε ([A-Za-z]+) στο πεδίο Συμβολοσειρά για αντικατάσταση και εισαγάγετε #$1# στο πεδίο Νέα συμβολοσειρά.
    • Για να αλλάξετε το "male" σε "M", επιλέξτε Αντιστοίχιση ολόκληρων τιμών μόνο, εισαγάγετε male στο πεδίο Συμβολοσειρά για αντικατάσταση και εισαγάγετε M στο πεδίο Νέα συμβολοσειρά. Με αυτόν τον τρόπο, το "male" αλλάζει σε "M" αλλά το "female" δεν αλλάζει σε "feM".

    Όταν συμπληρώσετε και τα δύο πεδία, θα δείτε σε προεπισκόπηση τα μετασχηματισμένα δεδομένα στο τμήμα παραθύρου προεπισκόπησης. Προσαρμόστε τις επιλογές αντικατάστασης μέχρι να λάβετε τον μετασχηματισμό που θέλετε στο τμήμα παραθύρου προεπισκόπησης.
  6. Κάντε κλικ στην επιλογή "Προσθήκη βήματος".
    Το Oracle Analytics προσθέτει ένα βήμα στο πλαίσιο "Δέσμη ενεργειών προετοιμασίας".
  7. Για να αποθηκεύσετε τις αλλαγές σας στην προετοιμασία δεδομένων και να τις εφαρμόσετε στα δεδομένα σας, επιλέξτε Αποθήκευση.

Παράδειγμα αντικατάστασης μετασχηματισμών με χρήση κανονικών εκφράσεων

Δείτε μερικά παραδείγματα χρήσης κανονικών εκφράσεων (regex) για τον μετασχηματισμό δεδομένων.

Σε αυτά τα παραδείγματα, η Έκφραση αναζήτησης είναι η τιμή που πρέπει να καταχωρίσετε στο πεδίο Συμβολοσειρά για αντικατάσταση, ενώ η Τιμή αντικατάστασης είναι η τιμή που πρέπει να καταχωρίσετε στο πεδίο Νέα συμβολοσειρά.

Πίνακας 3-1 Παράδειγμα αντικατάστασης μετασχηματισμών

Έκφραση αναζήτησης Τιμή αντικατάστασης Αρχικό κείμενο Αντικατεστημένο κείμενο Σημειώσεις
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com Αυτό το παράδειγμα αντικαθιστά λεπτομέρειες τομέα σε διευθύνσεις ηλεκτρονικού ταχυδρομείου.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Οι χαρακτήρες ^$ σημαίνουν μόνο αναζήτηση για αντιστοιχίσεις ολόκληρων συμβολοσειρών. Η κάθετος είναι η κανονική έκφραση για το OR, έτσι σε αυτήν την περίπτωση η κανονική έκφραση αναζητά είτε "Gray" είτε "Grey" και αντικαθιστά με το "Silver".

Η συμβολοσειρά "Graystone" δεν μετασχηματίζεται επειδή η κανονική έκφραση αναζητά μόνο αντιστοιχίσεις ολόκληρης τιμής.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Αυτή η κανονική έκφραση αναζητά ένα ψηφίο " \d" ή περισσότερα ψηφία "+" και τα αντικαθιστά με "9999". Η αντικατάσταση λειτουργεί επίσης όταν το αρχικό κείμενο διαθέτει μόνο τρία ψηφία.
([A-z]+)(\d+) 2$

UA101654

US829383

101654

829383

Αυτή η κανονική έκφραση κάνει αναζήτηση για ένα γράμμα "[A-z]" ή περισσότερα συνεχόμενα γράμματα "+" που ακολουθούνται από ένα ψηφίο "\d" ή περισσότερα ψηφία "+" - καθεμία από τις δύο εκφράσεις οριοθετείται από παρενθέσεις, που αντικατοπτρίζουν δύο ομάδες - την πρώτη ([A-z]) και τη δεύτερη (\d+) - αυτές οι ομάδες αριθμούνται αυτόματα και μπορούν στη συνέχεια να χρησιμοποιηθούν στην αντικατάσταση χρησιμοποιώντας το σύμβολο δολαρίου για τη δεύτερη ομάδα, για παράδειγμα, "$2".
([A-z]+)(\d+) Ταχυδρομικός κώδικας: 2$

UA101654

US829383

Ταχυδρομικός κώδικας: 101654

Ταχυδρομικός κώδικας: 829383

Αυτό το παράδειγμα χρησιμοποιεί την ίδια έκφραση αντιστοίχισης όπως το προηγούμενο παράδειγμα, εκτός από το ότι δείχνει πώς να εισαγάγετε το δικό σας κείμενο αντικατάστασης επιπροσθέτως μιας ομάδας. Το κείμενο μπορεί να εισαχθεί πριν και μετά από μια ομάδα αντιστοίχισης που ανακλήθηκε.