Преобразование данных с помощью замены

Преобразуйте данные в столбце с помощью простого сопоставления шаблонов или регулярного выражения (regex). Например, в столбце "Штат" значение CA можно изменить на "Калифорния".

Можно использовать любое из совместимых с Perl регулярных выражений (PCRE), которые также называются выражениями regex. Преобразования применяются ко всем соответствующим строкам в наборе данных.
  1. На главной странице наведите курсор на набор данных, владельцем которого вы являетесь, нажмите Действия и выберите Открыть.
    Если набор данных содержит одну таблицу, отобразится редактор преобразований. Если набор данных содержит несколько таблиц, отобразится диаграмма объединений. На диаграмме объединений правой кнопкой мыши нажмите на имя источника данных и нажмите Открыть, чтобы отобразить редактор преобразований.

  2. Наведите курсор на нужный текстовый столбец или выберите его.
  3. Нажмите Параметры в нижней части плитки качества, а затем нажмите Заменить.
    Совет. Чтобы заменить сразу несколько значений, используйте параметр Заменить список значений.
  4. В редакторе шагов замены укажите способ сопоставления значений. Пример:
    • Нажмите Использовать регулярное выражение, чтобы выполнить сопоставление, используя сложное регулярное выражение (regex).
    • Нажмите Сопоставлять только значения целиком, чтобы значение "male" менялось на "M", а "female" не менялось на "feM".
  5. В полях Строка для замены и Новая строка укажите литеральный текст или регулярные выражения для поиска и замены (с учетом регистра).
    Примеры:
    • Чтобы изменить значение "2553 Bolman Court" на "2553 #Bolman# #Court#", выберите Использовать регулярное выражение, введите ([A-Za-z]+) в поле Строка для замены и введите #$1# в поле Новая строка.
    • Чтобы изменить строку "male" на "M", выберите Сопоставлять только значения целиком, введите male в поле Строка для замены и введите M в поле Новая строка При этом строка "male" меняется на "М", но строка "female" не меняется на "feM".

    После заполнения обоих полей на панели предварительного просмотра отображаются преобразованные данные. Настраивайте параметры замены, пока на панели предварительного просмотра не появится нужное преобразование.
  6. Нажмите Добавить шаг.
    Oracle Analytics добавляет шаг на панель Сценарий подготовки.
  7. Чтобы сохранить изменения подготовки данных и применить их к данным, нажмите Сохранить.

Пример преобразований с заменой с использованием регулярных выражений

Вот несколько примеров использования регулярных выражений (regex) для преобразования данных.

В этих примерах в столбце "Выражение поиска" отображается то, что было введено в поле Строка для замены, а в поле "Значение замены" — то, что было введено в поле Новая строка.

Таблица 4-1 Пример преобразований с заменой

Выражение поиска Значение замены Исходный текст Замещенный текст Примечания
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com В этом примере в адресах электронной почты заменяются сведения о домене.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Символы ^$ означают только поиск совпадений целой строки. Вертикальная полоса — регулярное выражение для оператора ИЛИ, поэтому в этом случае регулярное выражение предназначено для поиска слова "Gray" или "Grey" с заменой на "Silver".

Строка Graystone не преобразуется, так как регулярное выражение ищет только полные совпадения значений.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Это регулярное выражение предназначено для поиска одной "\d" или более "+" цифр и замены их на "9999". Замена также работает, если исходный текст содержит только три цифры.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Это регулярное выражение предназначено для поиска одной "[A-z]" или нескольких "+" последовательных букв, за которыми следует одна "\d" или несколько "+" цифр. Каждое из двух выражений ограничено скобками, которые выделяют две группы: первая ([A-z]) и вторая (\d+). Эти группы нумеруются автоматически и могут быть использованы в замене, используя знак доллара для второй группы, например "$2".
([A-z]+)(\d+) Почтовый индекс: $2

UA101654

US829383

Почтовый индекс: 101654

Почтовый индекс: 829383

В этом примере используется то же выражение для сопоставления, что и в предыдущем примере, за исключением того, что в нем показано, как вставлять собственный текст для замены в дополнение к группе. Текст можно вставить до и после группы сопоставления, вызванной из памяти.