Transformar Dados Usando a Substituição

Transforme dados em uma coluna usando uma correspondência de padrão simples ou uma expressão regular (regex). Por exemplo, em uma coluna Estado, você poderá alterar CA para Califórnia.

Você pode usar qualquer PCRE (Perl Compatible Regular Expression), que também é conhecida como expressão regular. As transformações são aplicadas a cada linha aplicável em um conjunto de dados.
  1. Na Home page, passe o cursor do mouse sobre um conjunto de dados de sua propriedade, clique em Ações e, em seguida, selecione Abrir.
    Se o conjunto de dados contiver uma única tabela, você verá o editor de transformação. Se o conjunto de dados contiver várias tabelas, você verá o Diagrama de Junção. No Diagrama de Junção, clique com o botão direito do mouse em uma origem de dados e clique em Abrir para exibir o editor de transformação.

  2. Selecione ou passe o cursor do mouse sobre a coluna de texto que você deseja transformar.
  3. Clique em (Opções) na base do mosaico de qualidade e, em seguida, clique em Substituir.
    Dica: Para substituir mais de um valor ao mesmo tempo, use a opção Substituir Lista de Valores.
  4. No editor de etapa de substituição, especifique como gostaria de corresponder os valores. Por exemplo:
    • Clique em Usar expressão regular para correspondência usando uma expressão regular (regex) complexa.
    • Clique em Corresponder valores inteiros somente para alterar "male" para "M", mas não "female" para "feM".
  5. Nos campos String a ser substituída e Nova string, especifique o texto literal ou as expressões regulares a serem pesquisadas e substituídas (faz distinção entre maiúsculas e minúsculas).
    Exemplos de:
    • Para alterar "2553 Bolman Court" para "2553 #Bolman# #Court#", selecione Usar expressão regular, digite ([A-Za-z]+) no campo String a ser substituída e digite #$1# no campo Nova String.
    • Para alterar "male" com "M", selecione Corresponder valores inteiros somente, digite male no campo String a ser substituída e digite M no campo Nova String. Isso altera "male" para "M", mas não vai alterar "female" para "feM".

    Ao preencher os dois campos, você verá os dados transformados no painel de visualização. Ajuste as opções de substituição até que obtenha a transformação desejada no painel de visualização.
  6. Clique em Adicionar Etapa.
    O Oracle Analytics adiciona uma etapa ao painel de Script de Preparação.
  7. Para salvar suas alterações de preparação de dados e aplicá-las a seus dados, clique em Salvar.

Exemplo de Transformações de Substituição Usando Expressões Regulares

Estes são apenas alguns exemplos do uso de expressões regulares (regex) para transformar dados.

Nesses exemplos, a Expressão de Pesquisa mostra o que você digitaria no campo String a ser substituída e o Valor de Substituição mostra o que você digitaria no campo Nova string.

Tabela 4-1 Exemplo de transformações de substituição

Expressão de Pesquisa Valor de Substituição Texto Original Texto Substituído Observações
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com Este exemplo substitui detalhes do domínio em endereços de e-mail.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Os caracteres ^$ significam que somente devem ser procuradas correspondências de string inteira. A barra vertical é a expressão regular para OR, de modo que nesse caso a expressão regular procura "Gray" ou "Grey" e substitui por "Silver".

A string Graystone não é transformada porque a expressão regular está procurando apenas correspondências de valor inteiro.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Esta expressão regular procura um " \d" ou mais "+" dígitos e os substitui por "9999". A substituição também funciona quando o texto original tem apenas três dígitos.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

A expressão regular está procurando uma "[A-z]" ou mais "+" letras consecutivas seguidas por um " \d" ou mais "+" dígitos - as duas expressões estão entre parênteses, o que captura dois grupos - o primeiro ([A-z]) e o segundo (\d+) - esses grupos pressgroups são numerados automaticamente e podem ser usados na substituição usando o sinal de cifrão para o segundo grupo, por exemplo, "$2".
([A-z]+)(\d+) Postal Code: $2

UA101654

US829383

Postal Code: 101654

Postal Code: 829383

Esse exemplo usa a mesma expressão de correspondência que o exemplo anterior, exceto que mostra como inserir seu próprio texto de substituição além de um grupo. O texto pode ser inserido antes e depois de um grupo de correspondência rechamado.