Enriquecer e Transformar a Referência

Utilize estas informações de referência para o ajudar a enriquecer e a transformar os seus dados.

Transformar Referência

Obtenha informações sobre as opções de transformação de dados às quais pode aceder no editor de transformações clicando com o botão direito do rato numa coluna de conjunto de dados. Por exemplo, para categorizar os tempos das voltas na corrida de automóveis numa coluna de conjunto de dados, pode clicar com o botão direito do rato na coluna 'Tempo das Voltas' e selecione Agrupamento.

Opção Descrição
Agrupamento Cria os seus próprios grupos customizados para intervalos de números. Por exemplo, pode criar agrupamentos para uma coluna Idade com faixas etárias agrupadas em Pré-Adolescente, Jovem Adulto, Adulto ou Terceira Idade, com base em requisitos customizados.
Converter em Data Altera o tipo de dados da coluna para data e apaga os valores que não são datas da coluna.
Converter em Número Altera o tipo de dados da coluna para número, o que apaga os valores que não são números da coluna.
Converter em Texto Altera o tipo de dados de uma coluna para texto.
Criar Cria uma coluna com base numa função.
Duplicar Cria uma coluna com conteúdo idêntico ao da coluna selecionada.
Editar Edita a coluna. Por exemplo, pode alterar o nome, selecionar outra coluna ou atualizar funções.
Grupo, Grupo Condicional Selecione Grupo para criar os seus próprios grupos customizados. Por exemplo, pode agrupar Distritos com regiões customizadas e pode categorizar montantes em euros em grupos para indicar pequenos, médios e grandes.
Ocultar Oculta a coluna na Secção Dados e nas visualizações. Se pretender ver as colunas ocultas, clique em Colunas ocultas (ícone fantasma) no rodapé da página. Em seguida, pode anular a ocultação de colunas individuais ou de todas as colunas ocultas ao mesmo tempo.
Logaritmo Calcula o logaritmo natural de uma expressão.
Minúsculas Atualiza o conteúdo de uma coluna com os valores em letras minúsculas.
Potência Eleva os valores de uma coluna à potência que especificar. A potência por omissão é 2.
Renomear Permite-lhe alterar o nome de qualquer coluna.
Substituir Altera texto específico na coluna selecionada para qualquer valor que especificar. Por exemplo, pode alterar todas as instâncias de Senhor para Sr. na coluna.
Maiúscula no Início da Frase Atualiza o conteúdo de uma coluna de modo a que primeira letra da primeira palavra de uma frase seja maiúscula.
Dividir Divide um valor de coluna específico em partes. Por exemplo, pode dividir uma coluna denominada Nome em nome próprio e apelido.
Raiz Quadrada Cria uma coluna preenchida com a raiz quadrada do valor na coluna selecionada.
Maiúsculas Atualiza o conteúdo de uma coluna com os valores em letras maiúsculas.

Perfis de Dados e Recomendações Semânticas

Quando cria um conjunto de dados, o Oracle Analytics efetuou a criação do perfil ao nível das colunas para produzir um conjunto de recomendações semânticas que visam reparar ou enriquecer os seus dados. Quando cria livros, também pode incluir melhoramentos de conteúdos nas suas visualizações ao acrescentá-los a partir do Painel Dados.

Estas recomendações baseiam-se na deteção automática efetuada pelo sistema de um tipo semântico específico durante o passo do perfil. Por exemplo, são criados perfis dos conjuntos de dados com base nas áreas de atividade locais utilizando uma amostra simples de N principal.

Existem categorias de tipos semânticos, como localizações geográficas identificadas por nomes de localidades, padrões reconhecíveis como em cartões de crédito, endereços de email e números de segurança social, datas e padrões repetitivos. Também pode criar os seus próprios tipos semânticos customizados.

Categorias de Tipos Semânticos

A criação de perfis é aplicada a vários tipos semânticos.

São criados perfis para as categorias de tipos semânticos de modo a identificar:

  • Localizações geográficas, como nomes de localidades.
  • Padrões, como os que se encontram nos números de cartões de crédito ou endereços de email.
  • Padrões repetitivos como dados de frases hifenizadas.

Recomendações de Tipos Semânticos

As recomendações para reparar, melhorar ou enriquecer o conjunto de dados são determinadas pelo tipo de dados.

Exemplos de recomendações de tipos semânticos:

  • Enriquecimentos - Acrescentar uma nova coluna aos seus dados que corresponde a um tipo detetado específico, como uma localização geográfica. Por exemplo, acrescentar dados de população para uma localidade.
  • Concatenações de Colunas - Quando são detetadas duas colunas no conjunto de dados, uma com nomes próprios e outra com apelidos, o sistema recomenda concatenar os nomes numa única coluna. Por exemplo, uma coluna nome_próprio_apelido.
  • Extrações Semânticas - Quando um tipo semântico é composto por subtipos como, por exemplo, um número telefone_eua que inclui o indicativo, o sistema recomenda extrair o subtipo para uma coluna própria.
  • Extração de Partes - Quando é detetado um separador de padrão genérico nos dados, o sistema recomenda extrair partes desse padrão. Por exemplo, se o sistema detetar uma hifenização repetitiva nos dados, recomenda extrair as partes para colunas separadas, com vista a tornar os dados mais úteis para análise.
  • Extrações de Datas - Quando são detetadas datas, o sistema recomenda extrair as partes da data que poderão aumentar a análise dos dados. Por exemplo, pode extrair o dia da semana de uma data de fatura ou compra.
  • Ofuscação/Máscara/Apagamento Total e Parcial - Quando são detetados campos sensíveis, como um número de cartão de crédito, o sistema recomenda uma máscara total ou parcial da coluna, ou até mesmo a sua remoção.

Tipos Semânticos Baseados em Padrões Reconhecidos

Os tipos semânticos são identificados com base nos padrões encontrados nos dados.

São fornecidas recomendações para estes tipos semânticos:

  • Datas (em mais de 30 formatos)
  • Números de Identificação da Segurança Social (NISS) - EUA
  • Números de Cartão de Crédito
  • Atributos do Cartão de Crédito (CVV e Data e Expiração)
  • Endereços de Email
  • Números de Telefone de Planos Norte Americanos
  • Endereços - EUA

Tipos Semânticos Baseados em Referências

O reconhecimento dos tipos semânticos é determinado pelos conhecimentos de referência carregados fornecidos com o serviço.

São fornecidas recomendações baseadas em referências para estes tipos semânticos:

  • Nomes de países
  • Códigos de países
  • Nomes de distritos (Províncias)
  • Códigos de distritos
  • Nomes de concelhos (Jurisdições)
  • Nomes de localidades (Nomes Localizados)
  • Códigos postais

Enriquecimentos Recomendados

Os enriquecimentos recomendados baseiam-se nos tipos semânticos.

Os enriquecimentos são determinados com base na hierarquia da localização geográfica:

  • País
  • Província (Estado)
  • Jurisdição (Concelho)
  • Longitude
  • Latitude
  • População
  • Elevação (em Metros)
  • Fuso horário
  • Códigos de países ISO
  • FIPS (Federal Information Processing Series)
  • Nome do país
  • Capital
  • Continente
  • ID em GeoNames
  • Línguas faladas
  • Indicativo telefónico do país
  • Formato do código postal
  • Padrão do código postal
  • Indicativo telefónico do país
  • Nome da moeda
  • Abreviatura da moeda
  • Domínio de nível superior geográfico (GeoLTD)
  • KM quadrados

Limiares Obrigatórios

O processo de criação do perfil utiliza limiares específicos para decidir sobre tipos semânticos específicos.

Regra geral, 85% dos valores dos dados na coluna têm de corresponder aos critérios de um único tipo semântico para que o sistema possa determinar a respetiva classificação. Como resultado, uma coluna que contenha 70% de nomes próprios e 30% de “outros” não cumpre os requisitos de limiar e, por conseguinte, não é efetuada nenhuma recomendação.

Recomendações de Conteúdos Customizados

Utilize as recomendações de conteúdo customizado para aumentar os conteúdos de sistema do Oracle Analytics. Os conteúdos customizados permitem que o profiler semântico do Oracle Analytics identifique mais tipos de semântica específicos de negócio e faça recomendações mais relevantes e enriquecidas do ponto de vista regulamentar. Pode, por exemplo, acrescentar uma referência de conteúdos customizados que classifique a medicação com receita médica na categoria de Analgésicos ou Opioides da U.S. Pharmacopeia (USP).

ícone Guia Prático Guia Prático

Pode utilizar ficheiros semânticos existentes, tais como ficheiros USP (Unsupervised Semantic Parsing), ou pode criar os seus próprios ficheiros semânticos. Peça ao administrador que carregue os ficheiros de conteúdos customizados para o Oracle Analytics. Quando o utilizador enriquece os conjuntos de dados, o Oracle Analytics apresenta recomendações de enriquecimento baseadas nestes dados semânticos. Quando cria livros, também pode incluir melhoramentos de conteúdos nas suas visualizações ao acrescentá-los a partir do Painel Dados.

Criar os Seus Ficheiros de Conteúdos Customizados

Ao criar os seus próprios ficheiros semânticos, siga as seguintes diretrizes:

  • Crie um ficheiro de dados no formato CSV ou Microsoft Excel (XLSX). O tamanho máximo do ficheiro que pode carregar é 250 MB.
  • Preencha a primeira coluna com a chave que o Oracle Analytics utiliza para criar um perfil dos dados.
  • Preencha as outras colunas com os valores de enriquecimento.

Peça ao administrador que carregue o seu ficheiro de conteúdos customizados para o Oracle Analytics.

Cadeias de Caracteres Gerais de Formato Customizado

Pode utilizar as cadeias de caracteres customizadas gerais para criar formatos de hora ou data customizados.

A tabela mostra as cadeias de caracteres gerais de formato customizado e os resultados que apresentam. Estas permitem a apresentação dos campos de data e hora nas definições locais do utilizador.

Cadeia de Caracteres de Formato Geral Resultado

[FMT:dateShort]

Formata a data no formato de data abreviada das definições locais. Também pode escrever [FMT:date].

[FMT:dateLong]

Formata a data no formato de data longa das definições locais.

[FMT:dateInput]

Formata a data num formato aceitável para a entrada de dados de novo no sistema.

[FMT:time]

Formata a hora no formato de hora das definições locais.

[FMT:timeHourMin]

Formata a hora no formato de hora das definições locais, mas omite os segundos.

[FMT:timeInput]

Formata a hora num formato aceitável para entrada de dados de novo no sistema.

[FMT:timeInputHourMin]

Formata a hora num formato aceitável para entrada de dados de novo no sistema, mas omite os segundos.

[FMT:timeStampShort]

O equivalente a escrever [FMT:dateShort] [FMT:time]. Formata a data no formato de data abreviada das definições locais e a hora no formato de hora das definições locais. Também pode escrever [FMT:timeStamp].

[FMT:timeStampLong]

O equivalente a escrever [FMT:dateLong] [FMT:time]. Formata a data no formato de data longa das definições locais e a hora no formato de hora das definições locais.

[FMT:timeStampInput]

O equivalente a [FMT:dateInput] [FMT:timeInput]. Formata a data e a hora num formato aceitável para entrada de dados de novo no sistema.

[FMT:timeHour]

Formata o campo da hora apenas no formato das definições locais, como 8:00 pm.

YY ou yy

Apresenta os últimos dois dígitos do ano, por exemplo, 11 para 2011.

YYY ou yyy

Apresenta os últimos três dígitos do ano, por exemplo, 011 para 2011.

YYYY ou yyyy

Apresenta os quatro dígitos do ano, por exemplo, 2011.

M

Apresenta o mês numérico, por exemplo, 2 para fevereiro.

MM

Apresenta o mês numérico, preenchido com um ou mais zeros à esquerda para meses com dois dígitos, por exemplo, 02 para fevereiro.

MMM

Apresenta o nome abreviado do mês nas definições locais do utilizador, por exemplo, Fev.

MMMM

Apresenta o nome integral do mês nas definições locais do utilizador, por exemplo, Fevereiro.

D ou d

Apresenta o dia do mês, por exemplo, 1.

DD ou dd

Apresenta o dia do mês, preenchido com um ou mais zeros à esquerda para dias de dígitos únicos, por exemplo, 01.

DDD ou ddd

Apresenta o nome abreviado do dia da semana nas definições locais do utilizador, por exemplo, Qui para quinta-feira.

DDDD ou dddd

Apresenta o nome integral do dia da semana nas definições locais do utilizador, por exemplo, Quinta-feira.

DDDDD ou ddddd

Apresenta a primeira letra do nome do dia da semana nas definições locais do utilizador, por exemplo, Q para quinta-feira.

r

Apresenta o dia do ano, por exemplo, 1.

rr

Apresenta o dia do ano, preenchido com um ou mais zeros à esquerda como dígito único para o dia do ano, por exemplo, 01.

rrr

Apresenta o dia do ano, preenchido com um ou mais zeros à esquerda como dígito único ou dígito duplo para o dia do ano, por exemplo, 001.

w

Apresenta a semana do ano, por exemplo, 1.

ww

Apresenta a semana do ano, preenchido com um ou mais zeros à esquerda para semanas de dígitos únicos, por exemplo, 01.

q

Apresenta o trimestre do ano, por exemplo, 4.

h

Apresenta a hora no formato de 12 horas, por exemplo, 2.

H

Apresenta a hora no formato de 24 horas, por exemplo, 23.

hh

Apresenta a hora no formato de 12 horas, preenchido com um ou mais zeros à esquerda para horas de dígito único, por exemplo, 01.

HH

Apresenta a hora no formato de 24 horas, preenchido com um ou mais zeros à esquerda para horas de dígito único, por exemplo, 23.

m

Apresenta o minuto, por exemplo, 7.

mm

Apresenta o minuto, preenchido com um ou mais zeros à esquerda para minutos de dígito único, por exemplo, 07.

s

Apresenta o segundo, por exemplo, 2.

Também pode incluir decimais na cadeia de caracteres, como s.# ou s.00 (onde # representa um dígito opcional e 0 representa um dígito necessário).

ss

Apresenta o segundo, preenchido com um ou mais zeros à esquerda para segundos de dígito único, por exemplo, 02.

Também pode incluir decimais na cadeia de caracteres, como ss.# ou ss.00 (onde # representa um dígito opcional e 0 representa um dígito necessário).

S

Apresenta o milésimo de segundo, por exemplo, 2.

SS

Apresenta o milésimo de segundo, preenchido com um ou mais zeros à esquerda como dígito único para milésimos de segundos, por exemplo, 02.

SSS

Apresenta o milésimo de segundo, preenchido com um ou mais zeros à esquerda como dígito único para milésimos de segundos, por exemplo, 002.

tt

Apresenta a abreviatura de ante meridiem ou post meridiem nas definições locais do utilizador, por exemplo, pm.

gg

Apresenta a era nas definições locais do utilizador.