Quando você cria um conjunto de dados, o Oracle Analytics executa uma descrição de perfil no nível de coluna a fim de produzir um conjunto de recomendações semânticas para reparar ou enriquecer seus dados. Ao criar pastas de trabalho, você também pode incluir enriquecimentos de conhecimento em suas visualizações adicionando-os pelo Painel de Dados.
Essas recomendações se baseiam na detecção automática, feita pelo sistema, de um tipo de semântica específico durante a etapa de perfilamento. Por exemplo, perfis de conjuntos de dados baseados em áreas de assunto locais são criados usando uma amostra simples de N Principais.
Há categorias de tipos semânticos como localizações geográficas identificadas por nomes de cidade, padrões reconhecíveis como em cartões de crédito, endereços de e-mail e números do seguro social, datas e padrões recorrentes. Você também pode criar seus próprios tipos semânticos personalizados.
A criação de perfil é aplicada a vários tipos de semântica.
As categorias de tipo de semântica entram em um perfil para identificação:
As recomendações de reparo, aprimoramento ou enriquecimento do conjunto de dados são determinadas pelo tipo de dados.
Exemplos de recomendações de tipo de semântica:
Os tipos semânticos são identificados com base nos padrões encontrados nos dados.
São fornecidas recomendações para estes tipos de semântica:
O reconhecimento de tipos de semântica é determinado pelo conhecimento de referência carregado fornecido com o serviço.
As recomendações baseadas em referência são fornecidas para estes tipos de semântica:
Os enriquecimentos recomendados são baseados nos tipos de semântica.
Os enriquecimentos são determinados com base na hierarquia de localizações geográficas:
O processo de análise de perfil usa limites específicos para tomar decisões sobre determinados tipos de semântica.
Como regra geral, 85% dos valores de dados na coluna devem atender aos critérios de um único tipo de semântica para que o sistema faça a determinação de classificação. Como resultado, uma coluna que pode conter 70% de nomes e 30% de “outros" não atende aos requisitos de limite e, portanto, não são feitas recomendações.
Use recomendações de conhecimento personalizado para aumentar o conhecimento do sistema Oracle Analytics. O conhecimento personalizado permite que o criador de perfil semântico do Oracle Analytics identifique mais tipos semânticos específicos de negócios e faça recomendações de enriquecimento mais relevantes e controladas. Por exemplo, você pode adicionar uma referência de conhecimento personalizado que classifica medicamentos prescritos nas categorias de medicamentos da USP Analgésicos ou Opioides.