Criar e Usar Modelos Preditivos do Oracle Analytics

Os modelos preditivos do Oracle Analytics usam vários algoritmos incorporados do Oracle Machine Learning para explorar seus conjuntos de dados, prever um valor fixado ou identificar classes de registros. Use o editor de fluxo de dados para criar, treinar e aplicar modelos preditivos aos seus dados.

O Que São Modelos Preditivos do Oracle Analytics?

Um modelo preditivo do Oracle Analytics aplica um algoritmo específico a um conjunto de dados para prever valores, prever classes ou identificar grupos nos dados.

Você também pode usar modelos de aprendizado de máquina do sistema Oracle para prever dados.

O Oracle Analytics inclui algoritmos para ajudá-lo a treinar modelos preditivos para vários propósitos. Exemplos de algoritmos são árvores de classificação e regressão (CART), regressão logística e k-médias.

Você usa o editor de fluxo de dados para treinar primeiro um modelo em um conjunto de dados de treinamento. Após o treinamento do modelo preditivo, você o aplica aos conjuntos de dados que deseja prever.

Você pode disponibilizar um modelo treinado para outros usuários que podem aplicá-lo aos dados para prever valores. Em alguns casos, certos usuários treinam modelos e outros aplicam os modelos.

Nota:

Se você não tiver certeza do que procurar em seus dados, pode começar usando o recurso Explain, que usa o aprendizado de máquina para identificar tendências e padrões. Em seguida, você pode usar o editor de fluxo de dados para criar e treinar modelos preditivos para detalhar as tendências e padrões encontrados pelo recurso Explain.
Você usa o editor de fluxo de dados para treinar um modelo:
  • Primeiro, você cria um fluxo de dados e adiciona o conjunto de dados que deseja usar para treinar o modelo. Este conjunto de dados de treinamento contém os dados que você deseja prever (por exemplo, um valor como vendas ou idade ou uma variável como período de risco de crédito).
  • Se necessário, você pode usar o editor de fluxo de dados para editar o conjunto de dados adicionando colunas, selecionando colunas, unindo e assim por diante.
  • Depois de confirmar que os dados são para os quais você deseja treinar o modelo, adicione uma etapa de treinamento ao fluxo de dados e escolha um algoritmo de classificação (binário ou múltiplo), regressão ou cluster para treinar um modelo. Em seguida, nomeie o modelo resultante, salve o fluxo de dados e execute-o para treinar e criar o modelo.
  • Examine as propriedades nos objetos de aprendizado de máquina para determinar a qualidade do modelo. Se necessário, você pode repetir o processo de treinamento até que o modelo atinja a qualidade desejada.

Use o modelo finalizado para pontuar dados desconhecidos ou não rotulados para gerar um conjunto de dados em um fluxo de dados ou adicionar uma visualização de previsão a uma pasta de trabalho.

Exemplo

Suponha que você queira criar e treinar um modelo de várias classificações para prever quais pacientes têm um alto risco de desenvolver doenças cardíacas.

  1. Forneça um conjunto de dados de treinamento contendo atributos de pacientes individuais, como idade, sexo e se eles já tiveram dor no peito, além de métricas como pressão arterial, nível de açúcar no sangue em jejum, colesterol e frequência cardíaca máxima. O conjunto de dados de treinamento também contém uma coluna denominada "Probabilidade", que recebe um dos seguintes valores: ausente, menos provável, provável, altamente provável ou presente.
  2. Escolha o algoritmo CART (Árvore de Decisões) porque ignora colunas redundantes que não agregam valor para previsão e identifica e usa apenas as colunas que são úteis para prever o destino. Ao adicionar o algoritmo ao fluxo de dados, você escolhe a coluna Probabilidade para treinar o modelo. O algoritmo usa o aprendizado de máquina para escolher as colunas do fator necessárias para executar e gerar previsões e conjuntos de dados relacionados.
  3. Inspecione os resultados e ajuste o modelo de treinamento e aplique o modelo a um conjunto de dados maior para prever quais pacientes têm uma alta probabilidade de ter ou desenvolver doenças cardíacas.

Como Escolho um Algoritmo do Modelo Preditivo?

O Oracle Analytics fornece algoritmos para qualquer uma das suas necessidades de modelagem de aprendizado de máquina: previsão numérica, multiclassificador, classificador binário e clusterização.

A funcionalidade de aprendizado de máquina da Oracle é para analistas de dados avançados que têm uma ideia do que estão procurando nos dados, estão familiarizados com a prática da análise preditiva e compreendem as diferenças entre os algoritmos.

Nota:

Se você estiver usando dados provenientes do Oracle Autonomous Data Warehouse, poderá usar o recurso AutoML para treinar de maneira rápida e fácil um modelo preditivo para você, sem exigir habilidades de aprendizado de máquina. Consulte Treinar um Modelo Preditivo Usando AutoML no Autonomous Data Warehouse.

Normalmente, os usuários desejam criar vários modelos de previsão, compará-los e escolher o que mais provavelmente fornecerá resultados que satisfaçam seus critérios e requisitos. Esses critérios podem variar. Por exemplo, às vezes os usuários escolhem modelos com melhor precisão geral, às vezes escolhem modelos com menos erros do tipo I (falso positivo) e do tipo II (falso negativo), e às vezes os usuários escolhem modelos que retornam resultados mais rapidamente e com um nível aceitável de precisão, mesmo que os resultados não sejam ideais.

O Oracle Analytics contém vários algoritmos de aprendizado de máquina para cada tipo de previsão ou de classificação. Com esses algoritmos, os usuários podem criar mais de um modelo ou usar diferentes parâmetros ajustados ou usar diferentes conjuntos de dados de treinamento de entrada e escolher o melhor modelo. O usuário pode escolher o melhor modelo comparando e ponderando modelos com seus próprios critérios. Para determinar o melhor modelo, os usuários podem aplicar o modelo e visualizar os resultados dos cálculos para determinar a precisão, ou podem abrir e explorar os conjuntos de dados relacionados que o Oracle Analytics usou o modelo para produzir.

Consulte esta tabela para aprender sobre os algoritmos fornecidos:

Nome Tipo Categoria Função Descrição
CART

Classificação

Regressão

Classificador Binário

Multiclassificador

Numérico

- Utiliza árvores de decisões para prever valores discretos e contínuos.

Use com conjuntos de dados grandes.

Regressão Linear da Rede Elástica Regressão Numérico ElasticNet Modelo de regressão avançado. Fornece informações adicionais (regularização), realiza seleção de variáveis e combinações lineares. Penalidades dos métodos de regressão Lasso e Ridge.

Use com um grande número de atributos para evitar colinearidade (onde vários atributos estão perfeitamente correlacionados) e ajuste excessivo.

Hierárquico Clusterização Clusterização AgglomerativeClustering Cria uma hierarquia de clusterização usando métricas ascendentes (cada observação é seu próprio cluster e depois é mesclada) ou descendentes (todas as observações começam como um cluster) e de distância.

Use quando o conjunto de dados não for grande e o número de clusters não for conhecido previamente.

K-Médias Clusterização Clusterização k-médias Partilha repetidamente os registros em clusters k, onde cada observação pertence ao cluster com a média mais próxima.

Use para clusterizar colunas de métricas e com uma expectativa definida do número de clusters necessários. Funciona bem com grandes conjuntos de dados. O resultado é diferente a cada execução.

Regressão Linear Regressão Numérico Mínimos Quadrados Ordinários

Ridge

Lasso

Abordagem linear para um relacionamento de modelagem entre a variável de destino e outros atributos no conjunto de dados.

Use para prever valores numéricos quando os atributos não estiverem perfeitamente correlacionados.

Regressão Logística Regressão Classificador Binário LogisticRegressionCV Use para prever o valor de uma variável categoricamente dependente. A variável dependente é uma variável binária que contém dados codificados em 1 ou 0.
Naive Bayes Classificação

Classificador Binário

Multiclassificador

GaussianNB Classificação probabilística baseada no teorema de Bayes que não assume dependência entre características.

Use quando houver um número alto de dimensões de entrada.

Rede Neural Classificação

Classificador Binário

Multiclassificador

MLPClassifier Algoritmo de classificação iterativa que aprende comparando seu resultado de classificação com o valor real e o retorna à rede para modificar o algoritmo para outras iterações.

Use para análise de texto.

Previsão Aleatória Classificação

Classificador Binário

Multiclassificador

Numérico

- Um método de aprendizado de conjunto que constrói várias árvores de decisões e gera o valor que representa coletivamente todas as árvores de decisões.

Use para prever variáveis numéricas e categóricas.

SVM Classificação

Classificador Binário

Multiclassificador

LinearSVC, SVC Classifica os registros mapeando-os no espaço e construindo hiperplanos que podem ser usados para classificação. Novos registros (dados de pontuação) são mapeados no espaço e devem pertencer a uma categoria, que se baseia no lado do hiperplano onde eles estão.

Treinar um Modelo Preditivo Usando AutoML no Oracle Autonomous Data Warehouse

Ao usar dados do Oracle Autonomous Data Warehouse, você pode utilizar o recurso AutoML para recomendar e treinar um modelo preditivo. A etapa AutoML analisa seus dados, calcula o melhor algoritmo a ser usado e registra um modelo de previsão no Oracle Analytics para que você possa fazer previsões sobre seus dados.

Usar o AutoML significa que o Oracle Autonomous Data Warehouse faz todo o trabalho difícil para você para que você possa implantar um modelo de previsão sem conhecimentos de aprendizado de máquina ou inteligência artificial. O modelo de previsão gerado é salvo na área Modelos da página Aprendizado de Máquina. Para prever dados com base no novo modelo, crie um fluxo de dados e use a etapa Aplicar Modelo.
Antes de começar:
  • Crie no Oracle Autonomous Data Warehouse um conjunto de dados com base nos dados sobre os quais você deseja fazer previsões. Por exemplo, você poderá ter dados sobre atrito de funcionários, incluindo um campo chamado ATRITO indicando 'Sim' ou 'Não' para atrito.
  • Certifique-se de que o usuário do banco de dados especificado na conexão do Oracle Analytics com o Oracle Autonomous Data Warehouse tenha a atribuição OML_Developer e não seja um superusuário 'administrador'. Caso contrário, o fluxo de dados falhará quando você tentar salvá-lo ou executá-lo.
  1. Na Home page, clique em Criar e depois clique em Fluxo de Dados.
  2. Em Adicionar Conjunto de Dados, selecione o conjunto de dados com base no Oracle Autonomous Data Warehouse que contém os dados a serem analisados.
  3. Clique em Adicionar uma etapa; em seguida, clique em AutoML.
  4. Para Destino, clique em Selecionar uma coluna e selecione a coluna de dados que contém o valor que você está tentando prever.
    Por exemplo, para prever atrito de funcionários, você poderá selecionar um campo chamado ATRITO indicando 'VERDADEIRO' ou 'FALSO' para a saída ou não de funcionários de uma organização.

  5. Aceite as sugestões de Tipo de Tarefa e Métrica de Classificação de Modelo recomendadas pelo Oracle Analytics ou selecione outro algoritmo.
  6. Clique em Salvar Modelo e especifique o nome do modelo de previsão gerado.
  7. Clique em Salvar e especifique um nome para o fluxo de dados.
  8. Clique em Executar para analisar os dados e gerar um modelo preditivo.
  9. Na Home page, clique em Navegar e depois clique em Aprendizado de Máquina; em seguida, clique com o botão direito do mouse no modelo gerado e selecione Inspecionar.
Você pode localizar o modelo gerado pelo Oracle Analytics na página Aprendizado de Máquina na guia Modelos. Inspecione o modelo para avaliar sua qualidade. Consulte Avaliar a Qualidade do Modelo Preditivo. Você também pode consultar conjuntos de dados gerados para modelos originados por AutoML. Consulte O Que São os Conjuntos de Dados Relacionados a um Modelo Preditivo?.

Criar e Treinar um Modelo Preditivo

Analistas de dados de nível avançado cria e treinam modelos preditivos a fim de que possam usá-los para implantar algoritmos do Oracle Machine Learning e minerar conjuntos de dados, prever um valor de destino ou identificar classes de registros. Use o editor de fluxo de dados para criar e treinar modelos preditivos, e aplicá-los aos seus dados.

Ícone Tutorial LiveLabs Sprint

Chegar a um modelo preciso é um processo iterativo e um analista de dados avançado pode experimentar diferentes modelos, comparar seus resultados e ajustar parâmetros com base em tentativa e erro. Um analista de dados pode usar o modelo preditivo finalizado e preciso para prever tendências em outros conjuntos de dados ou adicionar o modelo às pastas de trabalho.

Nota:

Se você estiver usando dados provenientes do Oracle Autonomous Data Warehouse, poderá usar o recurso AutoML para treinar de maneira rápida e fácil um modelo preditivo para você, sem exigir habilidades de aprendizado de máquina. Consulte Treinar um Modelo Preditivo Usando AutoML no Autonomous Data Warehouse.

O Oracle Analytics fornece algoritmos para previsão numérica, várias classificações, classificação binária e cluster.

  1. Na Home page, clique em Criar e depois selecione Fluxo de Dados.
  2. Selecione o conjunto de dados que você deseja usar para treinar o modelo. Clique em Adicionar.
  3. No editor do fluxo de dados, clique em Adicionar uma etapa (+).
    Depois de adicionar um conjunto de dados, você pode usar todas as colunas no conjunto de dados para construir o modelo ou selecionar apenas as colunas relevantes. A escolha das colunas relevantes requer um conhecimento do conjunto de dados. Ignore as colunas que você sabe que não influenciarão o comportamento do resultado ou que contêm informações redundantes. Você pode escolher apenas colunas relevantes adicionando a etapa Selecionar Colunas. Se você não tiver certeza sobre as colunas relevantes, use todas as colunas.
  4. Selecione uma das etapas do modelo de treinamento (por exemplo, Treinar Previsão Numérica ou Treinar Clusterização).
  5. Selecione um algoritmo e clique em OK.
  6. Se você estiver trabalhando com um modelo supervisionado como previsão ou classificação, clique em Destino e selecione a coluna que você está tentando prever. Por exemplo, se você estiver criando um modelo para prever a renda de uma pessoa, selecione a coluna Renda.
    Se você estiver trabalhando com um modelo não supervisionado, como clusterização, nenhuma coluna de destino será necessária.
  7. Altere as definições padrão do seu modelo para ajustar e melhorar a precisão do resultado previsto. O modelo com o qual você está trabalhando determina essas definições.
  8. Clique na etapa Salvar Modelo e informe um nome e uma descrição.
  9. Clique em Salvar, informe um nome e uma descrição do fluxo de dados e clique em OK para salvar o fluxo de dados.
  10. Clique em Executar Fluxo de Dados para criar o modelo preditivo com base no conjunto de dados de entrada e nas definições do modelo que você forneceu.

Etapas de Fluxo de Dados para Treinar Modelos de Aprendizado de Máquina

O Oracle Analytics permite que você treine modelos de aprendizado de máquina usando etapas em fluxos de dados. Quando você tiver treinado um modelo de aprendizado de máquina, aplique-o aos seus dados usando a etapa Aplicar Modelo.

Nome da Etapa Descrição
AutoML (exige o Oracle Autonomous Data Warehouse) Use o recurso AutoML do Oracle Autonomous Data Warehouse para recomendar e treinar um modelo preditivo para você. A etapa AutoML analisa seus dados, calcula o melhor algoritmo a ser usado e registra um modelo de previsão no Oracle Analytics.
Treinar Classificador Binário

Treinar um modelo de aprendizado de máquina para classificar seus dados em uma de duas categorias predefinidas.

Treinar Clusterização Treinar um modelo de aprendizado de máquina para separar grupos com traços semelhantes e designá-los a clusters.
Treinar Multiclassificador Treinar um modelo de aprendizado de máquina para classificar seus dados em três ou mais categorias predefinidas.
Treinar Previsão Numérica Treinar um modelo de aprendizado de máquina para prever um valor numérico com base em valores de dados conhecidos.

Inspecionar um Modelo Preditivo

Depois de criar o modelo preditivo e executar o fluxo de dados, você pode revisar informações sobre o modelo para determinar sua precisão. Use estas informações para ajustar de forma iterativa as definições do modelo para melhorar a precisão e prever melhores resultados.

Exibir os Detalhes de um Modelo Preditivo

Informações detalhadas de um modelo preditivo ajudam você a entender o modelo e determinar se ele é adequado para prever seus dados. Os detalhes do modelo incluem classe, algoritmo, colunas de entrada e colunas de saída

  1. Na Home page, clique em Navegador Ícone do navegador usado para exibir o Navegadore, em seguida, clique em Aprendizado de Máquina.
  2. Clique no ícone de menu de um modelo de treinamento e selecione Inspecionar.
  3. Clique em Detalhes para ver as informações do modelo.

Avaliar a Qualidade do Modelo Preditivo

Exiba informações que ajudem você a entender a qualidade de um modelo preditivo. Por exemplo, você pode rever as métricas de precisão, exatidão, rechamada, valor F1 e taxa de falsos positivos do modelo.

O Oracle Analytics fornece métricas semelhantes, independentemente do algoritmo usado para criar o modelo, facilitando a comparação entre diferentes modelos. Durante o processo de criação do modelo, o conjunto de dados de entrada é dividido em duas partes para treinar e testar o modelo com base no parâmetro Percentual de Partição do Treino. O modelo usa a parte de teste do conjunto de dados para testar a precisão do modelo que é construído.
Com base em suas descobertas na guia Qualidade, você pode precisar ajustar os parâmetros do modelo e treiná-lo novamente.
  1. Na Home page, clique em Navegador Ícone do navegador usado para exibir o Navegadore, em seguida, clique em Aprendizado de Máquina.
  2. Clique no ícone de menu de um modelo de treinamento e selecione Inspecionar.
  3. Clique na guia Qualidade para rever as métricas de qualidade do modelo e avaliar o modelo. Por exemplo, analise a pontuação Precisão do Modelo.

Dica: Clique em Mais para analisar detalhes das views geradas para o modelo.

O Que São os Conjuntos de Dados Relacionados a um Modelo Preditivo?

Quando você executa o fluxo de dados para criar o modelo de treinamento do modelo preditivo do Oracle Analytics, ele cria uma série de conjuntos de dados relacionados. Você pode abrir e criar pastas de trabalho nesses conjuntos de dados para aprender sobre a precisão do modelo.

Dependendo do algoritmo escolhido para seu modelo, os conjuntos de dados relacionados contêm detalhes sobre o modelo, como: regras de previsão, métricas de precisão, matriz de confusão e fatores determinantes de previsão. Você pode usar essas informações para ajustar o modelo para obter melhores resultados e usar conjuntos de dados relacionados para comparar modelos e decidir qual modelo é mais preciso.

Por exemplo, você pode abrir um conjunto de dados Fatores para descobrir quais colunas têm uma forte influência positiva ou negativa no modelo. Ao examinar essas colunas, você descobre que algumas colunas não são tratadas como variáveis de modelo porque não são entradas realistas ou são granulares demais para a previsão. Você usa o editor de fluxo de dados para abrir o modelo e, com base nas informações descobertas, remove as colunas irrelevantes ou muito granulares e gera novamente o modelo. Você observa a guia Qualidade e Resultados e verifica se a precisão do modelo foi aprimorada. Você continua esse processo até estar satisfeito com a precisão do modelo e pronto para pontuar um novo conjunto de dados.

Algoritmos diferentes geram conjuntos de dados relacionados semelhantes. Parâmetros individuais e nomes de colunas podem mudar no conjunto de dados, dependendo do tipo de algoritmo, mas a funcionalidade do conjunto de dados permanece a mesma. Por exemplo, os nomes das colunas em um conjunto de dados estatísticos podem ser alterados de Regressão Linear para Regressão Logística, mas o conjunto de dados estatísticos contém métricas de precisão do modelo.

Conjuntos de Dados Relacionados para Modelos AutoML

Quando você treina um modelo preditivo usando AutoML, o Oracle Analytics cria conjuntos de dados adicionais que contêm informações úteis sobre o modelo. O número de conjuntos de dados criados depende do algoritmo do modelo. Por exemplo, para modelos Naive Bayes, o Oracle Analytics cria um conjunto de dados que fornece informações sobre probabilidades condicionais. Para um modelo de árvore de decisão, o conjunto de dados fornece informações sobre estatísticas de árvore de decisão. Ao inspecionar um modelo gerado por AutoML usando o algoritmo de modelo linear generalizado (GLM), você vê entradas prefixadas com GLM* para conjuntos de dados específicos do modelo que contêm informações de metadados sobre o modelo.
Descrição de GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png segue
.png

Conjuntos de Dados Relacionados

Nota:

O Oracle Analytics anexa o nome de saída do fluxo de dados ao tipo de conjunto de dados relacionado. Por exemplo, para um modelo CART, se a saída do fluxo de dados for denominada cart_model2, o conjunto de dados será denominado cart_model2_CART.

CART

O Oracle Analytics cria uma tabela para o conjunto de dados relacionado à CART (Árvore de Classificação e Regressão), que contém colunas que representam as condições e os critérios das condições na árvore de decisão, uma previsão para cada grupo e a confiança na previsão. Use a visualização do diagrama de árvore para visualizar essa árvore de decisão.

O conjunto de dados CART é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmo
Numérico CART para Previsão Numérica
Classificação Binária CART
Várias Classificações CART

Relatório de Classificação

O Oracle Analytics cria uma tabela para o conjunto de dados relacionado ao Relatório de Classificação. Por exemplo, se a coluna de destino puder ter os dois valores distintos Sim ou Não, esse conjunto de dados mostrará métricas de precisão como F1, Precisão, Rechamada e Suporte (o número de linhas no conjunto de dados de treinamento com esse valor) para cada valor distinto da coluna de destino.

O conjunto de dados Classificação é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmos
Classificação Binária

Naive Bayes

Rede Neural

Máquina de Vetor de Suporte

Várias Classificações

Naive Bayes

Rede Neural

Máquina de Vetor de Suporte

Matriz de Confusão

O Oracle Analytics cria uma tabela dinâmica para o conjunto de dados relacionado à Matriz de Confusão, que também é chamada de matriz de erros. Cada linha representa uma instância de uma classe prevista e cada coluna representa uma instância em uma classe real. Esta tabela relata o número de falsos positivos, falsos negativos, verdadeiros positivos e verdadeiros negativos, que são usados para calcular métricas de precisão, rechamada e precisão de F1.

O conjunto de dados Matriz de Confusão é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmos
Classificação Binária

Regressão Logística

CART (Árvore de Decisão)

Naive Bayes

Rede Neural

Previsão Aleatória

Máquina de Vetor de Suporte

Várias Classificações

CART (Árvore de Decisão)

Naive Bayes

Rede Neural

Previsão Aleatória

Máquina de Vetor de Suporte

Fatores

O Oracle Analytics cria uma tabela para o conjunto de dados relacionado a Fatores, que contém informações sobre as colunas que determinam os valores da coluna de destino. As regressões lineares são usadas para identificar essas colunas. Cada coluna recebe valores de coeficiente e correlação. O valor do coeficiente descreve o peso-idade da coluna usado para determinar o valor da coluna de destino. O valor de correlação indica a direção do relacionamento entre a coluna de destino e a coluna dependente. Por exemplo, se o valor da coluna de destino aumenta ou diminui com base na coluna dependente.

O conjunto de dados Fatores é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmos
Numérico

Regressão Linear

Regressão Linear da Rede Elástica

Classificação Binária

Regressão Logística

Máquina de Vetor de Suporte

Várias Classificações Máquina de Vetor de Suporte

Hitmap

O Oracle Analytics cria uma tabela para o conjunto de dados relacionado a Hitmap, que contém informações sobre os nós folha da árvore de decisão. Cada linha da tabela representa um nó folha e contém informações que descrevem o que esse nó folha representa, como tamanho do segmento, confiança e número esperado de linhas. Por exemplo, número esperado de previsões corretas = Tamanho do Segmento * Confiança.

O conjunto de dados Hitmap é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmo
Numérico CART para Previsão Numérica

Residuais

O Oracle Analytics cria uma tabela para o conjunto de dados relacionado a Resíduos, que contém informações sobre a qualidade das previsões residuais. Um residual é a diferença entre o valor medido e o valor previsto de um modelo de regressão. Este conjunto de dados contém um valor agregado da soma da diferença absoluta entre os valores reais e previstos para todas as colunas no conjunto de dados.

O conjunto de dados Resíduos é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmos
Numérico

Regressão Linear

Regressão Linear da Rede Elástica

CART para Previsão Numérica

Classificação Binária CART (Árvore de Decisão)
Várias Classificações CART (Árvore de Decisão)

Estatística

O Oracle Analytics cria uma tabela para o conjunto de dados relacionado a Estatísticas. As métricas desse conjunto de dados dependem do algoritmo usado para gerá-lo. Observe esta lista de métricas com base no algoritmo:

  • Regressão Linear, CART para Previsão Numérica, Regressão Linear da Rede Elástica - Esses algoritmos contêm R-Quadrado, R-Quadrado Ajustado, Erro Absoluto Médio (MAE), Erro Quadrático Médio (MSE), Erro Absoluto Relacionado (RAE), Erro Quadrático Relacionado (RSE), Raiz do Erro Quadrático Médio (RMSE).
  • CART(Árvores de Classificação e Regressão), Classificação de Naive Bayes, Rede Neural, Máquina de Vetores de Suporte (SVM), Previsão Aleatória, Regressão Logística - Esses algoritmos contêm Precisão, Total F1.

Este conjunto de dados é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmo
Numérico

Regressão Linear

Regressão Linear da Rede Elástica

CART para Previsão Numérica

Classificação Binária

Regressão Logística

CART (Árvore de Decisão)

Naive Bayes

Rede Neural

Previsão Aleatória

Máquina de Vetor de Suporte

Várias Classificações

Naive Bayes

Rede Neural

Previsão Aleatória

Máquina de Vetor de Suporte

Resumo

O Oracle Analytics cria uma tabela para o conjunto de dados relacionado a Resumo, que contém informações como nome do Destino e nome do Modelo.

O conjunto de dados Resumo é criado quando você seleciona essas combinações de modelo e algoritmo.

Modelo Algoritmos
Classificação Binária

Naive Bayes

Rede Neural

Máquina de Vetor de Suporte

Várias Classificações

Naive Bayes

Rede Neural

Máquina de Vetor de Suporte

Encontrar Conjuntos de Dados Relacionados de um Modelo Preditivo

São gerados conjuntos de dados relacionados quando você treina um modelo preditivo.

Dependendo do algoritmo, os conjuntos de dados relacionados conterão detalhes sobre o modelo, como: regras de previsão, métricas de precisão, matriz de confusão, fatores determinantes de previsão e assim por diante. Esses parâmetros ajudam a entender as regras que o modelo usou para determinar as previsões e classificações.
  1. Na Home page, clique em Navegador Ícone do navegador usado para exibir o Navegadore, em seguida, clique em Aprendizado de Máquina.
  2. Clique no ícone de menu de um modelo de treinamento e selecione Inspecionar.
  3. Clique na guia Relacionado para acessar os conjuntos de dados relacionados do modelo.
  4. Clique duas vezes em um conjunto de dados relacionado para visualizá-lo ou usá-lo em uma pasta de trabalho.

Adicionar um Modelo Preditivo a uma Pasta de Trabalho

Ao criar um cenário em uma pasta de trabalho, você aplica um modelo preditivo ao conjunto de dados da pasta de trabalho para revelar as tendências e padrões que o modelo foi projetado para encontrar.

Nota:

Você não pode aplicar um modelo de aprendizado de máquina do sistema Oracle aos dados de uma pasta de trabalho.
Depois que você adiciona o modelo à pasta de trabalho e mapeia as entradas do modelo para as colunas do conjunto de dados, o painel Dados contém os objetos do modelo, que você pode arrastar e soltar na tela. O aprendizado de máquina gera os valores do modelo com base nas colunas de dados correspondentes da visualização.
  1. Na Home page, clique em Criar e, em seguida, clique em Pasta de trabalho.
  2. Selecione o conjunto de dados que deseja usar para criar a pasta de trabalho e clique em Adicionar à Pasta de Trabalho.
  3. No painel Dados, clique em Adicionar e selecione Criar Cenário.
  4. Na caixa de diálogo Criar Cenário - Selecionar Modelo, selecione um modelo e clique em OK.
    Você só pode aplicar um modelo preditivo. Você não pode aplicar um modelo de aprendizado de máquina do sistema Oracle.
    Se cada entrada do modelo não puder corresponder a um elemento de dados, a caixa de diálogo Mapear seus Dados para o Modelo é exibida.
  5. Se a caixa de diálogo Mapear seus Dados para o Modelo for exibida, em seguida, no campo Conjunto de Dados, selecione o conjunto de dados a ser usado com o modelo.
  6. Corresponda a entrada do modelo e os elementos de dados, conforme necessário. Clique em Concluído.
    O cenário é exibido como um conjunto de dados no painel Elementos de Dados.
  7. Arraste e solte elementos do conjunto de dados e do modelo na tela Visualizar.
  8. Para ajustar o cenário, clique com o botão direito do mouse no cenário no painel Elementos de Dados e selecione Editar Cenário.
  9. Altere o conjunto de dados e atualize a entrada do modelo e o mapeamento dos elementos de dados, conforme necessário.
  10. Clique em Salvar para salvar a pasta de trabalho.