Criar e Utilizar Modelos de Previsão do Oracle Analytics

Os modelos de previsão do Oracle Analytics utilizam diversos algoritmos do Oracle Machine Learning incorporados para extrair os seus conjuntos de dados, prever um valor-alvo ou identificar classes de registos. Utilize o editor de fluxos de dados para criar, treinar e aplicar os modelos de previsão aos seus dados.

O que São os Modelos de Previsão do Oracle Analytics?

Um modelo de previsão do Oracle Analytics aplica um algoritmo específico a um conjunto de dados para prever valores, prever classes ou identificar grupos nos dados.

Também pode utilizar os modelos de aprendizagem automática Oracle para prever dados.

O Oracle Analytics inclui algoritmos para o ajudar a treinar modelos de previsão para vários fins. Exemplos de algoritmos são as árvores de classificação e regressão (CART), a regressão logística e k-means.

Utilize o editor de fluxos de dados para treinar primeiro um modelo num conjunto de dados de treino. Após o treino do modelo de previsão, pode aplicá-lo aos conjuntos de dados que pretende prever.

Pode disponibilizar um modelo treinado aos outros utilizadores que o podem aplicar aos respetivos dados para prever valores. Em alguns casos, determinados utilizadores treinam modelos e outros utilizadores aplicam os modelos.

Nota:

Se não souber o que procurar nos seus dados, pode começar por utilizar a funcionalidade Explicar, que utiliza a aprendizagem automática para identificar tendências e padrões. Em seguida, pode utilizar o editor de fluxos de dados para criar e treinar modelos de previsão para definir o nível de detalhe para as tendências e os padrões que a funcionalidade Explicar encontrou.
Utilize o editor de fluxos de dados para treinar um modelo:
  • Primeiro, crie um fluxo de dados e acrescente o conjunto de dados que pretende utilizar para treinar o modelo. Este conjunto de dados de treino contém os dados que pretende prever (por exemplo, um valor como vendas ou idade, ou uma variável como intervalo de risco de crédito).
  • Se for necessário, pode utilizar o editor de fluxos de dados para editar o conjunto de dados ao acrescentar colunas, selecionar colunas, efetuar junção, etc.
  • Após confirmar que os dados são os pretendidos para treinar o modelo, acrescente um passo de treino ao fluxo de dados e escolha um algoritmo de classificação (binária ou múltipla), regressão ou cluster para treinar um modelo. Em seguida, atribua um nome ao modelo resultante, grave o fluxo de dados e execute-o para treinar e criar o modelo.
  • Examine as propriedades nos objetos de aprendizagem automática para determinar a qualidade do modelo. Se for necessário, pode repetir o processo de treino até o modelo atingir a qualidade pretendida.

Utilize o modelo terminado para pontuar os dados desconhecidos, ou sem etiqueta, para gerar um conjunto de dados num fluxo de dados ou acrescentar uma visualização da previsão a um livro.

Exemplo

Suponha que pretende criar e treinar um modelo de classificação múltipla para prever quais os pacientes com um risco elevado de desenvolvimento de doenças cardíacas.

  1. Forneça um conjunto de dados de treino que contenha atributos sobre os pacientes individuais como idade, género e se alguma vez sentiram dores no peito, e métricas como tensão arterial, glicemia em jejum, colesterol e frequência cardíaca máxima. O conjunto de dados de treino também contém uma coluna denominada "Probabilidade" à qual é atribuído um dos seguintes valores: ausente, pouco provável, provável, altamente provável ou presente.
  2. Escolha o algoritmo CART (Árvore de Decisões) uma vez que este ignora as colunas redundantes que não acrescentam valor à previsão, identificando e utilizando apenas as colunas que são úteis para prever o valor de destino. Ao acrescentar o algoritmo ao fluxo de dados, escolhe a coluna Probabilidade para treinar o modelo. O algoritmo utiliza a aprendizagem automática para escolher as colunas de fatores condutores necessárias para executar e fornecer as previsões e os conjuntos de dados relacionados.
  3. Inspecione os resultados e otimize o modelo de treino, depois aplique o modelo a um conjunto de dados maior para prever quais os pacientes com uma probabilidade elevada de terem ou desenvolverem doenças cardíacas.

Como Escolho um Algoritmo do Modelo de Previsão?

O Oracle Analytics fornece algoritmos para todas as suas necessidades de modelagem de aprendizagem automática: previsão numérica, vários classificadores, classificador binário e clustering.

A funcionalidade de aprendizagem automática da Oracle destina-se aos analistas de dados avançados que sabem o que estão à procura nos dados, estão familiarizados com a prática de análise preditiva e compreendem as diferenças entre os algoritmos.

Nota:

Se estiver a utilizar dados com origem no Oracle Autonomous Data Warehouse, pode utilizar a capacidade de AutoML para treinar um modelo de previsão de forma rápida e fácil, sem necessitar de conhecimentos de aprendizagem automática. Consulte Treinar um Modelo de Previsão Utilizando AutoML no Autonomous Data Warehouse.

Normalmente, os utilizadores querem criar vários modelos de previsão, compará-los e escolher aquele que tem maior probabilidade de fornecer resultados que satisfazem os critérios e requisitos pretendidos. Estes critérios podem variar. Por exemplo, às vezes os utilizadores escolhem modelos com uma melhor precisão global, outras vezes os utilizadores escolhem modelos que têm o menor número de erros de tipo I (falso positivo) e tipo II (falso negativo), e outras vezes ainda os utilizadores escolhem modelos que devolvem resultados mais rapidamente e com um nível aceitável de exatidão, mesmo que os resultados não sejam ideais.

O Oracle Analytics contém vários algoritmos de aprendizagem automática para cada tipo de previsão ou classificação. Com estes algoritmos, os utilizadores podem criar mais de um modelo, utilizar diferentes parâmetros otimizados ou utilizar diferentes conjuntos de dados de treino de entrada de dados e, em seguida, escolher o melhor modelo. O utilizador pode escolher o melhor modelo ao comparar e ponderar os modelos em relação aos seus próprios critérios. Para determinar qual o melhor modelo, os utilizadores podem aplicar o modelo e visualizar os resultados dos cálculos para determinar a exatidão ou podem abrir e explorar os conjuntos de dados relacionados que o Oracle Analytics utilizou no modelo para saída de dados.

Consulte esta tabela para obter informações sobre os algoritmos fornecidos:

Nome Tipo Categoria Função Descrição
CART

Classificação

Regressão

Classificador Binário

Vários Classificadores

Numérico

- Utiliza árvores de decisões para prever valores discretos e contínuos.

Utilize com conjuntos de dados de grandes dimensões.

Regressão Linear de Rede Elástica Regressão Numérico ElasticNet Modelo de regressão avançado. Fornece informações adicionais (regularização), efetua a seleção de variáveis e efetua combinações lineares. Penalizações dos métodos de regressão Lasso e Ridge.

Utilize com um grande número de atributos para evitar a colinearidade (onde vários atributos têm uma correlação perfeita) e o sobreajustamento.

Hierárquico Clustering Clustering AgglomerativeClustering Cria uma hierarquia de clustering utilizando ascendente (cada observação é o seu próprio cluster e depois é fundida) ou descendente (todas as observações começam como um cluster) e métricas de distância.

Utilize quando o conjunto de dados não é grande e o número de clusters não é conhecido antecipadamente.

K-Means Clustering Clustering k-means Particiona iterativamente os registos em clusters k em que cada observação pertence ao cluster com a média mais próxima.

Utilize para colunas de métrica de clustering e com uma expectativa definida do número de clusters necessários. Funciona bem com conjuntos de dados de grandes dimensões. Os resultados são diferentes em cada execução.

Regressão Linear Regressão Numérico Mínimos Quadrados Ordinários

Ridge

Lasso

Abordagem linear para uma relação de modelagem entre a variável de destino e outros atributos no conjunto de dados.

Utilize para prever valores numéricos quando os atributos não têm uma correlação perfeita.

Regressão Logística Regressão Classificador Binário LogisticRegressionCV Utilize para prever o valor de uma variável dependente categoricamente. A variável dependente é uma variável binária que contém dados codificados para 1 ou 0.
Naive Bayes Classificação

Classificador Binário

Vários Classificadores

GaussianNB Classificação probabilística baseada no teorema de Bayes que assume a independência entre características.

Utilize quando existir um número elevado de dimensões de entrada de dados.

Rede Neural Classificação

Classificador Binário

Vários Classificadores

MLPClassifier Algoritmo de classificação iterativa que aprende ao comparar o respetivo resultado de classificação com o valor real, devolvendo-o à rede para modificar o algoritmo para iterações adicionais.

Utilize para a análise de texto.

Floresta Aleatória Classificação

Classificador Binário

Vários Classificadores

Numérico

- Um método de aprendizagem de conjunto que constrói várias árvores de decisões e fornece o valor que representa coletivamente todas as árvores de decisões.

Utilize para prever variáveis numéricas e categóricas.

SVM Classificação

Classificador Binário

Vários Classificadores

LinearSVC, SVC Classifica os registos efetuando a respetiva correspondência no espaço e construindo hiperplanos que podem ser utilizados para a classificação. É efetuada a correspondência dos novos registos (dados de pontuação) no espaço, prevendo-se que pertençam a uma categoria, a qual se baseia no lado do hiperplano em que se situam.

Treinar um Modelo de Previsão Utilizando AutoML no Oracle Autonomous Data Warehouse

Ao utilizar dados do Oracle Autonomous Data Warehouse, pode utilizar a respetiva capacidade de AutoML para recomendar e treinar um modelo de previsão. O AutoML analisa os seus dados, calcula o melhor algoritmo a utilizar e regista um modelo de previsão no Oracle Analytics para que possa fazer previsões sobre os seus dados.

Utilizar o AutoML significa que o Oracle Autonomous Data Warehouse faz todo o trabalho árduo por si, para que possa implementar um modelo de previsão sem conhecimentos de aprendizagem automática ou inteligência artificial. O modelo de previsão gerado é gravado na área Modelos da página Aprendizagem Automática. Para prever dados com base no novo modelo, crie um fluxo de dados e utilize o passo Aplicar Modelo.
Antes de começar:
  • Crie um conjunto de dados com base nos dados do Oracle Autonomous Data Warehouse sobre os quais pretende fazer previsões. Por exemplo, poderá ter dados sobre o abandono de colaboradores, incluindo um campo denominado ATTRITION que indica 'Sim' ou 'Não' para o abandono.
  • Certifique-se de que o utilizador da base de dados especificado na ligação do Oracle Analytics ao Oracle Autonomous Data Warehouse tem o perfil de grupo OML_Developer e não é um super utilizador 'admin'. Caso contrário, o fluxo de dados falha quando tenta gravá-lo ou executá-lo.
  1. Na Página Principal, clique em Criar e, em seguida, clique em Fluxo de Dados.
  2. Em Acrescentar Conjunto de Dados, selecione o conjunto de dados baseado no Oracle Autonomous Data Warehouse que contém os dados a analisar.
  3. Clique em Acrescentar um passo e, em seguida, clique em AutoML.
  4. Para o Destino, clique em Selecionar uma coluna e selecione a coluna de dados que contém o valor que está a tentar prever.
    Por exemplo, para prever o abandono de colaboradores, poderá selecionar um campo denominado ATTRITION que indica 'TRUE' ou 'FALSE' consoante os colaboradores tenham saído ou não de uma organização.

  5. Aceite o Tipo de Tarefa e a Métrica de Classificação do Modelo sugeridos que o Oracle Analytics recomenda ou selecione um algoritmo diferente.
  6. Clique em Gravar Modelo e especifique o nome do modelo de previsão gerado.
  7. Clique em Gravar e especifique um nome para o fluxo de dados.
  8. Clique em Executar para analisar os dados e gerar um modelo de previsão.
  9. A partir da Página Principal, clique em Navegar, depois clique em Aprendizagem Automática, depois clique com o botão direito do rato no modelo gerado e selecione Inspecionar.
Pode localizar o modelo gerado pelo Oracle Analytics na página Aprendizagem Automática no separador Modelos. Inspecione o modelo para avaliar a respetiva qualidade. Consulte Avaliar a Qualidade de um Modelo de Previsão. Também pode referenciar conjuntos de dados relacionados que são gerados para os modelos gerados pelo AutoML. Consulte O que São os Conjuntos de Dados Relacionados de um Modelo de Previsão?.

Criar e Treinar um Modelo de Previsão

Com base no problema que é necessário resolver, um analista de dados avançado escolhe um algoritmo adequado para treinar um modelo de previsão e, em seguida, avalia os resultados do modelo.

ícone Guia Prático Sprint de LiveLabs

Chegar a um modelo de elevada precisão é um processo iterativo e um analista de dados avançado pode experimentar diferentes modelos, comparar os respetivos resultados e otimizar os parâmetros com base numa abordagem de tentativa e erro. Um analista de dados pode utilizar o modelo de previsão preciso e finalizado para prever tendências noutros conjuntos de dados ou acrescentar o modelo a livros.

Nota:

Se estiver a utilizar dados com origem no Oracle Autonomous Data Warehouse, pode utilizar a capacidade de AutoML para treinar um modelo de previsão de forma rápida e fácil, sem necessitar de conhecimentos de aprendizagem automática. Consulte Treinar um Modelo de Previsão Utilizando AutoML no Autonomous Data Warehouse.

O Oracle Analytics fornece algoritmos para previsão numérica, classificação múltipla, classificação binária e clustering.

  1. Na Página Principal, clique em Criar e, em seguida, selecione Fluxo de Dados.
  2. Selecione o conjunto de dados que pretende utilizar para treinar o modelo. Clique em Acrescentar.
  3. No editor de fluxos de dados, clique em Acrescentar um passo (+).
    Após acrescentar um conjunto de dados, pode utilizar todas as colunas no conjunto de dados para criar o modelo ou selecionar apenas as colunas relevantes. Escolher as colunas relevantes requer uma compreensão do conjunto de dados. Ignore as colunas que sabe que não influenciarão o comportamento do resultado ou que contêm informações redundantes. Pode escolher apenas as colunas relevantes ao acrescentar o passo Selecionar Colunas. Se não tiver a certeza quanto às colunas relevantes, utilize todas as colunas.
  4. Selecione um dos passos de treino do modelo (por exemplo, Treinar Previsão Numérica ou Treinar Clustering).
  5. Selecione um algoritmo e clique em OK.
  6. Se estiver a trabalhar com um modelo supervisionado como a previsão ou classificação, clique em Destino e selecione a coluna que está a tentar prever. Por exemplo, se estiver a criar um modelo para prever o rendimento de uma pessoa, selecione a coluna Rendimento.
    Se estiver a trabalhar com um modelo não supervisionado como o clustering, não é necessária nenhuma coluna de destino.
  7. Altere as definições por omissão do seu modelo para otimizar e melhorar a exatidão do resultado previsto. O modelo com o qual está a trabalhar determina estas definições.
  8. Clique no passo Gravar Modelo e forneça um nome e uma descrição.
  9. Clique em Gravar, introduza um nome e uma descrição do fluxo de dados e clique em OK para gravar o fluxo de dados.
  10. Clique em Executar Fluxo de Dados para criar o modelo de previsão com base no conjunto de dados de entrada e nas definições do modelo que forneceu.

Passos do Fluxo de Dados para Treinar Modelos de Aprendizagem Automática

O Oracle Analytics permite-lhe treinar modelos de aprendizagem automática utilizando passos nos fluxos de dados. Quando tiver treinado um modelo de aprendizagem automática, aplique-o aos seus dados utilizando o passo Aplicar Modelo.

Nome do Passo Descrição
AutoML (requer o Oracle Autonomous Data Warehouse) Utilize a capacidade de AutoML do Oracle Autonomous Data Warehouse para recomendar e treinar um modelo de previsão. O passo AutoML analisa os seus dados, calcula o melhor algoritmo a utilizar e regista um modelo de previsão no Oracle Analytics.
Treinar Classificador Binário

Treine um modelo de aprendizagem automática para classificar os seus dados numa das duas categorias predefinidas.

Treinar Clustering Treine um modelo de aprendizagem automática para segregar grupos com traços semelhantes e atribuir os mesmos a clusters.
Treinar Vários Classificadores Treine um modelo de aprendizagem automática para classificar os seus dados em três ou mais categorias predefinidas.
Treinar Previsão Numérica Treine um modelo de aprendizagem automática para prever um valor numérico com base em valores de dados conhecidos.

Inspecionar um Modelo de Previsão

Depois de criar o modelo de previsão e de executar o fluxo de dados, pode analisar as informações sobre o modelo para determinar a respetiva exatidão. Utilize estas informações para ajustar iterativamente as definições do modelo de forma a melhorar a respetiva exatidão e prever melhores resultados.

Visualizar os Detalhes de um Modelo de Previsão

As informações detalhadas de um modelo de previsão ajudam-no a compreender o modelo e a determinar se é adequado para prever os seus dados. Os detalhes do modelo incluem a respetiva classe do modelo, algoritmo, colunas de entrada de dados e colunas de saída de dados

  1. Na Página Principal, clique em Navegador e, em seguida, clique em Aprendizagem Automática.
  2. Clique no ícone de menu de um modelo de treino e selecione Inspecionar.
  3. Clique em Detalhes para visualizar as informações do modelo.

Avaliar a Qualidade de um Modelo de Previsão

Visualize informações que o ajudam a compreender a qualidade de um modelo de previsão. Por exemplo, pode analisar métricas de exatidão, como exatidão do modelo, precisão, recall, valor F1 e taxa de falsos positivos.

O Oracle Analytics fornece métricas semelhantes independentemente do algoritmo utilizado para criar o modelo facilitando, deste modo, a comparação entre diferentes modelos. Durante o processo de criação do modelo, o conjunto de dados de entrada é dividido em duas partes para treinar e testar o modelo com base no parâmetro Percentagem de Partição de Treino. O modelo utiliza a parte de teste do conjunto de dados para testar a exatidão do modelo criado.
Com base no que observou no separador Qualidade, poderá ser necessário ajustar os parâmetros do modelo e voltar a treiná-lo.
  1. Na Página Principal, clique em Navegador e, em seguida, clique em Aprendizagem Automática.
  2. Clique no ícone de menu de um modelo de treino e selecione Inspecionar.
  3. Clique no separador Qualidade para rever as métricas de qualidade do modelo e avaliar o modelo. Por exemplo, reveja a pontuação de Exatidão do Modelo.

Sugestão: Clique em Mais para rever os detalhes das visualizações geradas para o modelo.

O que São os Conjuntos de Dados Relacionados de um Modelo de Previsão?

Quando executa o fluxo de dados para criar o modelo de treino do modelo de previsão do Oracle Analytics, o Oracle Analytics cria um conjunto de conjuntos de dados relacionados. Pode abrir e criar livros nestes conjuntos de dados para obter informações sobre a exatidão do modelo.

Dependendo do algoritmo escolhido para o seu modelo, os conjuntos de dados relacionados contêm detalhes sobre o modelo, tais como regras de previsão, métricas de exatidão, matriz de confusão e fatores condutores chave para previsão. Pode utilizar estas informações para otimizar o modelo com vista a obter melhores resultados e pode utilizar os conjuntos de dados relacionados para comparar modelos e decidir qual o modelo com maior exatidão.

Por exemplo, pode abrir um conjunto de dados Fatores Condutores para descobrir que colunas têm uma influência positiva ou negativa forte no modelo. Ao examinar essas colunas, verifica que algumas colunas não são tratadas como variáveis do modelo porque não são entradas de dados realistas ou que são demasiado granulares para a previsão. Utilize o editor de fluxos de dados para abrir o modelo e, com base nas informações descobertas, retire as colunas irrelevantes ou demasiado granulares e volte a gerar o modelo. Observe o separador Qualidade e Resultados e verifique se a exatidão do modelo melhorou. Continue este processo até ficar satisfeito com a exatidão do modelo e este estar pronto para pontuar um novo conjunto de dados.

Algoritmos diferentes geram conjuntos de dados relacionados semelhantes. Os parâmetros e os nomes de colunas individuais podem mudar no conjunto de dados consoante o tipo de algoritmo, mas a funcionalidade do conjunto de dados permanece igual. Por exemplo, os nomes das colunas num conjunto de dados estatísticos podem mudar de Regressão Linear para Regressão Logística, mas o conjunto de dados estatísticos contém as métricas de exatidão do modelo.

Conjuntos de Dados Relacionados para Modelos AutoML

Quando treina um modelo de previsão utilizando o AutoML, o Oracle Analytics cria conjuntos de dados adicionais que contêm informações úteis sobre o modelo. O número de conjuntos de dados criados depende do algoritmo do modelo. Por exemplo, para os modelos Naive Bayes, o Oracle Analytics cria um conjunto de dados que fornece informações sobre as probabilidades condicionais. Para um modelo de árvore de decisões, o conjunto de dados fornece informações sobre as estatísticas da árvore de decisões. Quando inspeciona um modelo gerado por AutoML utilizando o algoritmo GLM, vê entradas (com o prefixo GLM*) para os conjuntos de dados específicos do modelo que contêm informações de metadados sobre o modelo.
Segue-se a descrição de GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png
.png

Conjuntos de Dados Relacionados

CARTree

Este conjunto de dados é uma representação tabular de CART (Árvore de Decisões), calculado para prever os valores das colunas de destino. Contém colunas que representam as condições e os critérios das condições na árvore de decisões, uma previsão para cada grupo e a confiança da previsão. A visualização de Diagrama em Árvore integrada pode ser utilizada para visualizar esta árvore de decisões.

O conjunto de dados CARTree é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmo
Numérico CART para Previsão Numérica
Classificação Binária CART (Árvore de Decisões)
Classificação Múltipla CART (Árvore de Decisões)

Relatório Classificação

Este conjunto de dados é uma representação tabular das métricas de exatidão para cada valor distinto da coluna de destino. Por exemplo, caso a coluna de destino possa ter os dois valores distintos Sim e Não, este conjunto de dados mostra métricas de exatidão como F1, Precisão, Recall e Suporte (o número de linhas no conjunto de dados de treino com este valor) para cada valor distinto da coluna de destino.

O conjunto de dados Classificação é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmos
Classificação Binária

Naive Bayes

Rede Neural

Máquina de Vetores de Suporte

Classificação Múltipla

Naive Bayes

Rede Neural

Máquina de Vetores de Suporte

Matriz de Confusão

Este conjunto de dados, também denominado matriz de erros, é uma disposição de tabela dinâmica. Cada linha representa uma instância de uma classe prevista e cada coluna representa uma instância numa classe real. Esta tabela reporta o número de falsos positivos, falsos negativos, verdadeiros positivos e verdadeiros negativos, que são utilizados para calcular as métricas de exatidão de precisão, recall e F1.

O conjunto de dados Matriz de Confusão é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmos
Classificação Binária

Regressão Logística

CART (Árvore de Decisões)

Naive Bayes

Rede Neural

Floresta Aleatória

Máquina de Vetores de Suporte

Classificação Múltipla

CART (Árvore de Decisões)

Naive Bayes

Rede Neural

Floresta Aleatória

Máquina de Vetores de Suporte

Fatores Condutores

Este conjunto de dados fornece informações sobre as colunas que determinam os valores das colunas de destino. São utilizadas regressões lineares para identificar estas colunas. São atribuídos valores de coeficiente e correlação a cada coluna. O valor de coeficiente descreve a ponderação da coluna utilizada para determinar o valor da coluna de destino. O valor de correlação indica a direção da relação entre a coluna de destino e a coluna dependente. Por exemplo, se o valor da coluna de destino aumenta ou diminui com base na coluna dependente.

O conjunto de dados Fatores Condutores é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmos
Numérico

Regressão Linear

Regressão Linear de Rede Elástica

Classificação Binária

Regressão Logística

Máquina de Vetores de Suporte

Classificação Múltipla Máquina de Vetores de Suporte

Hitmap

Este conjunto de dados contém informações sobre os nós folha da árvore de decisões. Cada linha na tabela representa um nó folha e contém informações que descrevem o que esse nó folha representa, como o tamanho do segmento, a confiança e o número esperado de linhas. Por exemplo, o número esperado de previsões corretas = Tamanho do Segmento * Confiança.

O conjunto de dados Hitmap é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmo
Numérico CART para Previsão Numérica

Valores Residuais

Este conjunto de dados fornece informações sobre a qualidade das previsões residuais. Um valor residual é a diferença entre o valor medido e o valor previsto de um modelo de regressão. Este conjunto de dados contém um valor de soma agregada da diferença absoluta entre os valores reais e previstos para todas as colunas no conjunto de dados.

O conjunto de dados Valores Residuais é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmos
Numéricos

Regressão Linear

Regressão Linear de Rede Elástica

CART para Previsão Numérica

Classificação Binária CART (Árvore de Decisões)
Classificação Múltipla CART (Árvore de Decisões)

Estatística

As métricas deste conjunto de dados dependem do algoritmo utilizado para o gerar. Tenha em atenção esta lista de métricas baseadas no algoritmo:

  • Regressão Linear, CART para Previsão Numérica, Regressão Linear de Rede Elástica - Estes algoritmos contêm R Quadrado, R Quadrado Ajustado, Erro Médio Absoluto (MAE), Erro Quadrático Médio (MSE), Erro Absoluto Relativo (RAE), Erro Quadrático Relacionado (RSE), Raiz Quadrada do Erro Quadrático Médio (RMSE).
  • CART (Árvores de Classificação e Regressão), Classificação Naive Bayes, Rede Neural, Máquina de Vetores de Suporte (SVM), Floresta Aleatória, Regressão Logística - Estes algoritmos contêm Exatidão, Total F1.

Este conjunto de dados é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmo
Numérico

Regressão Linear

Regressão Linear de Rede Elástica

CART para Previsão Numérica

Classificação Binária

Regressão Logística

CART (Árvore de Decisões)

Naive Bayes

Rede Neural

Floresta Aleatória

Máquina de Vetores de Suporte

Classificação Múltipla

Naive Bayes

Rede Neural

Floresta Aleatória

Máquina de Vetores de Suporte

Resumo

Este conjunto de dados contém informações como o nome do Destino e o nome do Modelo.

O conjunto de dados Resumo é fornecido quando seleciona estas combinações de modelo e algoritmo.

Modelo Algoritmos
Classificação Binária

Naive Bayes

Rede Neural

Máquina de Vetores de Suporte

Classificação Múltipla

Naive Bayes

Rede Neural

Máquina de Vetores de Suporte

Encontrar os Conjuntos de Dados Relacionados de um Modelo de Previsão

Os conjuntos de dados relacionados são gerados quando treina um modelo de previsão.

Dependendo do algoritmo, os conjuntos de dados relacionados contêm detalhes sobre o modelo, tais como: regras de previsão, métricas de exatidão, matriz de confusão, fatores condutores chave para previsão, etc. Estes parâmetros ajudam-no a compreender as regras utilizadas pelo modelo para determinar as previsões e classificações.
  1. Na Página Principal, clique em Navegador e, em seguida, clique em Aprendizagem Automática.
  2. Clique no ícone de menu de um modelo de treino e selecione Inspecionar.
  3. Clique no separador Relacionado para aceder aos conjuntos de dados relacionados do modelo.
  4. Clique duas vezes num conjunto de dados relacionado para o visualizar ou utilizar num livro.

Acrescentar um Modelo de Previsão a um Livro

Quando cria um cenário num livro, aplica um modelo de previsão ao conjunto de dados do livro para revelar as tendências e os padrões encontrados por esse modelo específico.

Nota:

Não pode aplicar um modelo de aprendizagem automática Oracle aos dados de um livro.
Depois de acrescentar o modelo ao livro e de efetuar a correspondência das entradas de dados do modelo com as colunas do conjunto de dados, o Painel Dados contém os objetos do modelo, que pode arrastar e largar na tela. A aprendizagem automática gera os valores do modelo com base nas colunas de dados correspondentes da visualização.
  1. Na Página Principal, clique em Criar e, em seguida, clique em Livro.
  2. Selecione o conjunto de dados que pretende utilizar para criar o livro e clique em Acrescentar ao Livro.
  3. No painel Dados, clique em Acrescentar e selecione Criar Cenário.
  4. Na caixa de diálogo Criar Cenário - Selecionar Modelo, selecione um modelo e clique em OK.
    Só pode aplicar um modelo de previsão. Não pode aplicar um modelo de aprendizagem automática Oracle.
    Se não for possível efetuar a correspondência de cada entrada de dados do modelo com um elemento de dados, será apresentada a caixa de diálogo Fazer Correspondência dos Seus Dados com o Modelo.
  5. Se a caixa de diálogo Fazer Correspondência dos Seus Dados com o Modelo for apresentada, no campo Conjunto de Dados, selecione o conjunto de dados a utilizar com o modelo.
  6. Efetue a correspondência entre a entrada de dados do modelo e os elementos de dados, conforme necessário. Clique em Concluído.
    O cenário é apresentado como um conjunto de dados no painel Elementos de Dados.
  7. Arraste e largue elementos do conjunto de dados e do modelo na tela Visualizar.
  8. Para ajustar o cenário, clique com o botão direito do rato no cenário no painel Elementos de Dados e selecione Editar Cenário.
  9. Altere o conjunto de dados e atualize a correspondência entre a entrada de dados do modelo e os elementos de dados, conforme necessário.
  10. Clique em Gravar para gravar o livro.