Usar Modelos de Machine Learning (ML)
O Data Transforms suporta o uso do Modelo de ML em um fluxo de dados. Saiba como criar e usar Modelos de Aprendizado de Máquina (ML) em fluxos de dados.
Tópicos
- Criar uma Entidade de Dados de Modelo de ML no editor de Fluxo de Dados
Para usar modelos de ML em Transformações de Dados, você precisa criar dois fluxos de dados. Primeiro você precisa criar a entidade de dados do modelo ML usando o editor do serviço Data Flow e, em seguida, pode usar a entidade de dados em um fluxo de dados para extrair dados de uma conexão de origem e carregá-los em um servidor de destino. - Propriedades da Entidade de Dados do Modelo de ML
A guia Propriedades do assistente Adicionar Entidade de Dados fornece opções de data mining que você pode usar para definir a entidade de dados do Modelo de ML. - Usar Modelo de ML em um Fluxo de Dados
Você pode usar a função de banco de dados Modelo de Previsão para executar algoritmos de Modelo de ML em dados de origem e carregar a saída em um banco de dados de destino.
Tópico pai: Página Transformações de Dados
Criar uma Entidade de Dados de Modelo de ML no editor de Fluxo de Dados
Para usar modelos de ML em Transformações de Dados, você precisa criar dois fluxos de dados. Primeiro você precisa criar a entidade de dados do modelo ML usando o editor do serviço Data Flow e, em seguida, pode usar a entidade de dados em um fluxo de dados para extrair dados de uma conexão de origem e carregá-los em um servidor de destino.
Para criar uma entidade de dados de Modelo ML no editor de Fluxo de Dados,
- Arraste a entidade de dados na qual você deseja criar o Modelo ML até a Tela de Design.
- Selecione o componente e clique no ícone Adicionar Entidade de Dados
presente no canto superior direito do componente de destino.
- A página Adicionar Entidade de Dados é exibida, permitindo que você configure os seguintes detalhes do componente de destino:
Guia Geral
- Na caixa de texto Nome, informe o nome da Entidade de Dados recém-criada.
- Na lista drop-down Tipo de Entidade, selecione Modelo ML como o tipo de entidade de dados.
Quando você seleciona este tipo de entidade, a interface do usuário é alterada da seguinte forma:
- A lista drop-down Conexão lista apenas as conexões Oracle que você criou.
- O assistente Adicionar Entidade de Dados exibe a guia Propriedades, na qual você pode selecionar o Tipo de Aprendizagem, Função, Algoritmo e configurar parâmetros para definir o Modelo de ML. Consulte Propriedades da Entidade de Dados do Modelo ML para obter mais informações.
- Na lista drop-down Tipo de Conexão, selecione a conexão necessária na qual você deseja adicionar a Entidade de Dados recém-criada. Para entidades de dados do Modelo ML, a lista drop-down Tipo de Conexão lista apenas Oracle como opção.
- A lista suspensa Conexão é preenchida com as conexões que você criou com o tipo de conexão associado. Na lista drop-down Conexão, selecione o nome do servidor no qual você deseja manter a entidade de dados do modelo ML.
- Na lista drop-down Esquema, todos os esquemas correspondentes à conexão selecionada são listados em dois grupos.
- Novo Esquema de Banco de Dados (aqueles dos quais você não importou antes) e
- Esquema de Banco de Dados Existente (aqueles que você importou de antes e que estão potencialmente substituindo entidades de dados).
- Na caixa de texto Tags, informe uma tag de sua escolha. Você pode usar tags para filtrar as Entidades de Dados exibidas na Página Entidade de Dados.
- Se quiser marcar essa entidade de dados como um grupo de recursos, expanda Opções Avançadas e clique na caixa de seleção Tratar como Grupo de Recursos.
- Clique em Próximo.
Guia Propriedades
- Selecione o Tipo de Aprendizagem, a Função e o Algoritmo que você deseja usar para criar essa entidade de dados. Para obter mais informações sobre as opções, consulte Propriedades da Entidade de Dados do Modelo ML.
- Com base nas opções selecionadas, a seção Parâmetros é preenchida com a lista de parâmetros que são marcados como "Importância" e "Alta". Você pode adicionar outros parâmetros necessários usando o ícone
.
Especifique um valor para cada parâmetro para que o fluxo de dados possa ser executado com sucesso.
Guia Colunas
- Clique no ícone
Adicionar Colunas para adicionar novas colunas à Entidade de Dados recém-criada.
Uma nova coluna é adicionada à tabela exibida.
- A tabela exibe as seguintes colunas:
- Nome
- Tipo de Dados - Clique na célula para configurar o Tipo de Dados necessário.
- Dimensionar
- Tamanho
- Ações - Clique no ícone de cruz para excluir a coluna criada.
- Para excluir as colunas em massa, selecione as colunas e clique no ícone Excluir
.
- Para pesquisar os detalhes da coluna obrigatória, na caixa de texto Pesquisar, insira o nome da coluna obrigatória e clique em Inserir. Os detalhes da coluna obrigatória são exibidos.
- Clique em Próximo.
Guia Visualizar Entidade de Dados
Ela exibe uma visualização de todas as colunas criadas e seus detalhes configurados. Se a entidade de dados pertencer a um banco de dados Oracle, você também poderá exibir estatísticas da tabela. Consulte Exibir Estatísticas de Entidades de Dados para obter mais informações.
- Clique em Salvar para salvar a configuração e sair do assistente.
- Salve e execute o fluxo de dados.
A nova Entidade de Dados é criada. exibida na página Entidades de Dados.
Tópico principal: Usar Modelos de Aprendizado de Máquina (ML)
Propriedades da Entidade de Dados do Modelo ML
A guia Propriedades do assistente Adicionar Entidade de Dados fornece opções de data mining que você pode usar para definir a entidade de dados do Modelo de ML.
Este tópico pressupõe conhecimento prévio dos conceitos do Oracle Machine Learning, como funções e algoritmos de data mining. Para obter mais informações, consulte o Oracle Machine Learning for SQL API Guide.
Tipo de Aprendizado | Função | Algoritmo |
---|---|---|
Supervisionado | Classificação | Árvore de Decisão |
Análise Semântica Explícita | ||
Modelos Lineares Generalizados | ||
Naive Bayes | ||
Floresta Aleatória | ||
Rede Neural | ||
Máquinas de Vetor de Suporte | ||
Regressão | Modelos Lineares Generalizados | |
Rede Neural | ||
Máquinas de Vetor de Suporte | ||
Séries Temporais | Suavização Exponencial | |
Importância de Atributo | Tamanho Mínimo da Descrição | |
Não Supervisionado | Associação | A priori |
Importância de Atributo | Decomposição da matriz CUR | |
Detecção da Anomalia | Máquinas vetoriais de suporte de uma classe | |
Clusterização | Maximização de Expectativas | |
k-Means | ||
Clusterização de Particionamento Ortogonal | ||
Extração de Recursos | Análise Semântica Explícita | |
Fatorização de Matriz Não Negativa | ||
Decomposição de Valor Singular |
Tópico principal: Usar Modelos de Aprendizado de Máquina (ML)
Usar Modelo de ML em um Fluxo de Dados
Você pode usar a função de banco de dados Modelo de Previsão para executar algoritmos de Modelo de ML em dados de origem e carregar a saída em um banco de dados de destino.
Antes de usar um Modelo de ML em um fluxo de dados, você precisa criar o Modelo de ML. Para obter instruções sobre como criar um modelo de ML, consulte Criar uma Entidade de Dados de Modelo de ML no editor do serviço Data Flow.
Para usar um Modelo de ML em um fluxo de dados:
- Siga as instruções em Criar um Serviço Data Flow para criar um novo fluxo de dados.
- No Editor de Fluxo de Dados, arraste as tabelas que você deseja usar como origem no fluxo de dados e solte-as na tela de design.
- Na barra de ferramentas Funções do Banco de Dados, clique em Machine Learning e arraste o componente de transformação Modelo de Previsão para soltá-lo na tela de design.
- Clique no componente de transformação Modelo de Previsão para exibir suas propriedades.
- Na guia Geral, especifique o seguinte:
- Conexão - A lista drop-down lista todas as conexões Oracle disponíveis. Selecione a conexão Oracle que você deseja usar.
- Esquema - Selecione o esquema.
- Modelo de ML - A lista drop-down lista todos os modelos de ML disponíveis. Consulte Criar uma Entidade de Dados do Modelo de ML no editor do serviço Data Flow para obter instruções sobre como criar um Modelo de ML.
- Na guia Mapeamento de Coluna, mapeie a coluna de origem que você deseja incorporar ao atributo INPUT do operador. A única coluna disponível nos mapeamentos de coluna é
prediction parameters
. Arraste uma coluna de texto das colunas disponíveis para a coluna Expressão. - Arraste a tabela que você deseja usar como destino no fluxo de dados e solte-a na tela de design.
- Salve e execute o fluxo de dados.
As Transformações de Dados executarão o modelo de previsão nos dados de origem e gravarão a saída na tabela de destino.
Tópico principal: Usar Modelos de Aprendizado de Máquina (ML)