10 Usar Modelos para Colaborar com Usuários

Usando os modelos de Notebooks do Oracle Machine Learning, você pode colaborar com outros usuários compartilhando seu trabalho, publicando seu trabalho como relatórios e criando notebooks com base em modelos. Você pode armazenar seus notebooks como modelos, compartilhar notebooks e fornecer modelos de amostra para outros usuários.

Observação:

Você também pode colaborar com outros usuários do Oracle Machine Learning Notebooks fornecendo acesso ao seu espaço de trabalho. O usuário autenticado poderá acessar os projetos em seu espaço de trabalho e seus notebooks. O nível de acesso depende do tipo de permissão concedido - Gerente, Desenvolvedor ou Visualizador. Para obter mais informações sobre a colaboração entre usuários, consulte Como colaborar no Oracle Machine Learning Notebooks

10.1 Usar os Modelos Pessoais

Modelos Pessoais lista os modelos de notebook que você criou.

É possível executar estas tarefas:
  • Visualizar modelos selecionados no modo somente leitura.

  • Criar novos notebooks com base nos modelos selecionados.

  • Editar os modelos selecionados.

  • Compartilhe os modelos de notebook selecionados em Modelos Compartilhados.

  • Excluir modelos de notebook selecionados.

10.1.1 Criar Notebooks com Base em Modelos

Você pode criar novos notebooks com base em um modelo existente e armazená-los em Modelos Pessoais para uso posterior.

Você deve selecionar um modelo de bloco de notas.
Para criar um novo notebook com base em um modelo:
  1. Na página Modelos Pessoais, selecione o modelo com base no qual você deseja criar o notebook e clique em Novo Notebook.
    A caixa de diálogo Criar Notebook é aberta.
  2. No campo Nome, forneça um nome para o notebook.
  3. No campo Comentários, informe os comentários, se houver.
  4. No campo Projeto, selecione o projeto no qual você deseja salvar seu notebook.
  5. No campo Conexão, a conexão padrão é selecionada.
  6. Clique em OK.
O notebook é criado e está disponível na página Notebooks.

10.1.2 Compartilhar Modelos de Notebook

Você pode compartilhar modelos de Modelos Pessoais. Também é possível compartilhar modelos para edição.

Para compartilhar um modelo:
  1. Selecione o modelo de notebook em Modelos Pessoais e clique em Compartilhar.
    A caixa de diálogo Salvar em Modelos Compartilhados é aberta.
  2. No campo Nome, informe um novo nome para o modelo.
  3. No campo Comentários, forneça comentários, se houver.
  4. No campo Tags, digite tags separadas por vírgulas. Para facilitar a pesquisa, use tags descritivas.
  5. Clique em OK.
Depois que o modelo é criado e compartilhado com sucesso, uma mensagem é exibida informando que o modelo é criado em Compartilhado.

10.1.3 Editar Definições de Modelos de Notebook

Você pode modificar as definições de um modelo de notebook existente em Modelos Pessoais.

Para editar definições de modelo de notebook:
  1. Selecione o modelo de notebook em Modelos Pessoais e clique em Editar Definições.
    A caixa de diálogo Editar Modelo é aberta.
  2. No campo Nome, edite o nome, conforme aplicável.
  3. No campo Comentários, edite os comentários, se houver.
  4. No campo Tags, edite as tags, conforme aplicável.
  5. Clique em OK.

10.2 Usar os Modelos Compartilhados

Nos Modelos Compartilhados, você pode compartilhar modelos de notebook com todos os usuários autenticados, os modelos de notebook criados com base nos notebooks existentes disponíveis em Modelos.

A página Modelos Compartilhados rastreia modelos de notebook quando você executa o seguinte:
  • Como modelos

  • Criar notebooks com base em modelos

  • Exibir modelos

A página Modelos Compartilhados exibe as seguintes informações sobre os modelos:
  • Nome do modelo

  • Descrição

  • Número de likes

  • Número de criações

  • Número de exibições estáticas

É possível executar estas tarefas:
  • Crie modelos clicando em Novo Notebook

  • Editar as definições do modelo clicando em Editar Definições

  • Exclua qualquer modelo selecionado clicando em Excluir

  • Pesquisar modelos por Nome, Tag, Autor

  • Classificar modelos por Nome, Data, Autor, Curtido, Visualizado, Usado

  • Exibir modelos clicando em Mostrar Apenas Curtidos ou Mostrar Somente Meus Itens

10.2.1 Criar Notebooks com Base em Modelos

Você pode criar novos notebooks com base em um modelo existente e armazená-los em Modelos Pessoais para uso posterior.

Você deve selecionar um modelo de bloco de notas.
Para criar um novo notebook com base em um modelo:
  1. Na página Modelos Pessoais, selecione o modelo com base no qual você deseja criar o notebook e clique em Novo Notebook.
    A caixa de diálogo Criar Notebook é aberta.
  2. No campo Nome, forneça um nome para o notebook.
  3. No campo Comentários, informe os comentários, se houver.
  4. No campo Projeto, selecione o projeto no qual você deseja salvar seu notebook.
  5. No campo Conexão, a conexão padrão é selecionada.
  6. Clique em OK.
O notebook é criado e está disponível na página Notebooks.

10.2.2 Editar Definições de Modelos de Notebook

Você pode modificar as definições de um modelo de notebook existente em Modelos Pessoais.

Para editar definições de modelo de notebook:
  1. Selecione o modelo de notebook em Modelos Pessoais e clique em Editar Definições.
    A caixa de diálogo Editar Modelo é aberta.
  2. No campo Nome, edite o nome, conforme aplicável.
  3. No campo Comentários, edite os comentários, se houver.
  4. No campo Tags, edite as tags, conforme aplicável.
  5. Clique em OK.

10.3 Usar os Modelos de Exemplo

A página Modelos de Exemplo lista os modelos de notebook pré-preenchidos do Oracle Machine Learning. Você pode exibir e usar esses modelos para criar seus notebooks.

A página Modelos de Exemplo exibe as seguintes informações sobre os modelos:
  • Nome do modelo

  • Descrição

  • Número de likes. Clique em Curtidas para marcá-la como curtida.

  • Número de exibições estáticas

  • Número de usos

Não é possível alterar nenhum modelo na página Modelos de Exemplo. As opções de pesquisa são:
  • Pesquisar modelos por Nome, Tag, Autor

  • Classificar modelos por Nome, Data, Autor, Curtido, Visualizado, Usado

  • Exibir modelos curtidos clicando em Mostrar Apenas Curtidos

10.3.1 Criar um Notebook com Base nos Modelos de Exemplo

Usando os Modelos de Exemplo do Oracle Machine Learning, você pode criar um notebook com base nos modelos disponíveis.

Para criar um notebook:
  1. Na página Modelos de Exemplo, selecione o modelo com base no qual você deseja criar um notebook.
  2. Clique em Novo Notebook.
    A caixa de diálogo Criar Notebook é aberta.
  3. Na caixa de diálogo Criar Notebook, o nome do modelo selecionado é exibido. No campo Nome, você pode alterar o nome do notebook.
    Caixa de diálogo Criar Bloco de Notas
  4. No campo Comentário, se houver algum comentário disponível para o modelo, ele será exibido. Você pode editar o comentário.
  5. No campo Projeto, clique no ícone de edição editar.
  6. Selecione o projeto no qual você deseja salvar o notebook.
  7. No campo Conexão, a conexão padrão é selecionada.
  8. Clique em OK.
O notebook é criado e está disponível na página Notebooks.

10.3.2 Exemplos de Modelo

O Oracle Machine Learning Notebooks fornece modelos de exemplo de notebook baseados em diferentes algoritmos e linguagens de machine learning, como Python, R e SQL. Os modelos de exemplo são processados no Oracle Autonomous Database.

Você pode criar seus próprios notebooks editáveis e executáveis do Oracle Machine Learning com base em qualquer um destes exemplos de notebooks de modelo do Oracle Machine Learning for R:
  • Exportar e Importar Modelos Serializados do OML: Use este notebook para exportar e importar modelos serializados nativos usando os procedimentos DBMS_DATA_MINING.EXPORT_SERMODEL e DBMS_DATA_MINING.IMPORT_SERMODEL. O Oracle Machine Learning fornece APIs para simplificar o processo de migração de modelos entre bancos de dados e plataformas.
  • OML Wiki ESA Model: Use este notebook para categorização de documentos de texto calculando a relação semântica (quão semelhante no significado de duas palavras ou partes de texto são uma para a outra) entre os documentos e um conjunto de tópicos que são explicitamente definidos e descritos por humanos. A função ESA do Oracle Machine Learning for SQL, a função oml.esa do Oracle Machine Learning for Python e a função ore.odmESA do Oracle Machine Learning for R extraem recursos baseados em texto de um corpus de documentos e executam comparações de similaridade de documentos. Neste notebook, o modelo wiki ESA é importado para o Autonomous Database para uso com os seguintes exemplos de notebook de modelo OML:
    • OML4SQL Modelo Wiki de Extração de Recursos ESA
    • OML4Py Modelo Wiki de Extração de Recursos ESA
    • OML4R Modelo Wiki de Extração de Recursos ESA
  • Pontuação em Batch de Serviços OML: Use este notebook para executar jobs de pontuação em batch por meio de uma interface REST por meio dos Serviços OML. O OML Services suporta pontuação em lote para regressão, classificação, clusterização e extração de recursos.
    • Autenticar o usuário do banco de dados e obter um token
    • Criar um job de pontuação em lote
    • Exibir os detalhes e a saída do job de pontuação em batch
    • Atualizar, desativar e excluir um job de pontuação em lote
  • Monitoramento de Dados de Serviços OML: Use este notebook para executar o monitoramento de dados. Esta execução de notebook fornece as etapas do workflow de monitoramento de dados por meio da interface REST que inclui:
    • Autenticar o usuário do banco de dados e obter um token
    • Criar um job de monitoramento de dados
    • Exibir os detalhes e a saída do job de monitoramento de dados
    • Atualizar, desativar e excluir um job de monitoramento de dados
  • Monitoramento de Modelos de Serviços OML: Use este notebook para entender e executar o monitoramento de modelos. Esta execução de notebook fornece as etapas de workflow de monitoramento de modelo por meio da interface REST que inclui:
    • Autenticar o usuário do banco de dados e obter um token
    • Criar um job de monitoramento de modelo
    • Exibir os detalhes e a saída do job de monitoramento do modelo
    • Atualizar, desativar e excluir um job de monitoramento de modelo
  • OML Third-Party Packages - Environment Creation: Use este notebook para fazer download e ativar o ambiente Conda e usar as bibliotecas em suas sessões de notebook. O Oracle Machine Learning Notebooks fornece um interpretador Conda para instalar bibliotecas Python e R de terceiros em um ambiente Conda para uso nas sessões do Oracle Machine Learning Notebooks, bem como nas chamadas de execução incorporadas do Oracle Machine Learning for Python e do Oracle Machine Learning for R.

    As bibliotecas de terceiros instaladas no Oracle Machine Learning Notebooks podem ser usadas em:

    • Python Padrão
    • R Padrão
    • Execução Python incorporada do Oracle Machine Learning for Python com base nas APIs Python, SQL e REST
    • Execução R incorporada do Oracle Machine Learning for R das APIs R, SQL e REST

    Observação:

    O ambiente Conda é instalado e gerenciado pelo usuário ADMIN com a atribuição OML_SYS_ADMIN. O administrador pode criar um ambiente compartilhado e adicionar ou excluir pacotes dele. Os ambientes Conda são armazenados no bucket do Object Storage associado ao Autonomous Database.

    O Conda é um pacote de código-fonte aberto e um sistema de gerenciamento de ambiente que permite o uso de ambientes virtuais que contêm pacotes R e Python de terceiros. Com ambientes conda, você pode instalar e atualizar pacotes e suas dependências e alternar entre ambientes para usar pacotes específicos do projeto.

    Este notebook de modelo Pacotes de Terceiros OML - Criação de Ambiente contém um workflow típico para criação de ambiente de terceiros e instalação de pacote no Oracle Machine Learning Notebooks.

    • A Seção 1 contém comandos para criar e testar ambientes Conda.
    • A Seção 2 contém comandos para criar um ambiente Conda, instalar pacotes e comandos para fazer upload do ambiente conda para um bucket do Object Storage associado ao Oracle Autonomous Database.

    Figura 10-1 Modelos de Exemplo Conda

    Modelos de Exemplo Conda
  • Pacotes de Terceiros do OML - Uso do Ambiente Python: Use este notebook de modelo para entender o workflow típico para uso do ambiente de terceiros no Oracle Machine Learning Notebooks usando Python e Oracle Machine Learning for Python. Você faz download e usa as bibliotecas em ambientes Conda que foram criados e salvos anteriormente em uma pasta de bucket do Object Storage associada ao Autonomous Database.
    Este notebook contém comandos para:
    • Listar todos os ambientes armazenados no Object Storage
    • Listar um ambiente nomeado armazenado no Object Storage
    • Faça download do ambiente mypyenv e ative-o
    • Listar os pacotes disponíveis no ambiente Conda
    • Importar bibliotecas Python
    • Carregar conjuntos de dados
    • Criar modelos
    • Pontuar modelos
    • Criar funções definidas pelo usuário (UDFs) do Python
    • Executar as funções definidas pelo usuário (UDFs) no Python
    • Criar e executar funções definidas pelo usuário nas APIs SQL e REST para execução Python incorporada
    • Criar e executar funções definidas pelo usuário do Python usando a API SQL para execução Python incorporada - modo assíncrono
  • Pacotes de Terceiros do OML - Uso do Ambiente R: Use este notebook de modelo para entender o workflow típico para uso do ambiente de terceiros no Oracle Machine Learning for R.
    Este notebook contém comandos para:
    • Listar todos os ambientes armazenados no Object Storage
    • Listar um ambiente nomeado armazenado no Object Storage
    • Faça download do ambiente myrenv e ative-o
    • Mostrar a lista de ambientes Conda OML4R disponíveis
    • Importar bibliotecas R
    • Carregar e preparar dados
    • Criar modelos
    • Pontuar modelos
    • Criar funções definidas pelo usuário R (UDFs)
    • Executar funções definidas pelo usuário (UDFs) em R
    • Salvar as funções definidas pelo usuário (UDFs) no repositório de scripts
    • Execute a função definida pelo usuário R em APIs SQL e REST para execução R incorporada
    • Adicionar o usuário OML à Lista de Controle de Acesso
    • Execute as funções definidas pelo usuário R usando a API REST para execução R incorporada no modo síncrono
  • OML4R-1: Introdução: Use este notebook para entender como:
    • Carregar a Biblioteca do ORE
    • Criar tabelas do banco de dados
    • Usar a camada de transparência
    • Classificar atributos para valor preditivo usando o algoritmo de importância do atributo no banco de dados
    • Crie modelos de previsão e
    • Dados de pontuação usando estes modelos

    Figura 10-2 Modelos de Exemplo do Oracle Machine Learning for R

    OML4R Exemplos de Modelo
  • OML4R-2: Seleção e Manipulação de Dados: Use este notebook para entender os recursos da camada de transparência que envolvem seleção e manipulação de dados.
  • OML4R-3: Armazenamento de Dados e Repositório de Scripts: Use este notebook para entender os recursos de armazenamento de dados e repositório de scripts de OML4R.
  • OML4R-4: Execução R Incorporada: Use este notebook para entender a execução R incorporada OML4R. Primeiro, um modelo linear é criado em R diretamente, depois uma função R definida pelo usuário é criada para criar o modelo linear, a função é salva no repositório de scripts e os dados são pontuados em paralelo usando mecanismos R gerados pelo ambiente do Oracle Autonomous Database. O notebook também demonstra como chamar esses scripts usando a interface SQL e a API REST para R com execução R incorporada.

    Observação:

    Para usar a API SQL para execução R incorporada, uma função R definida pelo usuário deve residir no repositório de scripts OML4R e uma conta de nuvem do Oracle Machine Learning (OML) USERNAME, PASSWORD e URL deve ser fornecida para obter um token de autenticação.
  • OML4R SVM (Anomaly Detection Support Vector Machine): Use este notebook para criar um modelo SVM de Uma Classe e, em seguida, use-o para sinalizar registros incomuns ou suspeitos.
  • OML4R Regras de Associação Apriori: Use este notebook para criar modelos de regras de associação usando o algoritmo A Priori com dados do esquema SH (SH.SALES). Todo o cálculo ocorre dentro do Oracle Autonomous Database.
  • OML4R Tamanho Mínimo da Descrição da Importância do Atributo (MDL): Use este notebook para calcular a Importância do Atributo, que usa o algoritmo Tamanho Mínimo da Descrição, nos dados do esquema SH. Todas as funcionalidades são executadas no Oracle Autonomous Database. O Oracle Machine Learning suporta a Importância do Atributo para identificar fatores-chave, como atributos, preditores, variáveis que têm mais influência em um atributo de destino.
  • OML4R Modelo Linear Generalizado de Classificação (GLM): Use este notebook para prever que os clientes provavelmente serão respondedores positivos a um programa de fidelidade do Cartão de Afinidade. Este notebook cria e aplica um modelo linear generalizado de classificação usando os dados do esquema do Histórico de Vendas (SH). Todo o processamento ocorre dentro do Oracle Autonomous Database.
  • OML4R Classification Naive Bayes (NB): Use este notebook para prever que os clientes provavelmente serão respondedores positivos a um programa de fidelidade do Affinity Card. Este notebook cria e aplica um modelo de árvore de decisão de classificação usando os dados do esquema do Histórico de Vendas (SH). Todo o processamento ocorre dentro do Oracle Autonomous Database.
  • OML4R Classificação Floresta Aleatória (RF): Use este notebook para usar o algoritmo Floresta Aleatória para classificação em OML4R e prever que os clientes provavelmente serão respondedores positivos a um programa de fidelidade do Cartão de Afinidade.
  • OML4R Modelagem de Classificação para Prever Clientes de Destino usando o Support Vector Machine (SVM): Use este notebook para usar a modelagem de Classificação para prever Clientes de Destino usando o Modelo Support Vector Machine.
  • OML4R Clustering - Identificando Segmentos do Cliente usando Clustering de Maximização de Expectativa: Use este notebook para entender como identificar clusters naturais de clientes usando o conjunto de dados CUSTOMERS do esquema SH usando o algoritmo EM (Expectation Maximization) de aprendizagem não supervisionada. A exploração, preparação e machine learning de dados são executados no Oracle Autonomous Database.
  • OML4R Clustering - Identificando Segmentos do Cliente usando Clustering K-Means: Use este notebook para entender como identificar clusters naturais de clientes usando o conjunto de dados CUSTOMERS do esquema SH usando o algoritmo K-Means (KM) de aprendizagem não supervisionada. A exploração, preparação e machine learning de dados são executados no Oracle Autonomous Database.
  • OML4R Clustering - Clustering de Particionamento Ortogonal (OC): Use este notebook para entender como identificar clusters naturais de clientes usando o conjunto de dados CUSTOMERS do esquema SH usando o algoritmo k-Means de aprendizagem não supervisionado. A exploração, preparação e machine learning de dados são executados no Oracle Autonomous Database.
  • OML4R Outlier de Limpeza de Dados: Use este notebook para entender e excluir registros com outliers usando OML4R.
  • OML4R Limpeza de Dados - Recodificar Valores Sinônimos: Use este notebook para recodificar o valor sinônimo usando OML4R.
  • OML4R Criação do conjunto de dados: Use este notebook para carregar os conjuntos de dados de amostra MTCARS e IRIS e importá-los para sua instância do Oracle Autonomous Database usando a função ore.create().

Observação:

Os notebooks de modelo de exemplo a seguir prefixados com um asterisco (*), usam o conjunto de dados CUSTOMER_INSURANCE_LTV. Esse conjunto de dados é gerado pelo notebook OML Run-me-first. Portanto, você deve executar o notebook OML Run-me-first disponível nos Modelos de Exemplos.
  • * OML4R Limpando Dados Ausentes: Use este notebook para executar a substituição de valor ausente usando OML4R.
  • * OML4R Remoção de Duplicidades de Limpeza de Dados: Use este notebook para remover registros duplicados usando OML4R.
  • * OML4R Binning de Transformação de Dados: Use este notebook para binar colunas numéricas usando OML4R.
  • * OML4R Registro Categórico de Transformação de Dados: Use este notebook para recodificar uma variável de string categórica para uma variável numérica e recodificação string-a-string usando OML4R.
  • * OML4R Transformação de Dados: Normalização e Dimensionamento: Use este notebook para normalizar e dimensionar dados usando OML4R.
  • * OML4R Transformação de Dados: Codificação Única: Use este notebook para executar uma codificação única usando OML4R.
  • * OML4R Seleção de Recursos - Algoritmo Supervisionado: Use este notebook para executar a seleção de recursos usando algoritmos supervisionados no banco de dados usando OML4R. Este notebook demonstra como criar um modelo de Floresta Aleatória para prever se o cliente compraria seguro ou não e, em seguida, usar a Importância do Recurso para executar a seleção de recursos.
  • * Seleção de Recursos OML4R Usando Estatísticas Resumidas: Use este notebook para executar a seleção de recursos usando estatísticas resumidas usando OML4R. Este notebook demonstra como usar OML4R para selecionar recursos com base no número de valores distintos, valores nulos e proporção de valores constantes.
  • OML4R Agregação de Engenharia de Recursos: Use este notebook para executar a agregação para min, max, mean e count usando OML4R. Esse modelo usa a tabela SALES presente no esquema SH e mostra como criar recursos agregando o valor vendido para cada cliente e par de produtos.
  • OML4R Modelo Wiki de Análise Semântica Explícita de Extração de Recursos (ESA): Este notebook usa o Modelo Wikipedia como exemplo. Use este notebook para usar a função ore.odmESA do Oracle Machine Learning for R para extrair recursos baseados em texto de um corpus de documentos e executar comparações de similaridade de documentos. Todo o processamento ocorre dentro do Oracle Autonomous Database.

    Observação:

    O modelo predefinido da Wikipedia deve ser instalado em sua instância do Autonomous Database para executar esse notebook.
  • OML4R Tipos de dados Data de Transformação de Dados: Use este notebook para executar várias operações em dados de data e hora usando objetos de proxy de tabela de banco de dados usando o Oracle Machine Learning for R.
  • OML4R Decomposição de Valor Singular (SVD) de Extração de Recursos: Use este notebook para usar o SVD no banco de dados para extração de recursos. Este notebook usa a função ore.odmSVD do Oracle Machine Learning for R para criar um modelo que use o algoritmo de Decomposição de Valor Singular (SVD) para extração de recursos.
  • OML4R SVM (Partitioned Model Support Vector Machine): Use este notebook para criar um modelo SVM para prever o número de anos em que um cliente reside em sua residência, mas particionado de acordo com o sexo do cliente. Em seguida, o modelo é usado para prever o destino e, em seguida, prever o destino com detalhes de previsão.
  • OML4R Modelo Linear Generalizado de Regressão (GLM): Use este notebook para entender como prever valores numéricos usando regressão múltipla. Este notebook usa o algoritmo Modelo Linear Generalizado.
  • OML4R Rede Neural de Regressão (NN): Use este notebook para entender como prever valores numéricos usando regressão múltipla. Este notebook usa o algoritmo Rede Neural.
  • OML4R SVM (Regression Support Vector Machine): Use este notebook para entender como prever valores numéricos usando regressão múltipla. Este notebook usa o algoritmo Support Vector Machine.
  • OML4R API REST: Use este notebook para entender como usar a API REST OML4R para chamar funções R definidas pelo usuário e para listar as disponíveis no repositório de scripts R.

    Observação:

    Para executar um script, ele deve residir no repositório de script R. Um nome de usuário e uma senha da conta de serviço na nuvem do Oracle Machine Learning devem ser fornecidos para autenticação.
  • OML4R Função Estatística: Use este notebook para entender e usar várias funções estatísticas. O notebook usa dados do esquema SH por meio da camada de transparência OML4R.
  • OML4R Text Mining Support Vector Machine (SVM): Use este notebook para entender como usar dados de texto não estruturados para criar modelos de machine learning, aproveitar o Oracle Text, usar recursos preditivos de algoritmos no banco de dados do Oracle Machine Learning e extrair recursos de colunas de texto.

    Este notebook cria um modelo Support Vector Machine (SVM) para prever clientes que provavelmente responderão positivamente a um programa de fidelidade do Affinity Card. Os dados vêm de uma coluna de texto que contém comentários gerados pelo usuário.

Modelos de Exemplo do Oracle Machine Learning for Python

Você pode criar seus notebooks do Oracle Machine Learning com base em qualquer um destes modelos de exemplo do Oracle Machine Learning for Python:

Figura 10-3 Modelos de Exemplo do Oracle Machine Learning for Python

OML4Py Exemplos de Modelo
  • Meu Primeiro Notebook: Use o notebook Meu Primeiro Notebook para funções básicas de machine learning, seleção de dados e exibição de dados. Este modelo usa os dados do esquema SH.
  • OML4Py -0- Tour: Este notebook é o primeiro de uma série de 0 a 5 que se destina a apresentar a faixa da funcionalidade OML4Py por meio de exemplos curtos.
  • OML4Py -1- Introdução: Este notebook fornece uma visão geral sobre como carregar a biblioteca OML, criar tabelas de banco de dados, usar a camada de transparência, classificar atributos para valor preditivo usando o algoritmo de importância de atributo no banco de dados, criar modelos preditivos e pontuar dados usando esses modelos.
  • OML4Py -2- Seleção e Manipulação de Dados: Use este notebook para aprender a trabalhar com a camada de transparência que envolve seleção e manipulação de dados.
  • OML4Py -3- Armazenamentos de dados: Use este notebook para aprender a trabalhar com armazenamentos de dados, mover objetos entre o armazenamento de dados e sessões Python, gerenciar privilégios de armazenamento de dados, salvar objetos de modelo e objetos Python em um armazenamento de dados, excluir armazenamentos de dados e assim por diante.
  • OML4Py -4- Execução do Python Incorporada: Use este notebook para entender a Execução do Python incorporada. Neste notebook, um modelo linear é criado diretamente no Python e, em seguida, é criada uma função que usa mecanismos Python gerados pelo ambiente do Autonomous Database.
  • OML4Py -5- AutoML: Use este notebook para entender o workflow AutoML em OML4Py. Neste notebook, o conjunto de dados WINE do scikit-learn é usado. Aqui, AutoML é usado para classificação na coluna target e para regressão na coluna alcohol.

Observação:

Os notebooks de modelo de exemplo a seguir prefixados com um asterisco (*), usam o conjunto de dados CUSTOMER_INSURANCE_LTV_PY. Este conjunto de dados tem valores duplicados gerados artificialmente pelo notebook OML4SQL Noise. Portanto, execute o OML4SQL Ruído primeiro antes de executar o notebook.
  • * Remoção de Duplicatas de Limpeza de Dados OML4Py: Use este notebook para entender como remover registros duplicados usando OML4Py. Este caderno usa o conjunto de dados do valor da vida útil do seguro do cliente que contém informações financeiras do cliente, valor da vida útil e se o cliente comprou ou não o seguro.
  • * OML4Py Limpando Dados Ausentes: Use este notebook para entender como preencher valores ausentes usando OML4Py. Este caderno usa o conjunto de dados do valor da vida útil do seguro do cliente que contém informações financeiras do cliente, valor da vida útil e se o cliente comprou ou não o seguro.
  • * OML4Py Valores Sinônimos de Recodificação de Limpeza de Dados: Use este notebook para entender como recodificar o valor sinônimo usando OML4Py. Este caderno usa o conjunto de dados do valor da vida útil do seguro do cliente que contém informações financeiras do cliente, valor da vida útil e se o cliente comprou ou não o seguro.
  • OML4Py Remoção de Outlier de Limpeza de Dados: Use este notebook para entender como limpar dados para remover outliers. Este notebook usa o conjunto de dados CUSTOMER_INSURANCE_LTV que contém informações financeiras do cliente, valor de vida útil e se o cliente comprou ou não o seguro. No conjunto de dados CUSTOMER_INSURANCE_LTV, o foco está em valores numéricos e na remoção de registros com valores nos 5% superior e inferior.
  • OML4Py Data Transformation Binning: Use este notebook para entender como criar bin de uma coluna numérica e visualizar a distribuição.
  • OML4Py Data Transformation Categorical - Converter Variáveis Categóricas em Variáveis Numéricas: Use este notebook para entender como converter variáveis categóricas em variáveis numéricas usando OML4Py. Os notebooks demonstram como converter uma variável categórica com cada nível/valor distinto codificado em um tipo de dados inteiro.
  • OML4Py Normalização e Dimensionamento da Transformação de Dados: Use este notebook para entender como normalizar e dimensionar dados usando pontuação z (média e desvio padrão), dimensionamento mínimo máximo e dimensionamento de log.

    Observação:

    Ao criar ou aplicar um modelo usando algoritmos do Oracle Machine Learning no banco de dados, a preparação automática de dados normalizará os dados automaticamente, conforme necessário, por algoritmos específicos.
  • OML4Py Data Transformation One Hot Encoding: Use este notebook para entender como executar uma codificação quente usando OML4Py. Os algoritmos de machine learning não podem trabalhar diretamente com dados categóricos. Os dados categóricos devem ser convertidos em números. Este caderno usa o conjunto de dados do valor da vida útil do seguro do cliente que contém informações financeiras do cliente, valor da vida útil e se o cliente comprou ou não o seguro.

    Observação:

    Se você planeja usar os algoritmos no banco de dados, uma codificação automática é aplicada automaticamente aos algoritmos que a exigem. Os algoritmos in-databae explodem automaticamente as colunas categóricas e ajustam o modelo nos dados preparados internamente.
  • OML4Py Detecção de Anomalias: Use este notebook para detectar registros anômalos, clientes ou transações em seus dados. Este modelo usa o algoritmo de aprendizagem não supervisionado Support Vector Machine de 1 Classe. O modelo de notebook cria um modelo SVM (Support Vector Machine) de 1 Classe.
  • OML4Py Regras de Associação: Use este notebook para análise de cesta de mercado de seus dados ou para detectar itens, falhas ou eventos coocorrentes em seus dados. Este modelo usa o modelo de Regras de Associação apriori usando os dados do esquema SH (SH.SALES).
  • OML4Py Importância do Atributo: Use este notebook para identificar atributos-chave que têm influência máxima sobre o atributo de destino. O atributo de destino nos dados de criação de um modelo supervisionado é o atributo que você deseja prever. O modelo cria um modelo de Importância do Atributo usando os dados do esquema SH.
  • OML4Py Classificação: Use este notebook para prever o comportamento do cliente e previsões semelhantes. O modelo cria e aplica o algoritmo de classificação Árvore de Decisão para criar um modelo de Classificação com base nos relacionamentos entre os valores do preditor e os valores de destino. O modelo usa os dados do esquema SH.
  • OML4Py Clusterização: Use este notebook para identificar clusters naturais em seus dados. O modelo de notebook usa o algoritmo k-Means de aprendizagem não supervisionada nos dados do esquema SH .
  • OML4Py Transformação de Dados: Use este notebook para converter variáveis categóricas em variáveis numéricas usando OML4Py. Este modelo mostra como converter uma variável categórica com cada nível/valor distinto codificado em um tipo de dados inteiro.
  • OML4Py Criação do Conjunto de Dados: Use este notebook para criar o conjunto de dados do pacote sklearn para o quadro de dados OML usando OML4Py.
  • OML4Py Agregação de Engenharia de Recursos: Use este modelo de notebook para preencher valores ausentes usando OML4Py. Este notebook usa a tabela SALES do esquema SH, que contém registros de transação para cada cliente e produtos comprados. Os recursos são criados agregando o valor vendido para cada cliente e par de produtos.
  • OML4Py Seleção de Recursos com Base em Algoritmo Supervisionado: Use este notebook para executar a seleção de recursos usando algoritmos supervisionados no banco de dados usando OML4Py.
  • OML4Py Estatísticas Resumidas de Seleção de Recursos: Use este modelo de notebook para executar a seleção de recursos usando estatísticas resumidas usando OML4Py. O notebook mostra como usar OML4Py para selecionar recursos com base no número de valores distintos, valores nulos e proporção de valores constantes. O conjunto de dados usado aqui CUSTOMER_INSURANCE_LTV_PY tem valores nulos gerados artificialmente pelo notebook de Ruído OML4SQL. Primeiro execute o notebook OML4SQL Ruído antes de executar o notebook OML4Py Estatísticas de Resumo de Seleção de Recursos.
  • OML4Py Modelo Particionado: Use este notebook para criar modelos particionados. Este notebook cria um modelo SVM para prever o número de anos em que um cliente reside em sua residência, mas particionado de acordo com o sexo do cliente. Ele usa o modelo para prever o destino e, em seguida, prever o destino com detalhes de previsão.

    O Oracle Machine Learning permite a criação automática de um modelo de conjunto composto de vários submodelos, um para cada partição de dados. Os submodelos existem e são usados como um modelo, o que resulta em pontuação simplificada usando apenas o modelo de nível superior. O submodelo apropriado é escolhido pelo sistema com base nos valores de partição na linha de dados a ser pontuada. Os modelos particionados obtêm uma precisão potencialmente melhor por meio de vários modelos direcionados.

  • OMP4Py API REST: Use este notebook para chamar a execução do Python incorporado. OML4Py contém uma API REST para executar funções Python definidas pelo usuário salvas no repositório de scripts. A API REST é usada quando a separação entre o cliente e o servidor de Banco de Dados é benéfica. Use a API REST OML4Py para criar, treinar, implantar e gerenciar scripts.

    Observação:

    Para executar um script, ele deve residir no repositório de scripts OML4Py. Um nome de usuário e uma senha da conta de serviço na nuvem do Oracle Machine Learning devem ser fornecidos para autenticação.
  • OML4Py Modelagem de Regressão para Prever Valores Numéricos: Use este notebook para prever valores numéricos usando regressão múltipla.
  • OML4Py Funções Estatísticas: Use este notebook para usar várias funções estatísticas. As funções estatísticas usam dados do esquema SH por meio da camada de transparência OML4Py.
  • OML4Py Text Mining: Use este notebook para criar modelos usando o recurso Text Mining no Oracle Machine Learning.

    Neste notebook, um modelo SVM é criado para prever que os clientes provavelmente serão respondedores positivos a um programa de fidelidade do Affinity Card. Os dados vêm com uma coluna de texto que contém comentários gerados pelo usuário. Com algumas especificações adicionais, o algoritmo usa automaticamente a coluna de texto e cria o modelo nos dados estruturados e no texto não estruturado.

Oracle Machine Learning for SQL Modelos de Exemplo

Você pode criar seus notebooks do Oracle Machine Learning com base em qualquer um destes modelos de exemplo do Oracle Machine Learning for SQL:

Figura 10-4 Modelos de Exemplo do Oracle Machine Learning for SQL

OML4SQL Exemplos de Modelo
  • OML4SQL Detecção de Anomalias: Use este notebook para detectar ocorrências incomuns ou raras. O Oracle Machine Learning suporta a detecção de anomalias para identificar registros raros ou incomuns (clientes, transações etc.) nos dados usando o algoritmo de aprendizado semi-supervisionado One-Class Support Vector Machine. Este notebook cria um modelo 1Class-SVM e o usa para sinalizar registros incomuns ou suspeitos. Toda a metodologia de machine learning é executada dentro do Oracle Autonomous Database.
  • OML4SQL Regras de Associação: Use este notebook para aplicar a técnica de machine learning de Regras de Associação, também conhecida como Análise de Cesta de Compras, para descobrir itens coocorrentes, estados que levam a falhas ou eventos não óbvios. Este notebook cria modelos de regras de associação usando o algoritmo A Priori com os dados SH.SALES do esquema SH. Todo o cálculo ocorre dentro do Oracle Autonomous Database.
  • OML4SQL Importância do Atributo - Identificar Fatores-Chave: Use este notebook para identificar fatores-chave, também conhecidos como atributos, preditores, variáveis que têm mais influência em um atributo de destino. Este notebook cria um modelo de Importância do Atributo, que usa o algoritmo Tamanho Mínimo da Descrição, usando os dados do esquema SH. Todas as funcionalidades são executadas no Oracle Autonomous Database.
  • OML4SQL Classificação - Previsão de Clientes-Alvo: Use este notebook para prever os clientes que provavelmente serão respondedores positivos a um programa de fidelidade do Affinity Card. Este notebook cria e aplica modelos de árvore de decisão de classificação usando os dados do esquema SH. Todo o processamento ocorre dentro do Oracle Autonomous Database.
  • OML4SQL Clustering - Identificando Segmentos do Cliente: Use este notebook para identificar clusters naturais de clientes. O Oracle Machine Learning suporta clusterização usando vários algoritmos, incluindo k-Means, O-Cluster e Maximização de Expectativa. Este notebook usa o conjunto de dados CUSTOMERS do esquema SH usando o algoritmo k-Means de aprendizagem não supervisionado. A exploração, preparação e machine learning de dados são executados no Oracle Autonomous Database.
  • OML4SQL Limpeza de Dados - Removendo Duplicatas: Use este notebook para remover registros duplicados usando o Oracle SQL. O notebook usa o conjunto de dados de valor de vida útil do seguro do cliente que contém informações financeiras do cliente, valor de vida útil e se o cliente comprou ou não o seguro. O conjunto de dados CUSTOMER_INSURANCE_LTV_SQL tem valores duplicados gerados pelo notebook de Ruído OML4SQL.

    Observação:

    Primeiro execute o notebook de Ruído OML4SQL antes de executar o notebook de Limpeza de Dados OML4SQL.
  • OML4SQL Limpeza de Dados - Dados Ausentes: Use este modelo para substituir valores ausentes usando o Oracle SQL e o pacote DBMS_DATA_MINING_TRANSFORM. O conjunto de dados CUSTOMER_INSURANCE_LTV_SQL tem valores ausentes gerados artificialmente pelo notebook de Ruído OML4SQL. Primeiro execute o notebook de Ruído OML4SQL antes de executar o notebook de Limpeza de Dados OML4SQL.

    Observação:

    Ao criar ou aplicar um modelo usando algoritmos do Oracle Machine Learning no banco de dados, essa operação poderá não ser necessária separadamente se a preparação automática de dados estiver ativada. A preparação automática de dados substitui automaticamente os valores ausentes dos atributos numéricos pelos valores médios e ausentes dos atributos categóricos pelo modo.
  • OML4SQL Remoção de Outlier de Limpeza de Dados: Use este notebook para remover outliers usando o Oracle SQL e o pacote DBMS_DATA_MINING_TRANSFORM. O notebook usa o conjunto de dados de valor de vida útil do seguro do cliente, que contém informações financeiras do cliente, valor de vida útil e se o cliente comprou ou não o seguro. No conjunto de dados CUSTOMER_INSURANCE_LTV, ele se concentra em valores numéricos e remove registros com valores nos 5% superior e inferior.
  • OML4SQL Valores Sinônimos de Recodificação de Limpeza de Dados: Use este notebook para recodificar o valor sinônimo de uma coluna usando o Oracle SQL. O notebook usa o conjunto de dados de valor de vida útil do seguro do cliente, que contém informações financeiras do cliente, valor de vida útil e se o cliente comprou ou não o seguro. O conjunto de dados CUSTOMER_INSURANCE_LTV_SQL tem valores recodificados gerados pelo notebook de Ruído OML4SQL. Primeiro execute o notebook OML4SQL Ruído antes de executar o notebook OML4SQL Limpeza de Dados - Recodificar Valores Sinônimos.
  • OML4SQL Binning de Transformação de Dados: Use este notebook para binar colunas numéricas usando o Oracle SQL e o pacote DBMS_DATA_MINING_TRANSFORM. Este notebook mostra como criar bin de uma coluna numérica e visualizar a distribuição.
  • OML4SQL Data Transformation Categorical: Use este notebook para converter uma variável categórica em uma variável numérica usando o Oracle SQL. O notebook mostra como converter uma variável categórica com cada nível/valor distinto codificado em um inteiro e como criar uma variável de indicador com base em um predicado simples.
  • OML4SQL Normalização e Escala de Transformação de Dados: Use este notebook para normalizar e dimensionar dados usando o Oracle SQL e o pacote DBMS_DATA_MINING_TRANSFORM. O notebook mostra como normalizar dados usando pontuação z (média e desvio padrão), dimensionamento mínimo máximo e dimensionamento de log. Ao criar ou aplicar um modelo usando algoritmos do Oracle Machine Learning no banco de dados, a preparação automática de dados normaliza os dados automaticamente, conforme necessário, por algoritmos específicos.
  • OML4SQL Redução de Dimensionalidade - Fatorização de Matriz Não Negativa: Use este notebook para executar a redução de dimensionalidade usando o algoritmo de fatoração de matriz não negativa no banco de dados. Este notebook mostra como converter uma tabela com muitas colunas em um conjunto de recursos reduzido. A fatoração de matriz não negativa produz coeficientes não negativos.
  • OML4SQL Redução de Dimensionalidade - Decomposição de Valor Singular: Use este notebook para executar a redução de dimensionalidade usando o algoritmo de decomposição de valor singular (SVD) no banco de dados.
  • OML4SQL: Exportando Modelos Serializados: Use este notebook para exportar modelos serializados para o Oracle Cloud Object Storage. Este notebook cria modelos de regressão e classificação do Oracle Machine Learning e exporta os modelos em um formato serializado para que eles possam ser pontuados usando a API REST de Serviços do Oracle Machine Learning (OML). Os Serviços OML fornecem pontos finais da API REST hospedados no Oracle Autonomous Database. Esses pontos finais permitem o armazenamento de modelos do Oracle Machine Learning junto com seus metadados e criam pontos finais de pontuação para o modelo. A API REST para Serviços OML suporta modelos do Oracle Machine Learning e modelos de formato ONNX e permite a funcionalidade de texto cognitivo.
  • OML4SQL Agregação e Tempo de Engenharia de Recursos: Use este notebook para gerar recursos agregados e também extrair recursos de data e hora usando o Oracle SQL. O notebook também mostra como extrair recursos de data e hora do campo TIME_ID.
  • OML4SQL Baseado em Algoritmo de Seleção de Recurso: Use este notebook para executar a seleção de recurso usando algoritmos supervisionados no banco de dados. O notebook primeiro cria um modelo de floresta aleatória para prever se o cliente comprará seguro e, em seguida, usa os valores de Importância do Recurso para seleção de recursos. Em seguida, cria um modelo de árvore de decisão para a mesma tarefa de classificação e obtém nós divididos. Para os nós de divisão superior com suporte mais alto, os recursos associados a esses nós são selecionados.
  • OML4SQL Importância do Atributo Não Supervisionado da Seleção de Recursos: Use este notebook para executar a seleção de recursos usando o algoritmo não supervisionado Expectation Maximization (EM) no banco de dados. Este notebook ilustra o uso da função CREATE_MODEL, que aproveita a tabela de definições em contraste com a função CREATE_MODEL2 usada em outros notebooks.
  • OML4SQL Seleção de Recursos Usando Estatísticas Resumidas: Use este notebook para executar a seleção de recursos usando estatísticas resumidas usando o Oracle SQL. O conjunto de dados CUSTOMER_INSURANCE_LTV_SQL tem valores nulos gerados artificialmente pelo notebook de Ruído OML4SQL. Primeiro, execute o notebook OML4SQL Ruído antes de executar a Seleção de Recursos OML4SQL Usando Estatísticas Resumidas.
  • OML4SQL Ruído: Use este notebook para substituir valores normais por valores nulos e adicionar linhas duplicadas. Neste notebook, o conjunto de dados usado pelos notebooks de Preparação de Dados é preparado, em particular aqueles para limpeza de dados e seleção de recursos. Ele usa o conjunto de dados do valor da vida útil do seguro do cliente que contém informações financeiras do cliente, valor da vida útil e se o cliente comprou ou não o seguro.

    Observação:

    Execute o notebook de Ruído OML4SQL antes dos notebooks de Preparação de Dados.
  • OML4SQL Modelo Particionado: Use este notebook para criar modelos particionados. Os modelos particionados obtêm uma precisão potencialmente melhor por meio de vários modelos direcionados. O notebook cria um modelo SVM para prever o número de anos em que um cliente reside em sua residência, mas particionado de acordo com o sexo do cliente. Em seguida, o modelo é usado para prever o destino primeiro e, em seguida, para prever o destino com detalhes de previsão.
  • OML4SQL Mineração de Texto: Use este notebook para criar modelos usando o recurso de mineração de texto. O Oracle Machine Learning lida com dados estruturados e dados de texto não estruturados. Ao aproveitar o Oracle Text, os algoritmos no banco de dados do Oracle Machine Learning extraem automaticamente recursos preditivos da coluna de texto.

    Este notebook cria um modelo SVM para prever que os clientes provavelmente serão respondedores positivos a um programa de fidelidade do Affinity Card. Os dados vêm com uma coluna de texto que contém comentários gerados pelo usuário. Com algumas especificações adicionais, o algoritmo usa automaticamente a coluna de texto e cria o modelo nos dados estruturados e no texto não estruturado.

  • OML4SQL Regressão: Use este notebook para prever valores numéricos. Esse modelo usa vários algoritmos de regressão, como Modelos Lineares Generalizados (GLM).
  • OML4SQL Função Estatística: Use este notebook para funções estatísticas descritivas e comparativas. O modelo de notebook usa dados do esquema SH.
  • OML4SQL Série de Tempo: Use este notebook para criar modelos de série de tempo em seus dados de série de tempo para previsão. Este notebook é baseado no Algoritmo de Suavização Exponencial. O exemplo de previsão de vendas neste notebook se baseia nos dados SH.SALES. Todos os cálculos são feitos dentro do Oracle Autonomous Database.