4 Conceitos Básicos do Oracle Machine Learning Notebooks para Análise de Dados e Visualização de Dados

O Oracle Machine Learning Notebooks é uma plataforma de notebook aprimorada baseada na Web para analistas e cientistas de dados. Você pode escrever código, texto, criar visualizações e executar análises de dados, incluindo machine learning. Notebooks trabalham com intérpretes no back-end. Na interface do usuário do Oracle Machine Learning, os notebooks estão disponíveis em um projeto, no qual você pode criar, editar, excluir, copiar, mover e até mesmo salvar notebooks como modelos.

4.1 Sobre o Oracle Machine Learning Notebooks

O Oracle Machine Learning Notebooks é uma plataforma de notebook aprimorada baseada na Web para engenheiros de dados, analistas de dados, usuários R e Python e cientistas de dados. Você pode escrever código, texto, criar visualizações e executar análises de dados, incluindo machine learning. Notebooks trabalham com intérpretes no back-end.

No Oracle Machine Learning, os notebooks estão disponíveis em um projeto dentro de um espaço de trabalho, no qual você pode criar, editar, excluir, copiar, mover e até mesmo salvar notebooks como modelos. Um notebook pode conter muitos parágrafos. Um parágrafo é um componente de notebook no qual você pode gravar e executar instruções SQL, scripts PL/SQL, código R e Python e instruções conda. Você pode executar parágrafos individualmente ou executar todos os parágrafos em um bloco de notas usando um único botão. Um parágrafo tem uma seção de entrada e uma seção de saída. Na seção de entrada, especifique o interpretador a ser executado junto com o código ou o texto. Essas informações são enviadas ao intérprete para execução. Na seção de saída, os resultados do interpretador são fornecidos.

Observação:

Há um único namespace para os notebooks originais e para os novos notebooks. Você não pode ter um notebook com o mesmo nome em ambas as listas de notebooks. Um notebook copiado da interface original para o novo terá _new anexado a ele.

Figura 4-1 Notebook OML

Captura de Tela do OML Notebook
O Oracle Machine Learning Notebook fornece:
  • Tempo de carregamento mais rápido do notebook.
  • A aparência da Oracle é baseada no tema do Oracle Redwood.
  • Visualização enriquecida em seu Gráfico de linhas, Gráfico de áreas, Gráfico de barras, Gráfico de pirâmides, Gráfico de pizza, Gráfico de donuts, Gráfico de funil, Nuvem de tags, Diagrama de mapa de árvore, Diagrama de explosão solar, Diagrama de dispersão, Diagrama de caixa.
  • Opção para informar comentários em parágrafos de notebook.
  • Opção para criar Dependências de Parágrafo. O recurso Dependências de parágrafo permite adicionar dependências entre parágrafos. Os dependentes de um parágrafo são executados automaticamente após a execução do parágrafo original.
  • Seleção simplificada do nível de serviço do menu suspenso Alto, Médio, Baixo até.
  • Layout do notebook Zeppelin e Jupyter.
  • Controle de versão na página, exibição do histórico de versões e comparação de versões.

4.2 Acesse a Página do Oracle Machine Learning Notebooks

Você pode acessar a página Notebooks do OML no painel de navegação esquerdo do Oracle Machine Learning Notebooks ou na página Notebooks.

  1. Para acessar a página Notebooks:
    • Vá para o painel de navegação esquerdo do Oracle Machine Learning, expanda Projects e clique em Notebooks.

      Figura 4-2 Painel de navegação esquerdo

      Painel de navegação esquerdo
    • Como alternativa, você pode clicar em Notebooks em Link Rápido na home page para abrir a página Notebooks.
  2. Isso abre a página Notebooks do OML.
    • Figura 4-3 Página Notebooks do OML

      Página Notebooks do OML
      Aqui, você tem a opção de:
    • Criar: Clique em Criar para criar um novo notebook.
    • Editar: Clique em uma linha de notebook para selecioná-la e clique em Editar. Você pode editar o nome do notebook e adicionar comentários na caixa de diálogo Editar Notebook.
    • Excluir: Clique em uma linha de notebook para selecioná-la e clique em Excluir.
    • Duplicar: Clique em uma linha de notebook para selecioná-la e clique em Duplicar. Isso cria uma cópia de um notebook e a cópia duplicada é listada na página Notebooks com o sufixo _1 no nome do notebook.
    • Salvar como Modelo: Para salvar um notebook como um modelo, selecione o notebook e clique em Salvar como Modelo. Na caixa de diálogo Salvar como modelo, é possível definir o local do modelo para salvá-lo em Pessoal ou Compartilhado em Modelos.
    • Importar: para importar um notebook como arquivos .json, clique em Importar. Selecione o projeto e o espaço de trabalho no qual importar o notebook.
    • Exportar: Para exportar um notebook, clique em Exportar. Você pode exportar Notebooks no arquivo (.json ) de formato .dsnb , Zeppelin e no formato Jupyter ( .ipynb) e importá-los posteriormente para o mesmo ambiente ou para outro ambiente.
    • Versão: para criar versões de um notebook, selecione-o e clique em Versão. A página Versões desse bloco de anotações específico é aberta. Aqui, você pode criar uma nova versão do notebook clicando em +Version. A caixa de diálogo Criar Versão é aberta. Digite um nome da versão do notebook, uma descrição, e clique em OK. A nova versão do notebook é criada com o mesmo nome com um sufixo _2 para a segunda versão. Para versões subsequentes, o sufixo (número) aumenta em um. Para reverter para uma versão mais antiga, clique em Reverter Versão. Você também tem a opção de excluir qualquer versão do notebook. Clique em Voltar para Notebooks para ir para a página Notebooks do OML.

      Observação:

      Você também pode criar uma versão de um notebook abrindo-o e clicando na opção Ícone Controle de Versão. Usando essa opção, você pode criar novas versões, exibir o histórico de versões, restaurar versões mais antigas e excluir quaisquer versões mais antigas do notebook que abriu.

4.2.1 Trabalhar com Versões de Notebook na Página Notebooks

Ao criar versões do seu notebook, você pode arquivar seu trabalho em um notebook.

Você pode criar versões de notebooks na página Notebooks, bem como no editor Notebook. Neste exemplo, o notebook Demonstração de Controle de Versão do Notebook é criado e tem a versão Versão 1.

Observação:

Um notebook com controle de versão não é editável. Se quiser fazer alterações em uma versão específica de um notebook, restaure essa versão para editá-la.
Pré-requisitos: O notebook Demonstração de Controle de Versão do Notebook. Este notebook é criado como parte do exemplo aqui.
Para criar uma nova versão de notebook e exibir o histórico de versões:
  1. Na página Notebooks, clique em Criar Notebooks.
  2. Na caixa de diálogo Criar Notebooks, digite o nome Notebook Versioning Demo no campo Nome e clique em OK. O notebook é criado e é aberto no editor de notebook.
  3. No notebook, passe o cursor do mouse sobre a borda inferior do parágrafo e clique no ícone + para adicionar um parágrafo. Adicione mais dois parágrafos a este notebook e cole o seguinte script PL/SQL nos parágrafos:
    Adicionar parágrafo
    1. No primeiro parágrafo, copie e cole o seguinte script PL/SQL. Esse script cria a view ESM_SH_DATA na tabela SALES presente no esquema SH.
      %script
      
      CREATE OR REPLACE VIEW ESM_SH_DATA AS 
        SELECT TIME_ID, AMOUNT_SOLD FROM SH.SALES;
    2. No segundo parágrafo, copie e cole o script SQL a seguir. Este script fornece uma contagem do registro presente na view ESM_SH_DATA.
      %script
      SELECT count(*) from ESM_SH_DATA;
    3. No terceiro parágrafo, copie e cole o script SQL a seguir para revisar os dados em um formato tabular.
      SELECT * FROM ESM_SH_DATA
      FETCH FIRST 10 ROWS ONLY;
  4. Execute todos os parágrafos e volte para a página Notebooks depois que todos os parágrafos forem executados com sucesso.
  5. Na página Notebooks, selecione o notebook Demonstração de Controle de Versão do Notebook para ativar todas as opções de edição e clique em Versões para ir para a página de versões desse notebook.
    Opção Versões
    A página Versões - Demonstração de Controle de Versão do Notebook é aberta.
  6. Na página Versões - Demonstração de Controle de Versão do Notebook, clique em Versão para criar uma nova versão do notebook. Isso abre a caixa de diálogo Criar Versão.
    Página Versões
  7. Na caixa de diálogo Criar Versões:
    1. Nome: Digite Version 1 para a nova versão deste notebook
    2. Comentários: Informe comentários, se houver.
    3. Clique em OK. Depois que a versão do notebook é criada, ela é listada na página Versões - Demonstração do Controle de Versão do Notebook.
    Página Versões 2
  8. Na página Versões - Demonstração de Controle de Versão do Notebook, selecione a Versão 1 da versão do notebook que você acabou de criar para ativar todas as opções disponíveis.
    Selecionar Versão 1
    • Clique em Excluir para excluir a versão selecionada do notebook.
    • Clique em Restaurar para restaurar a versão selecionada do notebook.

      Observação:

      A restauração de uma versão selecionada do notebook descartará todas as alterações sem versão, se houver.
    • Clique em Voltar aos Notebooks para voltar à página Notebooks.

4.3 Editar seu Notebook do Oracle Machine Learning

Ao criar um notebook, ele é aberto automaticamente, apresentando um único parágrafo usando o interpretador %sql padrão. Você pode alterar o interpretador especificando explicitamente um dos seguintes: %script, %python, %sql, %r, %md ou %conda.

Defina o contexto com um projeto ao qual seu notebook está associado. Você pode editar um notebook existente em seu projeto. Para editar um notebook existente:
  1. Na home page do Oracle Machine Learning, selecione o projeto no qual seu notebook está disponível.

    Observação:

    Um projeto é um agrupamento lógico de notebooks e experimentos em um espaço de trabalho. Embora você possua muitos projetos, outros espaços de trabalho e projetos podem ser compartilhados com você.
  2. Clique no bloco de anotações que você deseja abrir e editar.
    O bloco de anotações selecionado é aberto no modo de edição.
  3. No modo de edição, você pode usar as seguintes opções da barra de ferramentas do Oracle Machine Learning Notebook:
    Barra de Ferramentas do Notebook OML
    Opções de edição no nível do notebook:
    • Clique em Executar todos os itens para executar todos os parágrafos no notebook
    • Clique em Invalidar sessão para invalidar e redefinir a sessão de notebook.
    • Clique em controle de versãopara criar uma nova versão deste notebook ou para exibir as versões anteriores do notebook.
      • Criar Versão: Clique nesta opção para criar uma nova versão deste notebook. Você tem a opção de fornecer um novo nome para a versão e uma descrição sobre ela. Quando você cria uma nova versão de notebook, os resultados do parágrafo de cada sessão de execução são armazenados no notebook com controle de versão. Quando você restaura um notebook, os resultados do parágrafo de cada sessão de execução também são restaurados. Você também pode criar versões de notebook com base no editor. Para obter mais informações, consulte Trabalhar com Versões de Notebook no Editor de Notebook
      • Exibir Histórico da Versão: Clique nesta opção para exibir as versões anteriores do notebook. Você tem a opção de restaurar qualquer versão anterior, comparar versões e excluir qualquer versão anterior criada.

      Observação:

      Você também pode criar versões de notebook, exibir o histórico de versões e excluir versões mais antigas da opção Opção Versões na página Notebooks na página Notebooks.
    • Clique em Limpar resultados para limpar os resultados do parágrafo.
    • Clique em limpar dependências de parágrafo para limpar as dependências de parágrafo.
    • Clique em adoção antecipada do notebook de exportação para exportar o notebook. Você pode exportar o notebook como um arquivo .dsnb, arquivo .zpln (notebook Zeppelin) e arquivo .ipynb (notebook Jupyter). Você tem estas definições ao exportar um notebook:
      • Exportar Todas
      • Excluir código
      • Excluir resultados
      • Excluir Timestamp
    • Clique em Imprimir caderno para imprimir o notebook
    • Clique em Ocultar código para ocultar o código de todos os parágrafos no notebook
    • Clique em Ocultar resultados para ocultar os resultados de todo o parágrafo no notebook
    • Clique em Ativar somente para leitura para ativar o modo somente para leitura deste notebook.

      Observação:

      O modo somente leitura está disponível somente para o Oracle Machine Learning Notebook.
    • Clique em Mostrar painel para mostrar o painel de edição. As opções de edição no painel são as mesmas opções de edição disponíveis para o parágrafo. Clicar no ícone do painel abre o painel de edição à direita e a barra de ferramentas de edição no parágrafo fica oculta.
    • Clique em Atualizar interpretador para alterar a vinculação do interpretador para baixo, médio ou alto
    • Clique em Zeppelin para alternar o notebook OML para o notebook Zeppelin ou Jupyter
    Opções de edição no nível do parágrafo:
    • Clique em Não para executar o parágrafo selecionado
    • Clique em Entre no modo de dependência para entrar no Modo de Dependência. No Modo de Dependência, você deve selecionar e desmarcar parágrafos para adicioná-los ou removê-los como dependentes.

      Observação:

      O recurso Dependências de parágrafo permite adicionar dependências entre parágrafos. Os dependentes de um parágrafo são executados automaticamente após a execução do parágrafo original.
    • Clique em Comentários para abrir a caixa de diálogo Comentários. Digite seus comentários aqui e pressione Enter para adicionar o comentário. Você também pode excluir comentários clicando no ícone Excluir correspondente. Clique no ícone de comentários para fechar a caixa de diálogo. Você pode fornecer comentários para cada parágrafo em um bloco de anotações. Os parágrafos com comentários são indicados por um ponto verde no ícone de comentários. Indicador para comentários
    • Clique em Expandir para exibir o parágrafo do notebook no modo de tela inteira. Para visualizar o parágrafo no modo normal, clique no ícone recolher.
    • Clique em Mostrar Ocultar Números de Linha para mostrar os números de linha no parágrafo do notebook.
    • Clique em Visibilidade para exibir o título do parágrafo, o código, os resultados e as definições do parágrafo.
    • Clique em Configurações para :
      • Mover para cima: Clique para mover o parágrafo para cima no notebook.
      • Mover para baixo: Clique para mover o parágrafo para baixo no notebook.
      • Limpar resultados: Clique para limpar os resultados dos comandos executados no parágrafo.
      • Abrir como Janela Incorporada: Clique para exibir o parágrafo atual separadamente em seu browser.
      • Clonar Parágrafo: Clique para clonar o parágrafo. O parágrafo é clonado no mesmo notebook.
      • Desativar Execução: Clique para desativar a execução do parágrafo. Para ativar a execução, vá para Definições e clique em Ativar Execução.
      • Excluir Parágrafo: Clique para excluir o parágrafo.
    • Clique em HTML para exibir o parágrafo no formato HTML
    • Clique em Texto para exibir o parágrafo no formato de texto
    • Clique em Configurações para ajustar as definições da saída do parágrafo de notebook. Essa configuração é especificamente aplicável a visualizações em gráficos, gráficos etc.
    • Clique em fazer download-como para fazer download do parágrafo como um arquivo de texto ou como arquivos .png ou .svg, conforme aplicável, para parágrafos que contenham gráficos ou gráficos como saída.

4.3.1 Trabalhar com Versões de Notebook no Editor de Notebook

Ao criar versões do seu notebook, você pode arquivar seu trabalho em um notebook.

Você pode criar versões de notebooks no editor de Notebooks, bem como na página Notebooks. Neste exemplo:
  • O notebook original Demonstração de Controle de Versão do Notebook é editado para adicionar um script para criar um modelo de aprendizado de máquina.
  • O notebook Demonstração de Controle de Versão do Notebook tem a versão Versão 2 para arquivar o código para criar o modelo de aprendizado de máquina.
  • A Versão 2 e a Versão 1 do notebook Demonstração de Controle de Versão do Notebook são comparadas usando o recurso Comparar Versões.

Observação:

Um notebook com controle de versão não é editável. Se quiser fazer alterações em uma versão específica de um notebook, restaure essa versão para editá-la.
Para criar uma nova versão de notebook e exibir o histórico de versões:
  1. Na página EA de Notebooks, clique no notebook Demonstração de Controle de Versão de Notebooks para abri-lo no editor de notebook.

    Observação:

    A versão 1 deste notebook já foi criada como parte do exemplo em Trabalhar com Versões de Notebook na Página Notebooks. Ele contém o código arquivado para criar a view ESM_SH_DATA, contar o registro e exibir os dados. Clicar no notebook abre a versão original que é editável.
  2. Agora, edite o notebook para adicionar um script e criar um modelo de machine learning. No notebook, passe o cursor do mouse sobre a borda inferior do terceiro parágrafo e clique no ícone + para adicionar um novo parágrafo.
    Adicionar parágrafo
  3. Copie e cole o script a seguir no novo parágrafo. Este script cria um modelo de aprendizado de máquina usando o algoritmo ESM.
    %script
    
    BEGIN DBMS_DATA_MINING.DROP_MODEL('ESM_SALES_FORECAST_1');
    EXCEPTION WHEN OTHERS THEN NULL; END;
    /
    DECLARE
        v_setlst DBMS_DATA_MINING.SETTING_LIST;
    BEGIN
        
        v_setlst('ALGO_NAME')            := 'ALGO_EXPONENTIAL_SMOOTHING';
        v_setlst('EXSM_INTERVAL')        := 'EXSM_INTERVAL_QTR'; -- accumulation int'l = quarter
        v_setlst('EXSM_PREDICTION_STEP') := '4';                 -- prediction step = 4 quarters
        v_setlst('EXSM_MODEL')           := 'EXSM_WINTERS';      -- ESM model = Holt-Winters
        v_setlst('EXSM_SEASONALITY')     := '4';                 -- seasonal cycle = 4 quarters    
    
        DBMS_DATA_MINING.CREATE_MODEL2(
            MODEL_NAME          => 'ESM_SALES_FORECAST_1',
            MINING_FUNCTION     => 'TIME_SERIES',
            DATA_QUERY          => 'select * from ESM_SH_DATA',
            SET_LIST            => v_setlst,
            CASE_ID_COLUMN_NAME => 'TIME_ID',
            TARGET_COLUMN_NAME  =>'AMOUNT_SOLD');
    END;
  4. Agora, arquive este notebook com o código para criar o modelo de machine learning com controle de versão. No canto superior esquerdo do editor de notebook, clique em Controle de Versão Ícone Controle de Versão
  5. As opções para Criar Versão e Exibir Histórico de Versões são abertas.
    Criar Versões
  6. Clique em Criar Versão. A caixa de diálogo Nova Versão é aberta.
  7. Na caixa de diálogo Nova Versão:
    1. Nome: Aqui, o nome Version 2 é tomado por padrão. Vamos manter esse nome.
    2. Comentários: Informe comentários, se houver.
    3. Clique em Criar. Uma mensagem é exibida confirmando a criação da nova versão.
    Caixa de diálogo Nova Versão
    A versão 2 deste notebook agora contém o código arquivado para criar o modelo de aprendizado de máquina.
  8. Para exibir a versão que você acabou de criar, clique em Controle de Versão controle de versão e, em seguida, clique em Exibir Histórico da Versão.
  9. No painel direito do editor de notebook, o painel Histórico de Versões é aberto. Passe o cursor sobre qualquer versão de notebook e clique nela para ativar as opções disponíveis.
  10. Você pode realizar as seguintes tarefas no painel Histórico de versões:
    Exibir Histórico de Versão
    • Clique em versão aberta para abrir a versão selecionada.

      Observação:

      Clicar em qualquer notebook com controle de versão abre o notebook no modo somente leitura, pois os notebooks com controle de versão não são editáveis. Para exibir a versão editável atual, clique em Exibir versão atual do notebook. Opção Exibir Versão Atual
    • Clique em Excluir para excluir a versão selecionada.
    • Clique em Comparar Versões para comparar a versão selecionada e a atual do notebook. Você pode selecionar outras versões disponíveis na lista drop-down. Neste exemplo, a Versão 2 do notebook (em Estado Atual) é comparada com a Versão 1. Novas adições são destacadas em verde, como mostrado na captura de tela aqui, e as exclusões são destacadas em vermelho. Comparar Versões do Notebook
    • Clique em Restaurar para restaurar a versão selecionada.

      Observação:

      A restauração de uma versão selecionada do notebook descartará todas as alterações sem versão, se houver.

4.3.2 Criar Dependências de Parágrafo

Dependências de parágrafo permitem que você adicione dependências entre parágrafos. Os parágrafos dependentes são executados automaticamente após a execução do parágrafo original, de acordo com a ordem de dependência.

Para criar dependências de parágrafo:
  1. Na página Notebooks, clique em Criar Notebooks.
  2. Na caixa de diálogo Criar Notebooks, digite o nome Paragraph Dependencies Demo no campo Nome e clique em OK.
    O notebook é criado e é aberto no editor de notebook.
  3. No notebook, passe o cursor do mouse sobre a borda inferior do parágrafo e clique no ícone + para adicionar um parágrafo. Adicione mais dois parágrafos a este notebook e cole o seguinte script PL/SQL nos parágrafos:
    Adicionar parágrafo
    1. No primeiro parágrafo, copie e cole o seguinte script PL/SQL. Esse script cria a view ESM_SH_DATA na tabela SALES presente no esquema SH.
      %script
      
      CREATE OR REPLACE VIEW ESM_SH_DATA AS 
        SELECT TIME_ID, AMOUNT_SOLD FROM SH.SALES;
    2. No segundo parágrafo, copie e cole o script SQL a seguir. Este script fornece uma contagem do registro presente na view ESM_SH_DATA.
      %script
      SELECT COUNT(*) FROM ESM_SH_DATA;
    3. No terceiro parágrafo, copie e cole o script SQL a seguir para revisar os dados em um formato tabular.
      %sql
      SELECT * FROM ESM_SH_DATA
      FETCH FIRST 10 ROWS ONLY;
  4. Vá para o primeiro parágrafo e clique no ícone Inserir Modo de Dependência.
    Entrar no Modo de Dependência
    A mensagem é exibida: Você está selecionando dependentes para este parágrafo
  5. Clique no segundo e terceiro parágrafos para adicioná-los como dependentes do primeiro parágrafo.

    Observação:

    A ordem da dependência de parágrafo é baseada na ordem do seu clique.
    Selecionar Parágrafo Dependente
  6. Clique em Salvar. Depois que os parágrafos dependentes forem definidos e salvos, eles serão indicados pelos números, conforme mostrado na captura de tela aqui:
    Parágrafos dependentes
  7. Agora, vá para o primeiro parágrafo e clique em Executar. Depois que o primeiro parágrafo começa com sucesso, os parágrafos dependentes subsequentes começam a ser executados de acordo com a ordem de dependência.
    Execução do parágrafo dependente