Criando um Conjunto de Dados

Siga estas etapas para criar um conjunto de dados no serviço Data Labeling.

    1. Abra o menu de navegação e clique em Analytics e IA. Em Machine Learning, clique em Data Labeling
    2. Clique em Conjuntos de Dados.
    3. Clique em Criar conjunto de dados.
    4. Na página Adicionar detalhes do conjunto de dados, preencha os campos a seguir:
      • Nome: Dê ao conjunto de dados um nome adequado.
      • Descrição: (Opcional) Forneça ao conjunto de dados uma descrição relevante que você possa usar para ajudar a procurá-lo.
      • Instruções de rotulagem: (Opcional) Informe instruções e direções para a equipe que está rotulando os dados.
      • Formato de conjunto de dados: clique em Imagens, Texto ou Documentos, dependendo de se você deseja identificar imagens, partes de texto ou documentos.
      • Tipo de arquivo: se você selecionar Texto como o formato do conjunto de dados, esse campo será exibido. Selecione TXT ou CSV, dependendo se você deseja rotular um arquivo de texto ou um arquivo CSV.
      • Classe de anotação: Selecione como anotar as imagens, o texto ou os documentos.
        • Rótulos únicos: Categoriza imagens, texto ou documentos em uma classe.
        • Vários Labels: Categoriza imagens, texto ou documentos em uma ou mais classes.
        • Detecção de Objetos: Somente para imagens. Desenha caixas delimitadoras ao redor do objeto nas imagens.
        • Extração de Entidade: Somente para texto. Destaca e cria labels do texto em uma ou mais classes.
        • Valor-Chave: Somente para documentos. Usa o OCR (Óptico de Caracteres) do Document Understanding para identificar e extrair informações de documentos.
      • Tags: (Opcional) Para aplicar tags ao conjunto de dados, selecione um namespace de tag (para tags definidas) e preencha, em seguida, especifique uma chave e um valor de tag. Se necessário, adicione mais tags. Para obter mais informações sobre tags, consulte Visão Geral do Serviço Tagging.
      Observação

      O sistema gera duas tags, CreatedBy e CreatedOn, quando você cria o conjunto de dados.
    5. Clique em Próximo.
      Na página Adicionar arquivos e labels, você especifica se faz upload dos arquivos do conjunto de dados para o Object Storage (vá para a etapa 6) ou se usa arquivos que já estão no Object Storage (pule para a etapa 7).
    6. Para fazer upload dos arquivos do conjunto de dados para o Object Storage, clique em Fazer upload de arquivos locais e siga estas etapas:
      Observação

      Você não pode carregar mais de 100 arquivos locais de cada vez na Console. O número de arquivos selecionados é exibido. Para carregar mais arquivos de cada vez, carregue-os no Object Storage antes de criar o conjunto de dados, ou use a CLI ou o SDK.
      1. No local do Object Storage, especifique o destino (bucket) do Object Storage no qual você carrega os arquivos locais:
        • URL do Serviço Object Storage: Um campo somente para leitura, já preenchido.
        • Compartment: Selecione o compartimento que contém o bucket.
        • Namespace: Preenchido automaticamente com base no compartimento selecionado.
        • Bucket: Selecione um bucket na lista. Se a lista for longa, você poderá optar por exibir todos os buckets. Se você clicar nele, um painel será aberto listando todos os buckets disponíveis. Se você precisar criar um bucket, clique no link na dica de ferramenta ao lado do label Bucket, que o levará à página da lista Buckets no serviço Object Storage. Consulte Criando um Bucket.
        • (Opcional) Prefixo: Informe uma string de prefixo adicionada para adicionar ao início dos nomes ou caminhos dos arquivos.
      2. Se os arquivos a serem carregados estiverem no formato CSV, forneça as seguintes informações em Delimitador:
        • Delimitador de coluna: Selecione o tipo de delimitador para colunas. Vírgula é o padrão. Se você escolher Personalizado, digite o delimitador em Delimitador de coluna personalizada.
        • Delimitador de linha: (Opcional) Marque essa caixa de seleção no Delimitador de linha e informe um delimitador de linha em Delimitador de linha personalizada. Se você não informar um valor, o delimitador será detectado no arquivo CSV.
        • Caractere de escape: (Opcional) Marque essa caixa de seleção e selecione um caractere de escape. Se você escolher Personalizado, digite o caractere em Caractere de escape Personalizado. Se você não informar um valor, nenhum texto será escapado.
      3. Em Arquivos selecionados, arraste ou selecione os arquivos que você deseja carregar para o bucket.
        Observação

        Todos os arquivos devem ter a codificação UTF-8 e os mesmos cabeçalhos e índices de coluna. Caso contrário, o conjunto de dados entrará no estado Necessita de Atenção. Consulte Formatos de Arquivo Suportados para obter a lista de formatos de arquivo permitidos.
      4. Selecione um arquivo para exibir uma visualização de seu conteúdo.
        Observação

        Somente as cinco primeiras colunas e linhas são exibidas de arquivos CSV.
      5. (Para arquivos CSV.) Para a coluna que você deseja rotular, selecione seu nome de coluna. Se a coluna não tiver um nome, o número do índice será exibido.
      6. Em Adicionar labels, digite os labels a serem usados para anotar o conjunto de dados. Depois de informar cada label, pressione Enter.
      7. Clique em Próximo e vá para a etapa 8.
    7. Para carregar arquivos que já existem em um bucket do Object Storage, clique em Selecionar no Object Storage e siga estas etapas:
      1. Em localização do Object Storage, especifique o destino do Object Storage (bucket) preencha os arquivos a serem usados para o conjunto de dados:
        • URL do Serviço Object Storage: Um campo somente para leitura, já preenchido.
        • Compartment: Selecione o compartimento que contém o bucket.
        • Namespace: Preenchido automaticamente com base no compartimento selecionado.
        • Bucket: Selecione um bucket na lista. Se a lista for longa, você poderá optar por exibir todos os buckets. Se você clicar nele, um painel será aberto listando todos os buckets disponíveis. Se você precisar criar um bucket, clique no link na dica de ferramenta ao lado do label Bucket, que o levará à página da lista Buckets no serviço Object Storage. Consulte Criando um Bucket.
        • (Opcional) Prefixo: Informe uma string de prefixo adicionada para adicionar ao início dos nomes ou caminhos dos arquivos.
        Os arquivos são listados em Arquivos selecionados. Consulte Formatos de Arquivo Suportados para obter a lista de formatos de arquivo permitidos.
      2. (Opcional) Se estiver usando os arquivos no formato CSV, forneça as seguintes informações em Delimitador:
        • Selecione o Delimitador de coluna: selecione o tipo de delimitador para colunas. Vírgula é o padrão. Se você escolher Personalizado, digite-o em Delimitador de coluna personalizado.
        • Delimitador de linha: (Opcional) Marque essa caixa de seleção e informe um delimitador de linha em Delimitador de linha personalizada. Se você não informar um valor, o delimitador será detectado no arquivo CSV.
        • Caractere de escape: (Opcional) Marque essa caixa de seleção e selecione um caractere de escape. Se você escolher Personalizado, informe o caractere em Caractere de escape Personalizado. Se você não informar um valor, nenhum texto será escapado.
      3. Em Arquivos selecionados, selecione um arquivo para exibir uma visualização de seu conteúdo.
        Observação

        Somente as cinco primeiras colunas e linhas são exibidas para arquivos CSV.
      4. (Somente para arquivos CSV) Para a coluna que você deseja rotular, selecione seu nome de coluna. Se a coluna não tiver um nome, o número do índice será exibido.
        Observação

        Todos os arquivos devem ter a codificação UTF-8 e os mesmos cabeçalhos e índices de coluna. Caso contrário, o conjunto de dados entrará no estado Necessita de Atenção. Consulte Formatos de Arquivo Suportados para obter a lista de formatos de arquivo permitidos.
      5. Em Adicionar labels, digite os labels a serem usados para anotar o conjunto de dados. Depois de informar cada label, pressione Enter.
      6. Clique em Próximo.
    8. Na página Verificar, verifique as informações informadas. Se for necessário editar os detalhes do conjunto de dados, clique em Editar. Se precisar voltar e alterar os valores, clique em Editar.
    9. Para criar o conjunto de dados agora, clique em Criar.
      Os registros são gerados quando o conjunto de dados é criado. O estado do conjunto de dados muda para Atualizando enquanto os registros são gerados. Somente depois que os registros forem criados, os arquivos usados aparecerão na página de detalhes do conjunto de dados.
    10. Para criar o conjunto de dados posteriormente usando o Resource Manager e o Terraform, clique em Salvar como pilha para salvar a definição de recurso como uma configuração do Terraform.
      Para obter informações sobre como salvar pilhas de definições de recursos, consulte Criando uma Pilha com Base em uma Página de Criação de Recurso.
  • Use o comando create do conjunto de dados e os parâmetros necessários para criar um conjunto de dados:
    oci data-labeling-service dataset create [OPTIONS]
    Para obter uma lista completa de flags e opções de variáveis para comandos da CLI, consulte a Referência do Comando da CLI.
  • Execute a operação CreateDataset para criar um conjunto de dados.