Adicionando Labels ao Texto com o Uso do Reconhecimento de Entidade Nomeada

No serviço Data Labeling, você pode usar o reconhecimento de entidade nomeada (NER), também conhecido como extração de entidade, para adicionar labels ao texto. Você adiciona rótulos para anotar o texto.

    1. Na página Detalhes do Conjunto de Dados:
      • Se a opção Registros de dados estiver selecionada, haverá duas maneiras de acessar a página Adicionar labels:
        • Clique no nome do texto que você deseja identificar.
        • Clique no ícone de ação da imagem que você deseja identificar e clique em Label.
      • Se a opção View da galeria estiver selecionada, clique no ícone de ação do texto que você deseja identificar e clique em Label.
    2. Em Label, selecione o label da parte do texto que você quer identificar. Se houver apenas um label no conjunto de dados, o label será selecionado automaticamente.
    3. Selecione a parte do texto a ser identificada.
      A tecognição de entidade nomeada aninhada (NER) permite destacar o texto de três maneiras:
      • Sobreposição - onde você pode anotar frases sobrepostas.
      • Múltiplo - onde você pode anotar o mesmo texto, com rótulos diferentes, até quatro vezes.
      • Multinível - onde você pode anotar subtextos de partes de texto já anotadas, até 15 vezes.
      Esta imagem ilustra as três maneiras NER aninhadas:
      Figura 1. Ilustração das formas NER aninhadas
      Um exemplo de texto que foi anotado usando NER aninhado. Vários níveis e Vários estão na primeira linha de texto, Sobrepor na segunda.
    4. Repita os passos 2 e 3 até ter adicionado todos os labels que você deseja adicionar ao texto.
      Há funcionalidade para ajudá-lo a selecionar detalhes no texto:
      • Existem alguns ícones nos quais você pode clicar para Ampliar, Reduzir e Redefinir zoom para ajustar o tamanho do texto.
      • Há ícones Desfazer e Refazer para alterar as alterações ao usar a extração de entidade.
      • Clique no ícone Informações para exibir as instruções de rotulagem do criador do conjunto de dados em um painel redimensionável e arrastável.
      • Clique em Atalhos para exibir um painel com a lista de teclas como alternativa ao uso do mouse para navegar nessa funcionalidade, além de outras ações na tela.
      • Clique em Limpar anotações para remover qualquer label do texto.
      • Você pode fechar, minimizar e mover os painéis que exibem todas essas funcionalidades para facilitar a identificação das imagens. As posições desses painéis são armazenadas em cache no browser. Se você limpar o cache do browser ou começar a usar outro browser, eles serão exibidos nas posições padrão. Depois de usar um browser, os painéis são exibidos nas posições que você deixou na última vez que o usou.
      Observação

      Qualquer alteração feita na forma como o registro é exibido é apenas para exibição e não é salva.
    5. Clique em Salvar e próximo para salvar as alterações e identificar o próximo item do texto, ou clique em Salvar para salvar as alterações. Se você não quiser identificar um item, clique em Ignorar para ir até o próximo item de texto. Se você estiver no último item do texto, clique em Salvar e concluir para salvar as alterações e retornar à página Detalhes do Conjunto de Dados.
    6. (Opcional) Clique em Cancelar para retornar à página Detalhes do Conjunto de Dados.
      Se tiver adicionado um rótulo a um registro, mas não o tiver salvo, você será solicitado a confirmar que deseja cancelar.
  • Use o comando update do conjunto de dados e os parâmetros necessários para usar o Reconhecimento de Entidade Nomeada (NER), também conhecido como extração de entidade, a fim de adicionar labels ao texto:
    oci data-labeling-service-dataplane record update [OPTIONS]
    Para obter uma lista completa de flags e opções de variáveis para comandos da CLI, consulte a Referência do Comando da CLI.
  • Execute a operação UpdateRecord para usar o Reconhecimento de Entidade Nomeada (NER), também conhecido como extração de entidade, para adicionar labels ao texto no serviço Data Labeling.