Sobre o Serviço Data Labeling

Descubra mais sobre o serviço Data Labeling, o que é e como usá-lo.

Data labeling é o processo de identificar propriedades (labels) de documentos, textos e imagens (registros) e anotá-los (identificá-los) com essas propriedades. O tópico de um artigo de notícias, o sentimento de um tweet, a legenda de uma imagem, palavras importantes faladas em uma gravação de áudio, o gênero de um vídeo são exemplos de um label de dados.

Muitas técnicas de aprendizado de máquina exigem dados identificados com label antes de serem usadas para treinar máquinas a fim de concluir uma tarefa autônoma. O serviço Data Labeling é, portanto, parte integrante de um projeto de Inteligência Artificial (IA) ou Aprendizado de Máquina (ML).

O serviço Data Labeling permite criar e procurar conjuntos de dados, exibir registros de dados (documentos, texto e imagens) e aplicar labels para criar modelos de AI/ML. Os conjuntos de dados podem ser exportados na forma de JSON delimitado por linhas para uso no desenvolvimento do modelo de aprendizado de máquina. Os conjuntos de dados são acessíveis e interoperáveis em outros serviços de Dados e IA para oferecer suporte ao treinamento supervisionado. Por exemplo, o Oracle Cloud Infrastructure Language pode ser usado para criar modelos especializados, mas somente se os dados identificados com label estiverem disponíveis para treinamento do modelo. O serviço Data Labeling permite que você comece a identificar rapidamente conjuntos de dados brutos com um número mínimo de etapas de configuração. Assim, ele também fornece a experiência de identificação de dados para os serviços de IA do Oracle Cloud Infrastructure.

As informações sobre os tipos de arquivo e os tipos de conteúdo suportados para documentos, textos e imagens são fornecidas em Formatos de Arquivo Suportados.

Conjuntos de Dados são o recurso principal disponível no serviço Data Labeling. Eles consistem em registros de dados e seus labels associados. Os registros de dados representam um documento, uma imagem individual ou um trecho de texto. Labels são strings de texto, que se tornam anotações quando associadas a um registro de dados. As anotações têm outros dados associados, por exemplo, com detecção de objeto e coordenadas da caixa delimitadora. Os registros de dados podem existir sem uma anotação. Os conjuntos de dados podem ser exportados como um manifesto JSON para uso como uma entrada para desenvolvimento do modelo de aprendizado de máquina.
Dica

Assista a uma introdução em vídeo do serviço..
Para usar o serviço Data Labeling:
  1. Configure-o, incluindo criar buckets no serviço Object Storage e configurar suas políticas de usuário.
  2. Criar um conjunto de dados.
  3. Gere registros no seu conjunto de dados.
  4. Adicione labels aos seus documentos, imagens ou partes de texto.
  5. Exportar o conjunto de dados para o serviço Object Storage para uso em outro lugar.