Acerca de Data Labeling

Obtenga información sobre Data Labeling, qué es y cómo utilizarlo.

El etiquetado de datos es el proceso de identificación de propiedades (etiquetas) de documentos, texto e imágenes (registros), así como su anotación (etiquetado) con dichas propiedades. El tema de un artículo de noticias, el sentimiento de un tuit, la leyenda de una imagen, las palabras importantes pronunciadas en una grabación de audio o el género de un video son todos ejemplos de una etiqueta de datos.

Muchas técnicas de Machine Learning requieren datos etiquetados para que puedan utilizarse para el entrenamiento de máquinas con el fin de que completen una tarea autónoma. Por lo tanto, el etiquetado de datos es parte integral de un proyecto de inteligencia artificial (IA) o Machine Learning (AA).

Data Labeling permite crear y examinar juegos de datos, ver registros de datos (documentos, texto e imágenes) y aplicar etiquetas para crear modelos de IA/AA. Los juegos de datos se pueden exportar como JSON delimitado por líneas para su uso en el desarrollo de modelos de Machine Learning. Los juegos de datos son accesibles e interoperables en otros servicios de datos e IA para soportar el entrenamiento supervisado. Por ejemplo, Oracle Cloud Infrastructure Language se puede utilizar para crear modelos especializados, pero solo si hay datos etiquetados disponibles para entrenar el modelo. Data Labeling le permite iniciar rápidamente el etiquetado de juegos de datos no procesados con un número mínimo de pasos de configuración. Por lo tanto, también proporciona la experiencia de etiquetado de datos para los servicios de IA de Oracle Cloud Infrastructure.

La información sobre los tipos de archivo y los tipos de contenido admitidos para documentos, texto e imágenes se proporciona en Formatos de archivo soportados.

Los juegos de datos son el recurso principal disponible en Data Labeling. Constan de registros de datos y sus etiquetas asociadas. Los registros de datos representan un documento, una única imagen o un texto. Las etiquetas son cadenas de texto que se convierten en anotaciones cuando se asocian a un registro de datos. Las anotaciones tienen otros datos asociados, por ejemplo, con detección de objetos, coordenadas de cuadro delimitador. Los registros de datos pueden existir sin una anotación. Los juegos de datos se pueden exportar como manifiesto JSON para utilizarlos como entrada para el desarrollo del modelo de Machine Learning.
Consejo

Vea una introducción en vídeo al servicio..
Para utilizar Data Labeling:
  1. Configúrelo, incluyendo crear cubos en Object Storage y configurar las políticas de usuario.
  2. Crear un conjunto de datos.
  3. Genere registros en el juego de datos.
  4. Agregue etiquetas a documentos, imágenes o textos.
  5. Exporte el juego de datos a Object Storage para utilizarlo en cualquier otro lugar.