Creación de un juego de datos
Siga estos pasos para crear un juego de datos en Data Labeling.
- Abra el menú de navegación y haga clic en Análisis y AI. En Aprendizaje automático, haga clic en Data Labeling
- Haga clic en Juegos de datos.
- Haga clic en Crear juego de datos.
-
En la página Agregar detalles del juego de datos, introduzca los siguientes campos:
- Nombre: Asigne al juego de datos un nombre adecuado.
- Descripción: (Opcional) proporcione al juego de datos una descripción relevante que puede usar como ayuda para buscarlo.
- Instrucciones de etiquetado: (opcional) introduzca instrucciones e instrucciones para el equipo que etiqueta los datos.
- Formato de conjunto de datos: haga clic en Imágenes, Text o Documentos, en función de si desea etiquetar imágenes, textos o documentos.
- Tipo de archivo: si selecciona Texto como formato de juego de datos, se muestra este campo. Seleccione
TXT
oCSV
, en función de si desea etiquetar un archivo de texto o un archivo CSV. - Clase de anotación: seleccione cómo anotar las imágenes, el texto o los documentos.
- Etiquetas únicas: categoriza imágenes, texto o documentos en una clase.
- Varias etiquetas: categoriza imágenes, texto o documentos en una o más clases.
- Detección de objetos: solo para imágenes. Dibuja cuadros delimitadores alrededor del objeto en las imágenes.
- Extracción de entidad: solo para texto. Resalta y etiqueta textos en una o más clases.
- Valor clave: solo para documentos. Utiliza el reconocimiento óptico de caracteres (OCR) de Document Understanding para identificar y extraer información de documentos.
- Etiquetas: (opcional) para aplicar etiquetas al juego de datos, seleccione un espacio de nombres de etiqueta (para las etiquetas definidas) y rellénelo y, a continuación, especifique una clave y un valor de etiqueta. Agregue más etiquetas según sea necesario. Para obtener más información sobre el etiquetado, consulte Visión general de Tagging.
Nota
El sistema genera dos etiquetas, CreatedBy y CreatedOn, al crear el juego de datos. -
Haga clic en Siguiente.
En la página Agregar archivos y etiquetas, especifique si desea cargar los archivos del juego de datos en Object Storage (vaya al paso 6) o utilizar archivos que ya estén en Object Storage (vaya al paso 7).
-
Para cargar los archivos del juego de datos en Object Storage, haga clic en Cargar archivos locales y siga estos pasos:
Nota
No puede cargar más de 100 archivos locales a la vez en la consola. Se mostrará el número de archivos seleccionados. Para cargar más archivos a la vez, cárguelos en Object Storage antes de crear el juego de datos o utilice la CLI o el SDK.- En la ubicación de Object Storage, especifique el destino de Object Storage (cubo) en el que cargará los archivos locales:
- URL de Object Storage: campo de solo lectura ya rellenado.
- Compartimento: seleccione el compartimento que contiene el cubo.
- Espacio de nombres: se rellena automáticamente según el compartimento seleccionado.
- Cubo: seleccione un cubo en la lista. Si la lista es larga, puede elegir ver todos los cubos. Si hace clic en ella, se abrirá un panel que muestra todos los cubos disponibles. Si necesita crear un cubo, haga clic en el enlace de la pista junto a la etiqueta Cubo, que le llevará a la página de lista Cubos del servicio Object Storage. Consulte Creación de un cubo.
- (Opcional) Prefijo: introduzca una cadena de prefijo agregada para agregar al inicio de los nombres o rutas de archivos.
- Si los archivos que se van a cargar tienen el formato CSV, proporcione la siguiente información en Delimitador:
- Delimitador de columna: seleccione el tipo de delimitador para las columnas. Comma es el valor predeterminado. Si selecciona Personalizado, introduzca el delimitador en Delimitador de columna personalizado.
- Delimitador de línea: (opcional) seleccione esta casilla de control en Delimitador de línea y, a continuación, introduzca un delimitador de línea en Delimitador de línea personalizado. Si no introduce un valor, el delimitador se detecta desde el archivo CSV.
- Carácter de escape: (opcional) seleccione esta casilla de control y, a continuación, seleccione un carácter de escape. Si selecciona Personalizado, introduzca el carácter en Carácter de escape personalizado. Si no introduce un valor, no se escapará nada del texto.
- En Archivos seleccionados, arrastre o seleccione los archivos que desea cargar en el cubo. Nota
Todos los archivos deben estar codificados en UTF-8 y tener las mismas cabeceras e índices de columna. Si no es así, el conjunto de datos pasa al estado Precisa atención. Consulte Formatos de archivo soportados para obtener la lista de formatos de archivo permitidos. - Seleccione un archivo para mostrar una vista previa de su contenido. Nota
Solo se muestran las cinco primeras columnas y filas de los archivos CSV. - (Para archivos CSV). Para la columna que desea etiquetar, seleccione su nombre de columna. Si la columna no tiene nombre, se muestra el número de índice en su lugar.
- En Agregar etiquetas, introduzca las etiquetas que se utilizarán para anotar el juego de datos. Después de introducir cada etiqueta, pulse Intro.
- Haga clic en Siguiente y vaya al paso 8.
- En la ubicación de Object Storage, especifique el destino de Object Storage (cubo) en el que cargará los archivos locales:
-
Para cargar archivos que ya existen en un cubo de Object Storage, haga clic en Seleccionar de Object Storage y siga estos pasos:
- En Ubicación de Object Storage, especifique el destino de Object Storage (cubo) para rellenar los archivos que se van a utilizar para el juego de datos:
- URL de Object Storage: campo de solo lectura ya rellenado.
- Compartimento: seleccione el compartimento que contiene el cubo.
- Espacio de nombres: se rellena automáticamente según el compartimento seleccionado.
- Cubo: seleccione un cubo en la lista. Si la lista es larga, puede elegir ver todos los cubos. Si hace clic en ella, se abrirá un panel que muestra todos los cubos disponibles. Si necesita crear un cubo, haga clic en el enlace de la pista junto a la etiqueta Cubo, que le llevará a la página de lista Cubos del servicio Object Storage. Consulte Creación de un cubo.
- (Opcional) Prefijo: introduzca una cadena de prefijo agregada para agregar al inicio de los nombres o rutas de archivos.
- (Opcional) Si los archivos están en formato CSV, proporcione la siguiente información en Delimitador:
- Seleccione el Delimitador de columnas: seleccione el tipo de delimitador para las columnas. Coma es el valor predeterminado. Si selecciona Personalizado, introdúzcalo en Delimitador de columna personalizado.
- Delimitador de línea: (opcional) seleccione esta casilla de control y, a continuación, introduzca un delimitador de línea en Delimitador de línea personalizado. Si no introduce un valor, el delimitador se detecta desde el archivo CSV.
- Carácter de escape: (opcional) seleccione esta casilla de control y, a continuación, seleccione un carácter de escape. Si selecciona Personalizado, introduzca el carácter en Carácter de escape personalizado. Si no introduce un valor, no se escapará nada del texto.
- En Archivos seleccionados, seleccione un archivo para mostrar una vista previa de su contenido.Nota
Solo se muestran las cinco primeras columnas y filas para los archivos CSV. - (Solo para archivos CSV) Para la columna que desea etiquetar, seleccione su nombre de columna. Si la columna no tiene nombre, se muestra el número de índice en su lugar.Nota
Todos los archivos deben estar codificados en UTF-8 y tener las mismas cabeceras e índices de columna. Si no es así, el conjunto de datos pasa al estado Precisa atención. Consulte Formatos de archivo soportados para obtener la lista de formatos de archivo permitidos. - En Agregar etiquetas, introduzca las etiquetas que se utilizarán para anotar el juego de datos. Después de introducir cada etiqueta, pulse Intro.
- Haga clic en Siguiente.
- En Ubicación de Object Storage, especifique el destino de Object Storage (cubo) para rellenar los archivos que se van a utilizar para el juego de datos:
- En la página Revisar, verifique la información que ha introducido. Si es necesario editar los detalles del juego de datos, haga clic en Editar. Si necesita retroceder y cambiar los valores, haga clic en Editar.
-
Para crear el juego de datos ahora, haga clic en Crear.
Los registros se generan al crear el juego de datos. El estado del juego de datos cambia a Actualizando mientras se generan los registros. Solo después de crear los registros, los archivos utilizados aparecen en la página de detalles del juego de datos.
-
Para crear el juego de datos más tarde mediante Resource Manager y Terraform, haga clic en Guardar como pila para guardar la definición de recurso como una configuración de Terraform.
Para obtener información sobre cómo guardar pilas de definiciones de recursos, consulte Creación de una pila desde una página de creación de recursos.
Utilice el comando create del juego de datos y los parámetros necesarios para crear un juego de datos: Para obtener una lista completa de indicadores y opciones de variables para los comandos de la CLI, consulte la Referencia de comandos de la CLI.oci data-labeling-service dataset create [OPTIONS]
Ejecute la operación CreateDataset para crear un juego de datos.