Importazione di data set
L'importazione dei data set consente di riutilizzare i data set all'interno della stessa tenancy o di unire e sostituire il contenuto, senza la necessità di creare un data set completamente nuovo.
Nota
Da una directory locale, è possibile importare al massimo 201 file in un set di dati e la dimensione del set di dati non può superare i 4,9 GB. Se il numero di file o la dimensione del set di dati supera questi valori, caricare la cartella nello storage degli oggetti. Sono supportati i seguenti formati:
Da una directory locale, è possibile importare al massimo 201 file in un set di dati e la dimensione del set di dati non può superare i 4,9 GB. Se il numero di file o la dimensione del set di dati supera questi valori, caricare la cartella nello storage degli oggetti. Sono supportati i seguenti formati:
Formato | Tipo di dati | Tipo di annotazione | Struttura file | Numero massimo di file e dimensione file |
---|---|---|---|---|
JSONL metadati
|
Immagine |
|
|
|
JSONL metadati
|
Testo |
|
|
|
JSONL metadati
|
Documento |
|
|
|
COCO metadati
|
Immagine | Rilevamento oggetti |
|
|
Una volta sola v5 metadati
|
Immagine | Rilevamento oggetti |
|
|
PASCAL VOC metadati
|
Immagine | Rilevamento oggetti |
|
|
spaCy | Testo | NER |
|
|
CoNLL 2003 | Testo | NER |
|
|
Per ulteriori informazioni sui tipi e le dimensioni di file supportati, vedere Formati di file supportati.
Contenuto file di metadati di esempio
Contenuto del file di esempio per ciascuna delle opzioni del file di metadati.
- Etichettatura dati JSONL consolidata
-
{"id":"<Dataset OCID>", "compartmentId":"<Compartment OCID>", "displayName":"<Dataset Name>", "description":"<Dataset Description>", "labelsSet":[{"name":"<Label Name>"},{"name":"<Label Name>"},...], "annotationFormat":"<SINGLE_LABEL/MULTI_LABEL/BOUNDING_BOX/ENTITY_EXTRACTION>", "datasetSourceDetails":{"namespace":"<Namespace>","bucket":"<Bucket>"}, "datasetFormatDetails":{"formatType":"<IMAGE/TEXT/DOCUMENT>"} } {"id":"<Record OCID>", "timeCreated":"<Created datetime>", "sourceDetails":{"sourceType":"OBJECT_STORAGE","path":"<Path of recrod file>"}, "annotations":[{"id":"<Annotation OCID>", "timeCreated":"<Created datetime>", "createdBy":"<User OCID>", "entities":[{"entityType":"<GENERIC/IMAGEOBJECTSELECTION...>", "labels":[{"label_name":"<Label Name>"},{"label_name":"<Label Name>"},...], "boundingPolygon<IN CASE OF BOUNDING_BOX>":{"normalizedVertices":[{"x":"0.1752872","y":"0.18566811"},...]}}]}] } ...other record objects
- Compatto JSONL
-
{"labelsSet":[{"name":"<Label Name>"}, {"name":"<Label Name>"},...], "annotationFormat":"SINGLE_LABEL/MULTI_LABEL/ENTITY_EXTRACTION", "datasetFormatDetails":{"formatType":"TEXT"} } {"sourceDetails":{"path":"<Path of text recrod file>"}, "annotations":[{"entities":[{"entityType":"GENERIC","labels":[{"label_name":"<Label Name>"},...]}]}] } ...other record objects
- COCO
-
{ "info": { "year": "<Year>", "version": "1", "description": "<Dataset description>", "contributor": "", "url": "<URL>", "date_created": "<Created datetime>" }, "licenses": [ { "id": 1, "url": "", "name": "Unknown" } ], "categories": [ { "id": 0, "name": "animals", "supercategory": "none" }, { "id": 1, "name": "cat", "supercategory": "animals" }, { "id": 2, "name": "dog", "supercategory": "animals" } ], "images": [ { "id": 1, "license": 1, "file_name": "<Record file path>", "height": 500, "width": 400, "date_captured": "<Captured datetime>" }, ... ], "annotations": [ { "id": 1, "image_id": 1, "category_id": 1, "bbox": [84, 44, 282.5, 143], "area": 40397.5, "segmentation": [], "iscrowd": 0 }, ... ] }
- Una volta sola v5
-
train: ../train/images nc: 4 names: ["Label1", "Label2", "Label3", "Label4", "..."]
- PASCAL VOC
-
<annotation> <folder/> <filename>recordFile.jpg</filename> <path>/n/Namespace/b/Bucket/o/recordFile.jpg</path> <source> <database>Unknown</database> </source> <size> <width>3800</width> <height>2534</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>LabelName</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <occluded>0</occluded> <bndbox> <xmin>186.94249</xmin> <xmax>1878.6903</xmax> <ymin>330.67606</ymin> <ymax>1396.7037</ymax> </bndbox> </object> <object>....</object> ... </annotation>
- spaCy
- Esempio 1:
[ { "content": "<Text Content>", "entities": [ { "start": 0, "end": 29, "labelName": "<Label Name>" }, { "start": 65, "end": 86, "labelName": "<Label Name>" }, { "start": 80, "end": 104, "labelName": "<Label Name>" }, ... ] }, ... ]
- CoNLL 2003
-
-DOCSTART- -X-O This -X- _ B-Label1 is -X- _ I-Label1 sample -X- _ I-Label1 data, -X- _ I-Label1 and -X- _ O new -X- _ O data -X- _ O information -X- _ O new -X- _ B-Label1 sample -X- _ I-Label1 Data -X- _ O ...