Datenentitys (im OCI Object Storage-Bucket)
Verfügbare Datenentitys werden auf der Detailseite des Schemas (Buckets) aufgeführt.
Wählen Sie eine Datenentity aus, um die Entitydetails anzuzeigen. Wählen Sie unter Formatoptionen einen Dateityp aus. Geben Sie dann Formatoptionen an, und wählen Sie Attribute abrufen aus, um die Attribute der Datenentity abzurufen. Die Tabellen Attribute und Daten sind leer, wenn Sie die Attribute nicht abrufen.
Dateiformatoptionen:
-
Wählen Sie für CSV- und JSON-Dateien den Komprimierungstyp der Datei aus. Wenn Sie den Komprimierungsalgorithmus, der zur Komprimierung der Datei verwendet wird, nicht kennen, verwenden Sie "Automatisch (Standard). Geben Sie auch die Codierung an, mit der die Attribute geparst werden sollen.
-
Bei Parquet-, Avro- und Excel-Dateien kann der Komprimierungstyp "Automatisch (Standard)" nicht geändert werden.
-
Für CSV-Dateien können Sie folgende Formatoptionen auswählen:
- Wenn die erste Zeile in der Datei eine Headerzeile ist, wählen Sie Ja für Hat Header.
- Wenn sich die Werte in den Datenzeilen über mehrere Zeilen erstrecken, wählen Sie Ja für Mehrzeilen aus.
- Geben Sie das Feldzeichen an, das andere Zeichen in Datenwerten maskiert. Beispiel:
\
- Wählen Sie das Begrenzer als Trennzeichen für Datenfelder aus. Beispiele: Spalte (
:
), COMMA (,
), PIPE (|
), SEMICOLON (;
) oder TAB (\t
) - Wenn ein Spaltentrennzeichen am Ende einer Datenzeile in der Datei enthalten ist, wählen Sie Ja für Nachgestelltes Trennzeichen aus.
- Geben Sie das Anführungszeichen an, das andere Zeichen als Literalzeichen behandelt. Beispiel:
"
-
Für JSON-Dateien:
-
Wählen Sie Benutzerdefiniertes Schema verwenden aus, um ein benutzerdefiniertes Beispielschema einzufügen oder hochzuladen, mit dem die Entityausprägung inferenziert wird. Wenn dieses Kontrollkästchen aktiviert ist, ist die Schemadrift in der Quellentity nicht mehr anwendbar.
-
Wenn Sie Hochladen auswählen, legen Sie eine benutzerdefinierte Schemadatei im angegebenen Feld ab, oder klicken Sie auf Datei auswählen, um die hochzuladende Schemadatei auszuwählen.
-
Wenn Sie In Schema einfügen auswählen, kopieren Sie den Inhalt der Schematextdatei, und fügen Sie ihn in das angegebene Feld ein.
-
Nachdem Sie die benutzerdefinierte Schemadatei geladen haben, wählen Sie Attribute abrufen aus, um die Attribute des Schemas anzuzeigen. Wenn Sie Attribute hinzufügen oder entfernen, nachdem das Schema hinzugefügt wurde, wählen Sie Attribute abrufen aus, um eine aktualisierte Liste abzurufen.
-
-
Für Excel-Dateien:
- Standardmäßig behandelt Data Integration die erste Zeile in einer Datei als Headerzeile. Wenn die erste Zeile in Ihrer Datei keine Headerzeile ist, wählen Sie Nein für Hat Header aus.
- Wählen Sie unter Entity auswählen nach die Kriterien Blattname, Blattindex oder Tabellenname aus. Geben Sie dann einen Wert für den Arbeitsblattnamen, den Arbeitsblattindex oder den Tabellennamen ein. Blattindex ist nullbasiert.
- Geben Sie unter Blattname oder Blattindex den Bereich der Datei ein, der als Datenbereich zur Auswahl verwendet werden soll. Wenn Sie keinen Datenbereichswert eingeben, wird standardmäßig der Datenbereich A1 verwendet, der dem gesamten Blatt entspricht. Wenn die Datei eine Headerzeile enthält, geben Sie einen Wert ein, der mit der Headerzeile beginnt, z.B.
A1:K56
.
Nachdem die Datenentityattribute erfolgreich abgerufen wurden, wählen Sie Daten aus, um die Datenzeilen aufzulisten. Wählen Sie in der Tabelle Daten einen Attributheader aus, um das hierarchische Daten- und Attributprofil anzuzeigen. Weitere Informationen finden Sie unter Hierarchische Datentypen.
Ein Daten- und Attributprofil wird für diese Attributdatentypen nicht unterstützt:
- BLOB
- RAW
- BINARY
- BINARY_DOUBLE
- BINARY_FLOAT
- CLOB
- NCLOB
- SDO_GEOMETRY
- XMLTYPE
- XMLFORMAT
- COMPLEX
- VARBINARY