Entités de données (dans le bucket OCI Object Storage)
Les entités de données disponibles sont répertoriées sur la page de détails du schéma (bucket).
Sélectionnez une entité de données pour en visualiser les détails. Sous Options de format, sélectionnez un type de fichier. Indiquez ensuite les options de format et sélectionnez Obtenir les attributs pour extraire les attributs de l'entité de données. Les tables Attributs et Données sont vides si vous n'extrayez pas les attributs.
Options de format de fichier :
-
Pour les fichiers CSV et JSON, sélectionnez le type de compression du fichier. Si vous ne connaissez pas l'algorithme de compression utilisé pour compresser le fichier, utilisez Automatique (valeur par défaut). Indiquez également l'encodage à utiliser pour analyser les attributs.
-
Pour les fichiers Parquet, Avro et Excel, le type de compression Auto (par défaut) ne peut pas être modifié.
-
Pour les fichiers CSV, vous pouvez sélectionner d'autres options de format :
- Si la première ligne du fichier est une ligne d'en-tête, sélectionnez Oui pour A un en-tête.
- Si les valeurs des lignes de données s'étendent sur plusieurs lignes, sélectionnez Oui pour Multi-ligne.
- Indiquez le caractère d'échappement des autres caractères trouvés dans les valeurs de données. Par exemple :
\
. - Sélectionnez le caractère déliimitre qui sépare les champs de données. Par exemple : COLON (
:
), COMMA (,
), PIPE (|
), SEMICOLON (;
) ou TAB (\t
). - Si un séparateur de colonne est inclus à la fin d'une ligne de données dans le fichier, sélectionnez Oui pour Délimiteur de fin.
- Indiquez le caractère de guillemet qui traite les autres caractères comme des caractères littéraux. Par exemple :
"
-
Pour les fichiers JSON :
-
Sélectionnez Utiliser un schéma personnalisé pour coller ou télécharger un exemple de schéma personnalisé utilisé pour inférer la forme d'entité. Lorsque cette case est cochée, la dérive de schéma n'est plus applicable dans l'entité source.
-
Si vous sélectionnez Télécharger vers le serveur, supprimez un fichier de schéma personnalisé dans la zone indiquée ou cliquez sur Sélectionner un fichier pour sélectionner le fichier de schéma à télécharger.
-
Si vous sélectionnez Coller dans le schéma, copiez le contenu du fichier texte du schéma et collez-le dans la zone indiquée.
-
Après avoir chargé le fichier de schéma personnalisé, sélectionnez Obtenir les attributs pour visualiser les attributs du schéma. Si vous ajoutez ou enlevez des attributs après l'ajout du schéma, sélectionnez Obtenir les attributs pour obtenir une liste mise à jour.
-
-
Pour les fichiers Excel :
- Par défaut, Data Integration traite la première ligne d'un fichier comme une ligne d'en-tête. Si la première ligne de votre fichier n'est pas une ligne d'en-tête, sélectionnez Non pour A un en-tête.
- Pour Sélectionner une entité par, choisissez les critères Nom de feuille, Index de feuille ou Nom de table. Entrez ensuite une valeur pour le nom de la feuille de calcul, l'index de la feuille de calcul ou le nom de la table. L'index de feuille est basé sur zéro.
- Pour Nom de feuille ou Index de feuille, entrez la zone du fichier à utiliser comme plage de données pour la sélection. Si vous n'entrez pas de valeur de plage de données, la valeur par défaut est la plage de données A1, qui correspond à la feuille entière. Si le fichier comporte une ligne d'en-tête, entrez une valeur qui commence par la ligne d'en-tête, par exemple,
A1:K56
.
Une fois les attributs de l'entité de données extraits, sélectionnez Données pour répertorier les lignes de données. Dans la table Données, sélectionnez un en-tête d'attribut pour visualiser le profil de données et d'attribut hiérarchique. Pour plus d'informations, reportez-vous à Types de données hiérarchiques.
Le profil de données et d'attribut n'est pas pris en charge sur les types de données d'attribut suivants :
- BLOB
- RAW
- BINARY
- BINARY_DOUBLE
- BINARY_FLOAT
- CLOB
- NCLOB
- SDO_GEOMETRY
- XMLTYPE
- XMLFORMAT
- COMPLEX
- VARBINARY