Chargement des données

Vous pouvez charger des données à partir de fichiers sur votre appareil local, de bases de données distantes ou de buckets de stockage cloud à partir de répertoires et de fournisseurs de partage. Les formats de fichier que vous pouvez charger sont CSV, XLS, XLSX, TSV, TXT, XML, JSON, GEOJSON, AVRO, PARQUET, GZ, GZIP, ZIP, PDF, PNG, JPG, JPEG et TIFF.

L'outil de chargement des données prend en charge le chargement des fichiers source au format booléen. Le type de données booléen a les valeurs de vérité TRUE et FALSE. En l'absence de contrainte NOT NULL, le type de données booléen prend également en charge la valeur de vérité UNKNOWN en tant que valeur NULL. Vous pouvez utiliser le type de données booléen partout où le type de données apparaît dans la syntaxe Oracle SQL.

Il prend également en charge le type de données VECTOR, qui vous permet de stocker des incorporations vectorielles directement dans les tables Oracle Database.

Utilisation des fonctionnalités du service OCI Language dans Data Studio

Vous pouvez utiliser les fonctionnalités du service OCI Language, telles que l'analyse de sentiment, l'extraction d'expressions clés et la détection de langage, pour analyser les données sans expertise en machine learning (ML) ou en intelligence artificielle (IA).

Par exemple, vous pouvez l'utiliser pour obtenir des commentaires sur un produit. Un fabricant de téléphones a lancé un nouveau modèle de téléphone et ils veulent savoir quel est le sentiment des clients sur leur produit. Si un fort pourcentage de sentiment est négatif, cela pourrait signaler une panne potentielle avec la caméra qui n'a pas été détectée dans le contrôle qualité (QC).

Présentation de l'analyse de sentiment, de l'extraction d'expressions clés et de la détection de langage

Sentiment Analysis, Key Phrase Extraction, Language Detection et Text Translation sont actuellement pris en charge dans le chargement de données à partir de fichiers locaux et le chargement de données à partir du stockage cloud.

Analyse de sentiment

L'analyse des sentiments analyse le texte pour définir votre sentiment sur un sujet ou un produit. L'analyse de sentiment du service Language utilise le traitement du langage naturel. L'outil Data Studio utilise le service Oracle Cloud Infrastructure (OCI) Language pour analyser et comprendre les données d'entrée. L'outil Data Studio ajoute dynamiquement de nouvelles colonnes au chargement de données qui contient la sortie du service OCI Language. Vous pouvez détecter les sentiments de n'importe quelle colonne des données source. Par exemple, lorsque vous effectuez une recherche dans une colonne contenant des révisions pour une application, supposons que vous souhaitiez obtenir un avis général sur l'application. L'outil Data Studio effectue une analyse de sentiment sur les données d'entrée et crée une nouvelle colonne d'expression définie dans la table cible qui se compose du sentiment.

Pour plus de détails, reportez-vous à Analyse des sentiments dans OCI.

Extraction d'expressions clés

L'extraction des expressions clés identifie les principaux concepts d'un texte. L'extraction de mots-clés est le processus automatisé d'extraction des mots les plus pertinents et des expressions du texte saisi. Il permet de synthétiser le contenu et de reconnaître les sujets principaux. Un nuage de mots peut être généré avec des expressions clés pour vous aider à visualiser les concepts clés dans les commentaires texte ou les commentaires. Par exemple, une revue Movie pourrait générer un nuage de mots basé sur des phrases clés identifiées dans leurs commentaires et pourrait voir que les gens commentent le plus souvent la direction, l'action et le personnel de la cinématographie.

Pour plus de détails, reportez-vous à Extraction d'expressions clés dans OCI.

Détection de la langue

Vous pouvez utiliser les fonctionnalités du service OCI Language, telles que la détection de langue, pour détecter la langue du texte d'entrée. Il renvoie le langage naturel dans lequel se trouve le texte. Vous pouvez l'utiliser pour surmonter les barrières linguistiques, améliorant ainsi la communication avec les personnes d'autres pays. Vous pouvez déterminer la langue du texte d'entrée et traduire le contenu dans différentes langues. Pour plus d'informations, reportez-vous à Extraction de langue dans OCI.

Traduction de texte

La traduction de texte traduit le texte saisi dans l'une des langues cible prises en charge par le service OCI Language. L'outil Data Studio utilise le service Oracle Cloud Infrastructure (OCI) Language pour analyser et comprendre les données d'entrée. L'outil Data Studio ajoute dynamiquement une nouvelle colonne au chargement de données qui contient la colonne source d'entrée traduite. Par exemple, lorsque vous avez besoin de savoir ce que les clients disent de votre produit dans la langue du marché local – le français. L'outil Data Studio effectue la traduction de la langue sur les données d'entrée et crée une colonne d'expression définie dans la table cible qui comprend la langue source traduite dans la colonne.

Avant de commencer :
  • Charger des données à partir de fichiers locaux ou d'un stockage cloud : chargez les données à analyser dans Oracle Autonomous Database à partir de fichiers locaux ou d'un stockage cloud. Assurez-vous que les données sont chargées dans le panier de chargement des données sans erreur. Vous pouvez visualiser et corriger les erreurs de mapping à partir du filtre rapide Erreurs dans Chargement des données à partir de l'emplacement de la banque cloud. Une fois les données chargées dans l'outil de chargement des données,
    • Cliquez sur l'icône Paramètres du panier du travail de chargement des données pour vérifier les paramètres.
    • Dans le panneau Paramètres de l'assistant Charger les données à partir de l'emplacement de la banque cloud, en cas d'erreur de mise en correspondance, la cellule de la grille de mise en correspondance est mise en surbrillance en rouge pour indiquer une valeur non valide qui doit être corrigée.

    • Cliquez sur le filtre rapide Erreurs pour afficher uniquement les colonnes comportant des erreurs.

  • Les outils permettent d'analyser les sentiments, d'extraire des expressions clés et de détecter les langages tout en définissant les paramètres du travail de chargement des données.

Paramètres d'analyse des données

Lorsque vous appelez une expression d'ajout à partir de l'onglet Paramètres, vous devez configurer le modèle à l'aide de paramètres.

Tableau 3-3 Paramètres d'analyse de sentiment, d'extraction de phase clé et de détection de langage

Paramètre Description
Type d'expression

Sélectionnez l'une des opérations suivantes à effectuer sur le texte d'entrée : Analyse de sentiment, Extraction d'expression clé et Détection de langue.

Colonne Entrée

Sélectionnez la colonne à analyser.

La liste déroulante des colonnes d'entrée contient uniquement les colonnes prises en charge par l'analyse de sentiment, l'extraction d'expressions clés et la détection de langage.

Pour l'analyse des sentiments, seules les colonnes cible VARCHAR2, NVARCHAR2, CLOB ou NCLOB sont affichées dans la liste déroulante d'entrée.

Colonne cible
  • Entrez le nom de la nouvelle colonne d'expression définie dans la table cible.
  • Pour l'analyse des sentiments, cette colonne affiche le sentiment de la colonne d'entrée. Les différents types de sentiments identifiés par l'outil sont les suivants :
    • Positif
    • Neutre
    • mixte
    • négatif

      Si l'outil ne peut pas déterminer le sentiment de la colonne d'entrée, il renvoie NULL dans la colonne d'expression.

  • Pour l'extraction d'expressions clés, cette colonne affiche les expressions clés de la colonne d'entrée que vous sélectionnez.
  • Pour la détection de langue, cette colonne affiche la langue de la colonne d'entrée que vous sélectionnez.

Effectuer une analyse de sentiment

Pour déterminer les sentiments des données d'entrée :

  1. Une fois que vous avez chargé des données dans le panier de chargement de données à partir de fichiers locaux ou du stockage cloud, vous pouvez afficher le fichier dans le panier. Cliquez sur l'icône Paramètres.

  2. Cliquez sur l'icône Paramètre pour ouvrir un assistant Charger les données à partir d'un fichier local. Dans cet exemple, nous avons chargé des données à partir d'un fichier local.
  3. Dans l'onglet Paramètres de l'assistant, cliquez sur Ajouter une expression sous la section Correspondance.

    La boîte de dialogue Ajouter une expression s'ouvre.



  4. Dans la boîte de dialogue Ajouter une expression, indiquez les champs suivants :
    • Type d'expression : dans la liste déroulante Type d'expression, sélectionnez Analyse des sentiments.
    • Colonne d'entrée : sélectionnez la colonne à analyser dans la liste déroulante. Par exemple, CONTENT.
    • Colonne cible : saisissez le nom de la nouvelle colonne d'expression. Par exemple, CONTENT_SENTIMENT.

      Pour plus de détails, voir Paramètres d'analyse des données.

  5. Cliquez OK. Une nouvelle ligne est ajoutée à la grille de mappage. Cette ligne détermine la colonne d'expression de sortie générée par le service OCI Language.

  6. Cliquez sur Fermer.
  7. Cliquez sur Démarrer dans le panier du menu Chargement des données pour charger des données à partir de fichiers locaux. Un message de confirmation vous demandera si vous souhaitez démarrer le chargement à partir de fichiers locaux.
  8. Cliquez sur Exécuter pour confirmer.

Une fois le travail de chargement des données terminé, les chargements de table et de vue de la page Chargement des données affichent les détails de la table source chargée dans l'outil. Il affiche le nombre de lignes et de colonnes ainsi que la date de fin du chargement.

Données de sortie générées à partir de l'analyse de sentiment OCI

Lorsque vous analysez des colonnes à l'aide du modèle de service OCI Language, Data Studio génère une nouvelle colonne d'expression et enregistre le résultat dans la table mise à jour.

Pour localiser la colonne d'expression générée, accédez à Chargement des données à partir du panneau de lancement de Database Actions. Sélectionnez la table que vous chargez dans la section Chargements de table et de vue.

Cliquez sur les trois points verticaux en regard du nom de chargement, puis cliquez sur Table et sélectionnez Visualiser les détails.

L'onglet Aperçu du chargement de données s'ouvre et affiche le fichier source mis à jour. Par exemple, voici un jeu de données de sortie de l'analyse de sentiment de l'application Instagram. Ici, CONTENT est la colonne cible et CONTENT_SENTIMENT est l'analyse de sentiment de la colonne d'entrée. Cette colonne affiche l'une des valeurs suivantes, telles que positif, neutre, mixte ou négatif. Elle affiche NULL lorsque l'outil n'est pas en mesure de déterminer le sentiment.
Description de l'image content-analysis.png
Description de l'illustration content-analysis.png

Effectuer l'extraction d'expressions clés

Pour extraire des informations sur l'expression clé à partir des données d'entrée :

  1. Une fois que vous avez chargé des données dans le panier de chargement de données à partir de fichiers locaux ou du stockage cloud, vous pouvez afficher le fichier dans le panier. Cliquez sur l'icône Paramètres.

  2. Cliquez sur l'icône Paramètre pour ouvrir un assistant Charger les données à partir d'un fichier local. Dans cet exemple, nous avons chargé des données à partir d'un fichier local.
  3. Dans l'onglet Paramètres de l'assistant, cliquez sur Ajouter une expression sous la section Correspondance.

    La boîte de dialogue Ajouter une expression s'ouvre.



  4. Dans la boîte de dialogue Ajouter une expression, indiquez les champs suivants :
    • Type d'expression : dans la liste déroulante Type d'expression, sélectionnez Extraction d'expression de clé.
    • Colonne d'entrée : sélectionnez la colonne à analyser dans la liste déroulante. Par exemple, CONTENT.
    • Colonne cible : saisissez le nom de la nouvelle colonne d'expression. Par exemple, CONTENT_KEY_PHRASE_EXTRACTION.

    Pour plus de détails, voir Paramètres d'analyse des données.

  5. Cliquez OK. Une nouvelle ligne est ajoutée à la grille de mappage . Cette ligne détermine la colonne d'expression de sortie générée par le service OCI Language.

  6. Cliquez sur Fermer.
  7. Cliquez sur Démarrer dans le panier du menu Chargement des données pour charger des données à partir de fichiers locaux. Un message de confirmation vous demandera si vous souhaitez démarrer le chargement à partir de fichiers locaux.
  8. Cliquez sur Exécuter pour confirmer.

Une fois le travail de chargement des données terminé, les chargements de table et de vue de la page Chargement des données affichent les détails de la table source chargée dans l'outil. Il affiche le nombre de lignes et de colonnes ainsi que la date de fin du chargement.

Données de sortie générées à partir de l'extraction de l'expression de clé OCI

Lorsque vous analysez des colonnes à l'aide du modèle de service OCI Language, Data Studio génère une nouvelle colonne d'expression et enregistre le résultat dans la table mise à jour.

Pour localiser la colonne d'expression générée, accédez à Chargement des données à partir du panneau de lancement de Database Actions. Sélectionnez la table que vous chargez dans la section Chargements de table et de vue.

Cliquez sur les trois points verticaux en regard du nom du chargement, puis sur Table et sélectionnez Visualiser les détails.

Par exemple, voici un jeu de données de sortie de l'analyse de sentiment de l'application Instagram. Ici, CONTENT est la colonne cible et la colonne CONTENT_KEY_PHRASE_EXTRACTION affiche les expressions clés extraites de la colonne d'entrée.
Description de l'image key-output.png
Description de l'illustration key-output.png

Effectuer la détection de la langue

Data Studio prend en charge la détection de plusieurs langues.

Pour déterminer la langue du texte d'entrée :
  1. Une fois que vous avez chargé des données dans le panier de chargement de données à partir du stockage cloud, vous pouvez afficher le fichier dans le panier. Cliquez sur l'icône Paramètres.

  2. Cliquez sur l'icône Setting pour ouvrir un assistant Load Data from Cloud Store Location.
  3. Dans l'onglet Paramètres de l'assistant, cliquez sur Ajouter une expression sous la section Correspondance.

    La boîte de dialogue Ajouter une expression s'ouvre. Sélectionnez Expressions AI.
    La description de l'élément add-expn-lang.bmp suit
    Description de l'illustration add-expn-lang.bmp

  4. Dans la boîte de dialogue Ajouter une expression, indiquez les champs suivants :
    • Type d'expression : dans la liste déroulante Type d'expression, sélectionnez Détection de langue.
    • Colonne d'entrée : sélectionnez la colonne à analyser dans la liste déroulante. Dans ce cas, nous devons détecter la langue de la colonne Vérifier. Par exemple, REVIEW.
    • Colonne cible : saisissez le nom de la nouvelle colonne d'expression. Par exemple, REVIEW_LANGUAGE_DETECTION.

    Pour plus de détails, voir Paramètres d'analyse des données.

  5. Cliquez OK. Une nouvelle ligne est ajoutée à la grille de mappage . Cette ligne détermine la colonne d'expression de sortie générée par le service OCI Language.

  6. Cliquez sur Fermer.
  7. Cliquez sur Démarrer dans le panier du menu Chargement des données pour charger des données à partir de fichiers locaux. Un message de confirmation vous demandera si vous souhaitez démarrer le chargement à partir de fichiers locaux.
  8. Cliquez sur Exécuter pour confirmer.

Une fois le travail de chargement des données terminé, les chargements de table et de vue de la page Chargement des données affichent les détails de la table source chargée dans l'outil. Il affiche le nombre de lignes et de colonnes ainsi que la date de fin du chargement.

Données de sortie générées à partir de la détection de langage OCI

Lorsque vous analysez des colonnes à l'aide du modèle de service OCI Language, Data Studio génère une nouvelle colonne d'expression et enregistre le résultat dans la table mise à jour.

Pour localiser la colonne d'expression générée, accédez à Chargement des données à partir du panneau de lancement de Database Actions. Sélectionnez la table que vous chargez dans la section Chargements de table et de vue.

Cliquez sur les trois points verticaux en regard du nom du chargement, puis sur Table et sélectionnez Visualiser les détails.

Par exemple, voici un ensemble de données de sortie provenant de la détection de langue de la colonne Vérifier. Ici, REVIEW est la colonne cible et la colonne REVIEW_LANGUAGE_DETECTION affiche la langue détectée dans la colonne d'entrée.
Description de l'image output-language.bmp
Description de l'illustration output-language.bmp

Effectuer une traduction de texte

Data Studio prend en charge la traduction de plusieurs langues prises en charge par OCI Language Service.

Pour déterminer le texte d'entrée traduit :

  1. Après avoir chargé les données dans le panier de chargement des données à partir de fichiers locaux, vous pouvez visualiser le fichier dans le panier. Cliquez sur l'icône Paramètres.



  2. Cliquez sur l'icône Définir pour ouvrir un assistant Charger les données à partir d'un fichier local.
  3. Dans l'onglet Paramètres de l'assistant, cliquez sur Ajouter une expression sous la section Mise en correspondance.



    La boîte de dialogue Ajouter une expression s'ouvre. Sélectionnez Expressions AI.



  4. Dans la boîte de dialogue Ajouter une expression, indiquez les champs suivants :
    • Type d'expression : dans la liste déroulante Type d'expression, sélectionnez Traduction de texte.
    • Colonne d'entrée : sélectionnez la colonne dans la liste déroulante à analyser. Dans ce cas, nous devons traduire le texte de la colonne SOURCE_INPUT.
    • Colonne cible : saisissez le nom de la nouvelle colonne d'expression créée. Par exemple, SOURCE_INPUT_TRANSLATION.
    • Langue cible : sélectionnez la langue du texte traduit par l'outil dans la liste déroulante. Par exemple, Anglais.

    Pour plus d'informations, voir Paramètres d'analyse des données.

  5. Cliquez sur OK. Vous verrez une nouvelle ligne ajoutée à la grille de mappage . Cette ligne détermine la colonne d'expression de sortie générée par le service OCI Language.



  6. Cliquez sur Fermer.
  7. Cliquez sur Démarrer dans le panier de menu Chargement des données pour charger des données à partir de fichiers locaux. Un message de confirmation vous demande si vous souhaitez démarrer le chargement à partir de fichiers locaux.
  8. Cliquez sur Exécuter pour confirmer.

Une fois le travail de chargement des données terminé, les chargements de table et de vue de la page Chargement des données affichent les détails de la table source chargée dans l'outil. Il affiche le nombre de lignes et de colonnes ainsi que la date de fin du chargement.

Données de sortie générées à partir de la traduction de texte OCI

Lorsque vous analysez des colonnes à l'aide du modèle de service OCI Language, Data Studio génère une nouvelle colonne d'expression et enregistre le résultat dans la table mise à jour.

Pour localiser la colonne d'expression générée, accédez à Chargement des données à partir du panneau de lancement de Database Actions. Sélectionnez la table que vous chargez dans la section Chargements de table et de vue.

Cliquez sur les trois points verticaux en regard du nom du chargement, puis sur Table et sélectionnez Visualiser les détails.



Utiliser OCI Document Understanding pour extraire des tables à partir d'images

Vous pouvez utiliser les fonctionnalités Oracle Cloud Infrastructure (OCI) Document Understanding telles que l'extraction de tables pour détecter les tables à partir des données que vous chargez.

Les formats de fichier pris en charge pour utiliser cette fonctionnalité sont les formats PDF, JPEG, JPG, PNG et TIFF (Tag Image File Format).

Par exemple, si un document PDF contient tous les détails de l'employé, y compris sa date d'embauche et son salaire, la compréhension des documents identifiera la table et extraira la structure de la table. Il extrait le contenu du tableau tout en conservant la relation entre les lignes et les colonnes des cellules.

Présentation de l'extraction de table

L'outil de chargement des données prend en charge l'extraction de table lors du chargement des données à partir de fichiers locaux et du chargement des données à partir du stockage cloud.

Extraction de table

Le service OCI Document Understanding permet aux clients de découvrir des informations dans des documents non structurés optimisés par des modèles de deep learning. Il vous permet d'extraire du texte, des tableaux et d'identifier les types de documents, entre autres fonctions. L'extraction de table identifie toutes les tables d'un document et extrait le contenu sous forme de tableau en conservant la relation ligne/colonne.

Remarque

Ce service est disponible pour les données source en anglais uniquement.

Pour plus d'informations, reportez-vous à Extraction de table.

Effectuer une extraction de table à partir d'une image

Effectuez l'extraction de table avec un exemple de PDF.

Vous pouvez voir un tableau dans le PDF ci-dessous.



Pour extraire un tableau du PDF situé dans l'emplacement de stockage cloud, procédez comme suit :
  1. Chargez le fichier PDF dans le panier de chargement de données à partir du stockage cloud. Vous pouvez faire glisser le fichier du navigateur vers le panier.



  2. Cliquez sur Démarrer pour charger les données. Vous recevrez une notification vous confirmant si vous souhaitez commencer à charger les données. Cliquez sur Exécuter pour continuer.



  3. Une fois le chargement terminé, vous pouvez afficher le fichier chargé sous Table et View Loads dans le tableau de bord Data Load.



  4. Extrayez la table du fichier PDF que vous avez chargé dans la base de données autonome :
    • Cliquez sur Database Actions dans le chemin de navigation.
    • Sélectionnez Développement, puis cliquez sur SQL.
    • Dans le navigateur de gauche, sélectionnez Tables dans la liste déroulante des objets. Dans la liste des tables disponibles, faites glisser la table EMP_ALL vers la feuille de calcul.



      Une boîte de dialogue s'affiche avec les types d'insertion disponibles.



      Cliquez sur Sélectionner, puis sur Appliquer.

    • Cliquez sur Exécuter (icône en forme de flèche en haut de la feuille de calcul). L'outil affiche la table extraite sous l'onglet Résultats de la requête.



Utiliser GeoJSON dans le chargement de données

Un objet GeoJSON contient des informations sur la géométrie spécifique (par exemple, Point, Ligne, Polygone, etc.) ainsi que des métadonnées facultatives (par exemple, ID, etc.).

L'extension d'un fichier GeoJSON est *.geojson. Vous pouvez charger des données GeoJSON dans Autonomous Database à l'aide du chargement de données dans Data Studio. Si la table contient des données GeoJSON, les données sont chargées dans une colonne qui projette des données GeoJSON à partir de l'ensemble de documents de type de données SQL SDO_GEOMETRY.

Chargez une table avec les données GeoJSON.

Lorsque vous chargez une table dans Data Studio avec des données GeoJSON et que vous vérifiez ses paramètres, vous constatez qu'elle crée la table Brazil_Geo, qui comporte une colonne geometry de données GeoJSON.



Après avoir chargé BRAZIL_GEO, vous verrez que l'outil charge l'objet GeoJSON dans une nouvelle colonne geometry avec le type de données SDO_GEOMETRY.
Description de l'image edittable-geo.png
Description de l'illustration edittable-geo.png

Vous pouvez également afficher les mêmes informations dans l'onglet Définition de données lorsque vous Visualiser les détails du chargement de table après son exécution.
Description de l'image datadefinition-geo.png
Description de l'illustration datadefinition-geo.png

Ajouter une expression spatiale pour les colonnes GeoJSON

Oracle Spatial est conçu pour rendre la gestion des données spatiales plus facile et plus naturelle pour les utilisateurs d'applications basées sur la localisation et d'applications de système d'information géographique (SIG).

Une fois les données spatiales stockées dans une base de données Oracle, elles peuvent être facilement manipulées, extraites et associées à toutes les autres données stockées dans la base.

Dans Oracle Spatial, le modèle de données spatiales est une structure hiérarchique composée d'éléments, de géométries et de couches. Les couches sont composées de géométries, qui à leur tour sont composées d'éléments.

La tolérance est utilisée pour associer un niveau de précision aux données spatiales. Le champ Tolérance indique la distance à laquelle deux points peuvent être séparés et être toujours considérés comme identiques (par exemple, pour gérer des erreurs d'arrondi). La valeur de tolérance doit être un nombre positif supérieur à zéro. Pour plus d'informations, reportez-vous à Tolérance dans les données spatiales.

Paramètres pour l'analyse des données spatiales

Lorsque vous appelez une expression d'ajout et que vous sélectionnez Expressions spatiales dans l'assistant Ajouter une expression, vous devez configurer le modèle à l'aide de paramètres.

Tableau 3-4 Paramètres pour l'analyse des données spatiales

Paramètre Description
Type d'expression
Sélectionnez l'un des attributs spatiaux suivants, tels que Longueur ou Aire :
  • Longueur : la sélection de cet attribut renvoie et stocke le périmètre d'un polygone bidimensionnel dans la table de mapping avec une colonne cible de type GEOMETRY_LENGTH.
  • Zone : la sélection de cet attribut renvoie et stocke la zone d'un polygone bidimensionnel dans la table de mapping avec une colonne cible de type GEOMETRY_AREA.
Colonne Entrée

Sélectionnez la colonne à analyser pour les données spatiales :

Par défaut, vous visualisez une colonne GEOMETRY dans la source mise en correspondance avec la valeur de colonne SDO_GEOMETRY. Cela signifie également que la table est spatialement activée.

Colonne cible
Il s'agit de la nouvelle colonne d'expression définie dans la table cible qui stocke le résultat de l'expression spatiale et dépend de la valeur de type d'expression que vous sélectionnez :
  • GEOMETRY_LENGTH : si vous sélectionnez Longueur comme type d'expression, vous pouvez visualiser la colonne cible de type GEOMETRY_LENGTH qui affiche la valeur de longueur de la géométrie.
  • GEOMETRY_AREA : si vous sélectionnez Zone comme type d'expression, vous pouvez visualiser la colonne cible de type GEOMETRY_AREA qui affiche la valeur de zone de la géométrie.

Effectuer une analyse spatiale

Vous pouvez charger des données spatiales à l'aide de l'outil de chargement des données à partir de fichiers locaux ou d'un stockage cloud.

Pour effectuer une analyse spatiale sur les données GeoJSON, procédez comme suit :
  1. Une fois que vous avez chargé des données dans le panier de chargement de données à partir de fichiers locaux ou du stockage cloud, vous pouvez afficher le fichier dans le panier. Cliquez sur l'icône Paramètres.

  2. Dans l'onglet Paramètres de l'assistant, sélectionnez Rectifier la géométrie pour corriger les géométries non valides. Cette icône corrige les erreurs les plus courantes telles que les points en double, les erreurs d'orientation des polygones, les erreurs de construction des polygones, etc. S'il détecte une erreur non corrigible, il échoue avec une exception ORA-13199: the given geometry cannot be rectified.

    Remarque

    Vous ne pouvez pas corriger les géométries dont l'orientation est incorrecte. Icône Rectifier la géométrie.
  3. Indiquez la valeur de tolérance. Dans l'exemple ci-dessus, nous spécifions 0,005 comme tolérance, c'est-à-dire 5 mm.
  4. Cliquez sur Ajouter une expression sous la section Correspondance et sélectionnez Expressions spatiales.

    Dans la boîte de dialogue Ajouter une expression, renseignez les champs suivants :
    • Type d'expression : dans la liste déroulante Type d'expression, sélectionnez Aire pour afficher la zone d'un polygone bidimensionnel. Vous pouvez également sélectionner Longueur pour afficher le périmètre d'un polygone bidimensionnel.
    • Colonne d'entrée : vous pouvez visualiser une colonne GEOMETRY par défaut. Cette colonne source stocke la zone de la géométrie. Si vous sélectionnez le type d'expression Longueur, cette colonne source stocke la longueur de la géométrie.
    • Colonne cible : indique le nom de la colonne d'expression spéciale que vous venez de créer. Par exemple, GEOMETRY_AREA pour le paramètre d'expression de type Aire et GEOMETRY_LENGTH pour le paramètre d'expression de type Longueur.
    Dans la section Options avancées, indiquez les valeurs de champ suivantes :
    • Tolérance : saisissez la valeur de tolérance. Exemple : 0.005.
    • Unité : sélectionnez une unité de mesure de la tolérance dans la liste déroulante. Par exemple, Square meter.
    Remarque

    Si le fichier que vous chargez ne contient pas de données spatiales, vous pouvez visualiser l'erreur suivante dans l'assistant Ajouter une expression "No input columns have the SDO_GEOMETRY data type for the currently selected expression type of Area".

    Pour plus de détails, voir Paramètres pour l'analyse des données spatiales.

  5. Cliquez OK. Une nouvelle ligne est ajoutée à la grille de mappage. Cette ligne détermine la colonne d'expression spatiale de sortie générée par le service OCI Language. Dans cet exemple, vous pouvez visualiser un élément GEOMETRY_AREA qui sera créé dans la table cible après le chargement de la table.

Pour plus d'informations sur Oracle Spatial, reportez-vous au Guide du développeur Oracle Spatial.

Une fois le travail de chargement des données terminé, les Chargements de table et de vue de la page Chargement des données affichent les détails de la table source chargée dans l'outil. Il affiche le nombre de lignes et de colonnes et la date à laquelle le chargement a été terminé.

Données de sortie générées à partir de l'analyse spatiale

Lorsque vous analysez des colonnes à l'aide d'expressions spatiales, Data Studio génère une nouvelle colonne d'expression et enregistre le résultat dans la table mise à jour.

Pour localiser la colonne d'expression générée, accédez à Chargement des données à partir du panneau de lancement de Database Actions. Sélectionnez la table que vous chargez dans la section Chargements de table et de vue.

Cliquez sur les trois points verticaux en regard du nom du chargement, puis sur Table et sélectionnez Visualiser les détails.

L'onglet Aperçu du chargement de données s'ouvre et affiche le fichier source mis à jour. Par exemple, voici un ensemble de données de sortie provenant de l'analyse spatiale du fichier COUNTRIESGEO.GeoJSON. Ici, GEOMETRY_AREA est l'analyse spatiale de la colonne d'entrée. Cette colonne affiche la zone des polygones bidimensionnels.
Description de l'image spatiale-output.bmp
Description de l'illustration space-output.bmp

Charger les tables Apache Iceberg

Data Studio prend en charge le chargement et la liaison des tables Iceberg à partir de la banque d'objets.

L'outil peut charger plusieurs versions du même fichier.

  1. Sélectionnez l'emplacement de stockage cloud pour lequel des tables d'iceberg sont définies. Dans cet exemple, nous allons sélectionner l'élément ICEBERGBUCKET stocké dans OCI.



    Vous pouvez détecter les fichiers Iceberg avec le symbole Iceberg
    Description de l'image symbol.png
    Description de l'illustration symbol.png

    en dehors de son nom.

  2. Faites glisser le dossier vers le navigateur de fichiers sur la gauche et déposez-le dans le panier sur la droite. Le dossier se compose également du fichier JSON de métadonnées qui assure le suivi des clichés de table, du schéma de partitionnement et des informations de schéma.

    Lorsque vous ajoutez le dossier au panier, un avertissement concernant le nombre de fichiers constitués d'une invite d'informations d'identification personnelle s'affiche.



    Remarque

    : Si vous chargez plusieurs fichiers au lieu d'un dossier, l'outil vous demande si vous voulez charger tous les objets des différents fichiers source dans une seule table cible. Cliquez sur OK pour continuer ou sur Echapper pour annuler.
  3. Cliquez sur Démarrer dans la barre de menus du panier de liaison de données. Vous verrez une notification indiquant si vous souhaitez démarrer le chargement à partir de la banque cloud. Sélectionnez Exécuter pour continuer.



  4. Vous verrez la progression du chargement sous Table et View Loads. Après le chargement, vous verrez les icônes Rapport et Recharger sur le chargement de table.



  5. Interrogez les tables Iceberg chargées dans l'instance Autonomous Database :
    • Cliquez sur Database Actions dans le chemin de navigation.
    • Sélectionnez Développement, puis cliquez sur SQL.
    • Dans le navigateur de gauche, sélectionnez Tables dans la liste déroulante des objets. Dans la liste des vues disponibles, glissez-déplacez la table CALL_CENTER_PARQUET vers la feuille de calcul.



    • Une boîte de dialogue s'affiche avec les types d'insertion disponibles.



      Cliquez sur Sélectionner, puis sur Appliquer.

    • Cliquez sur Exécuter (icône en forme de flèche en haut de la feuille de calcul). L'outil affiche les données de l'iceberg sous Résultats de la requête.



Charger des données à partir du système de fichiers

Vous pouvez charger des fichiers à partir des répertoires de système de fichiers vers votre instance Autonomous Database.

Vous pouvez définir des filtres sur les données d'une table afin de charger uniquement les données indiquées. Par exemple, pour limiter les fichiers aux fichiers CSV, saisissez *.CSV dans le filtre d'extension de fichier.

Configurez et exécutez un travail de chargement des données à partir de la page Charger l'objet cloud. Pour ouvrir cette page :
  1. Dans l'onglet Data Studio, sélectionnez Chargement des données. Vous allez afficher le tableau de bord Chargement des données.
  2. Cliquez sur Charger les données et sélectionnez l'option Système de fichiers.

En haut de la page, vous devez sélectionner le répertoire à partir duquel vous devez charger les fichiers. Sur le côté gauche de la page se trouve un panneau du navigateur, dans lequel vous pouvez choisir les fichiers du répertoire contenant les données. A droite de la page se trouve le panier de chargement des données, dans lequel vous préparez les fichiers et les dossiers pour le travail de chargement des données. Vous pouvez définir des options pour le travail de chargement des données avant de l'exécuter. Autonomous Database est fourni avec des parts d'UC et d'E/S prédéfinies affectées à différents groupes de destinataires. Vous pouvez définir le groupe de destinataires sur faible, moyen ou élevé lors de l'exécution d'un travail de chargement des données en fonction de votre charge globale. Pour charger des fichiers à partir d'un répertoire dans votre base de données, procédez comme suit :

  1. Pour plus d'informations, reportez-vous à la section Prepare the Data Load Job.
  2. Pour plus d'informations, reportez-vous à la section Ajout de fichiers ou de dossiers au travail de chargement des données.
  3. Entrez les détails du travail de chargement des données. Pour plus d'informations, reportez-vous à la section Enter Details for the Data Load Job.
  4. Pour plus d'informations, reportez-vous à la section Exécuter le travail de chargement des données.
  5. Pour plus d'informations, reportez-vous à la section Affichage des détails du travail de chargement des données après son exécution.
  6. Pour plus d'informations, reportez-vous à la section Affichage de la table obtenue à partir du travail de chargement des données.

Créer des répertoires dans Database Actions

Dans l'instance Autonomous Database, il existe une instance data_pump_dir préconfigurée dans laquelle vous pouvez stocker des fichiers. Vous pouvez également créer des répertoires, supprimer des répertoires et attacher des systèmes de fichiers réseau.

Par exemple, vous pouvez utiliser la commande CREATE DIRECTORY pour créer des répertoires supplémentaires. Utilisez la commande DROP DIRECTORY de base de données pour supprimer des répertoires et utilisez DBMS_CLOUD.LIST_FILES pour répertorier le contenu d'un répertoire.

Création d'un répertoire

Pour ajouter un répertoire, vous devez disposer du privilège système CREATE ANY DIRECTORY. Le privilège système CREATE ANY DIRECTORY est accordé à l'utilisateur ADMIN. L'utilisateur ADMIN peut accorder les privilèges système CREATE ANY DIRECTORY à d'autres utilisateurs.

Pour plus d'informations, reportez-vous à CREATE DIRECTORY.

Remarque

  • CREATE DIRECTORY crée l'objet de répertoire de base de données dans la base de données, ainsi que le répertoire de système de fichiers. Par exemple, le chemin du répertoire peut être comme suit :
    /u03/dbfs/7C149E35BB1000A45FD/data/stage
  • Vous pouvez créer un répertoire dans le système de fichiers racine pour afficher tous les fichiers à l'aide des commandes suivantes :

    CREATE OR REPLACE DIRECTORY ROOT_DIR AS '';

    Après avoir créé le répertoire ROOT_DIR, utilisez la commande suivante pour répertorier tous les fichiers :

    SELECT * FROM DBMS_CLOUD.list_files('ROOT_DIR');
  • Pour exécuter DBMS_CLOUD.LIST_FILES avec un utilisateur autre qu'ADMIN, vous devez lui accorder des privilèges de lecture sur le répertoire.

Montrons comment créer un répertoire et y accéder à partir de Data Studio :

  • Créez un répertoire dans Database Actions :

    Connectez-vous à l'instance Database Actions et sélectionnez la carte SQL sous Développement. Vous pouvez afficher la feuille de calcul SQL. Créez à présent un répertoire et joignez le nom du système de fichiers de votre choix au répertoire que vous créez. Dans l'exemple donné ci-dessous, FSS_DIR est le nom du répertoire.

    Description de l'image create-directory.png
    Description de l'image create-directory.png

    Exécutez la commande ci-dessus. La commande ci-dessus fournit la sortie suivante :

    Procédure PL/SQL réussie.

  • Attacher le système de fichiers
    Attachez votre système de fichiers avec le nom de votre choix au répertoire FSS_DIR via la procédure DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEM.
    
    BEGIN
      DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEM(
        file_system_name => '********',
        file_system_location => '*******.sub1********1.********.oraclevcn.com:/********',
        directory_name => 'FSS_DIR',
        description => 'attach OCI file system'
      );
    END;
    /
    
    

    Exécutez la commande ci-dessus pour afficher la sortie suivante :

    PL/SQL procedure successfully completed.

  • Pour afficher le système de fichiers joint, exécutez la commande suivante :

    SELECT file_system_name, file_system_location, directory_path FROM dba_cloud_file_systems;

    Vous verrez le nom du système de fichiers, son emplacement et son chemin d'accès.

  • Vous pouvez afficher le nouveau répertoire avec les fichiers qui lui sont joints en accédant à Load Cloud Object dans le menu Data Load de l'outil Data Studio. Cliquez sur la liste déroulante Sélectionner l'emplacement de la banque cloud.Description de l'image new-dir.png
    Description de l'illustration new-dir.png

Vous pouvez visualiser le répertoire FSS_DIR que vous venez de créer. Vous pouvez charger des données des répertoires de système de fichiers vers la base de données autonome à l'aide de l'outil de chargement de données. Reportez-vous à la section Loading Data from File System.

Chargement de données à partir de la source AI

Vous pouvez utiliser les outils Data Studio pour charger des données à partir d'une source AI.

Dans le tableau de bord Chargement des données, cliquez sur la carte Charger les données et sélectionnez Source AI.



Vous devez effectuer une condition préalable à la configuration de votre profil AI avant d'utiliser cette fonctionnalité. Pour plus d'informations sur la configuration de cette fonctionnalité, reportez-vous à Configuration du package DBMS_CLOUD_AI.

Pour définir un profil AI, vous devez disposer des éléments suivants :
  • Un compte OpenAI, un compte Cohere ou un service Azure OpenAI
  • Accès au package DBMS_CLOUD_AI.

Suivez les étapes de la section Utiliser DBMS_CLOUD_AI pour configurer des profils AI pour créer et configurer votre profil AI et utiliser cette fonctionnalité.

Chargement de données à partir d'un partage

Vous pouvez sélectionner des tables dans un partage. Vous devez vous abonner au partage de données fourni et y accéder.

Pour charger des tables à partir d'un partage, cliquez sur Charger des données dans le tableau de bord de chargement de données. Cliquez sur Partager sur la page Charger les données. Cliquez sur + S'abonner au fournisseur de partage pour vous abonner à un fournisseur de partage.

S'inscrire au fournisseur de partage de données

Pour vous abonner, vous devez utiliser les informations contenues dans le profil JSON téléchargé que vous avez reçu du fournisseur de partage.
  1. Dans S'abonner au fournisseur de partage de données, entrez le nom du fournisseur.Description de l'image subscribe_1.png
    Description de l'illustration subscribe_1.png
  2. Sélectionnez Ajouter un nouveau fichier JSON de fournisseur et cliquez sur le fichier JSON de profil de partage Delta pour glisser-déplacer le profil JSON.
  3. Cliquez sur Suivant pour passer à l'onglet Ajouter des partages.
  4. Sélectionnez le niveau d'accès réseau à autoriser à partir de la base de données vers l'hôte avec l'adresse REST de partage, puis cliquez sur Exécuter. Dans cet exemple, l'option Autoriser l'accès à l'hôte uniquement est sélectionnée.Description de network_acl_script.png
    Description de l'illustration network_acl_script.png
  5. Pour enregistrer les partages disponibles, déplacez les partages de Partages disponibles vers Partages sélectionnés et cliquez sur S'abonner.

    La capture d'écran ci-dessous montre le partage REVIEWS déplacé des partages disponibles vers les partages sélectionnés avant de cliquer sur S'abonner.

    Description de l'image subscribe_2.png
    Description de l'illustration subscribe_2.png
  6. Créez des tables externes dérivées des tables sélectionnées à partir du partage de données.
    1. Glissez-déplacez des tables à partir du partage sélectionné. Vous pouvez éventuellement cliquer sur Paramètres pour visualiser les détails de la table.

      Dans cet exemple, la seule table sélectionnée est HOTEL_REVIEWS.

      Description de sel_tbls.png
      Description de l'image sel_tbls.png
    2. Vous pouvez éventuellement modifier le nom de la table et cliquer sur Fermer.

      Dans cet exemple, le nom passe de HOTEL_REVIEWS à HOTEL_REVIEWS_SHARE.

      Description de name_change.png
      Description de l'image name_change.png
    3. Créez la table externe en cliquant sur Démarrer, sur la page Sélectionner un partage, puis sur Exécuter dans la boîte de dialogue Exécuter le travail de chargement des données. Description de start_run.png
      Description de l'image start_run.png
    4. Lorsque les tables externes sont créées, le message Terminer s'affiche.Description de xt_complete.png
      Description de l'illustration xt_complete.png
    5. Cliquez sur le nom de la table externe pour visualiser les détails de la table.Description de xt_details.png
      Description de l'illustration xt_details.png
  7. Affichez les tables créées à partir de Database Actions.
    1. Cliquez sur Database Actions dans le chemin de navigation pour revenir à la fenêtre de lancement de Database Actions.
    2. Cliquez sur la mosaïque SQL.
    3. Sélectionnez la table externe, faites-la glisser dans la feuille de calcul.

      L'instruction SQL Select de la table apparaît. Cette instruction SQL peut être exécutée pour utiliser les données partagées.

      Description de xt_sql.png
      Description de l'image xt_sql.png
  8. Glisser-déplacer des tables à partir du partage sélectionné

Créer un flux en direct à partir d'un chargement de données

L'outil de chargement des données charge les données à partir de dossiers dans les banques d'objets cloud et lui permet de planifier des chargements de données répétés en temps réel. Il s'agit de la création d'un flux en direct à partir d'un travail de chargement de données.

Une fois le chargement des données terminé, vous pouvez créer un flux en direct à partir d'un élément de panier qui a chargé un dossier de banque d'objets à l'aide des options Créer une table ou Supprimer une table et Créer une table.

Pour créer un flux en direct à partir d'un chargement de données, procédez comme suit :
  1. Cliquez sur Sélecteur pour afficher le menu de navigation. Sous Data Studio, sélectionnez Chargement des données.
  2. Sélectionnez la mosaïque Charger les données pour charger les données à partir de différentes sources, telles que les fichiers locaux, les bases de données, la banque cloud, les répertoires et les partages.
  3. Cliquez sur Banques cloud pour charger des objets à partir d'URL ou de liens de banque cloud.
  4. Sélectionnez l'emplacement de la banque cloud dans la liste déroulante. Si vous ne pouvez pas visualiser l'emplacement de banque cloud, sélectionnez Créer un emplacement de banque cloud pour créer un emplacement de banque cloud. Suivez les étapes décrites dans Création d'informations d'identification natives Oracle Cloud Infrastructure si aucun emplacement cloud n'est disponible.
  5. Une fois que vous avez sélectionné l'emplacement de la banque cloud, vous pouvez afficher la liste des dossiers et fichiers présents dans le stockage cloud. Ajoutez des fichiers de la banque cloud au panier de chargement des données, dans lequel vous pouvez modifier les détails du travail de chargement.
    Remarque

    L'outil de chargement de données ne prend pas en charge la création d'un flux en direct à partir d'un élément de panier chargé composé d'un seul fichier au format CSV, XLS, XLSX, TSV, TXT, XML, JSON et AVRO ou d'un dossier contenant un fichier au format XLSX.
  6. Pour ajouter les dossiers, faites glisser un dossier à partir du navigateur de fichiers sur la gauche et déposez-les dans le panier sur la droite. Lorsque vous ajoutez le dossier au panier, une invite vous demande si vous voulez charger tous les objets des différents fichiers source dans une seule table cible. Cliquez sur Oui pour continuer ou sur Non pour annuler. Vous pouvez ajouter plusieurs dossiers au panier, les données représentées par chaque carte seront chargées dans une table séparée, mais tous les éléments du panier seront traités dans le cadre du même travail de chargement des données.
  7. Sélectionnez Paramètres (icône en forme de crayon) dans le panier de chargement des données pour entrer les détails du travail de chargement des données.
  8. Dans l'onglet Paramètres de l'onglet Charger les données à partir de l'emplacement de la banque cloud, vous pouvez sélectionner Créer une table ou Supprimer une table et créer une table dans la liste déroulante Option.
    Remarque

    L'outil de flux dynamique ne fonctionne avec le travail de chargement des données que si vous créez une table et que vous insérez les données dans une nouvelle table ou que vous supprimez la table existante et que vous insérez les données dans une nouvelle table.
  9. Entrez les autres détails du travail de chargement des données. Pour plus d'informations sur la saisie des détails, reportez-vous à la rubrique Entrer les détails du travail de chargement des données.
  10. Une fois que vous avez ajouté des sources de données au panier de chargement des données et saisi les détails relatifs au travail de chargement des données, sélectionnez Démarrer pour exécuter le travail.
  11. Une fois le travail de chargement de données exécuté, le panier affiche une coche verte.

    qui indique que le travail de chargement des données est terminé.
  12. Cliquez sur Créer un flux de table en direct dans le panier de chargement de données pour créer un flux de table en direct à partir du travail de chargement de données. Vous verrez un message indiquant que la création du flux de table en direct a réussi et que vous souhaitez modifier le flux de table en direct. Cliquez sur Oui pour continuer et Non pour annuler. Si vous sélectionnez Oui, un assistant Modifier le flux de table en direct s'ouvre.
  13. Dans l'assistant Modifier le flux de table en direct, vous pouvez visualiser l'emplacement de la banque cloud du dossier source et le filtre d'objet appliqué aux données.

    Sélectionnez un fichier dont vous souhaitez prévisualiser les données dans la liste déroulante Aperçu de l'onglet Source de données : le champ affiche le nombre total de fichiers présents dans le dossier de banque cloud que vous avez chargé. Un aperçu des données est affiché.



  14. Cliquez sur Suivant pour accéder à l'onglet Paramètres de table.

    Vous pouvez afficher les propriétés et les détails de mapping du travail de chargement de données dans l'onglet Table Settings.
    Remarque

    Vous ne pouvez pas sélectionner ni modifier les détails de cet onglet.
  15. Cliquez sur Suivant pour passer à l'onglet Aperçu de l'assistant.

    Sélectionnez un fichier dans la liste déroulante Aperçu pour afficher le fichier. L'aperçu du tableau affiche l'aperçu du fichier que vous sélectionnez dans la liste déroulante.



  16. Cliquez sur Suivant pour afficher l'onglet Paramètres du flux en direct de l'assistant. Dans l'onglet Paramètres du flux en direct, indiquez les valeurs suivantes dans le champ :

    • Activer pour les notifications : sélectionnez cette option afin que les données nouvelles ou modifiées dans la source de données soient chargées en fonction d'une notification Oracle Cloud Infrastructure. Lorsque vous sélectionnez cette option, vous pouvez éviter les retards qui peuvent survenir lorsque l'interrogation est lancée selon une programmation (c'est-à-dire si vous avez sélectionné l'option de flux de table en direct programmé).

      Lorsque vous sélectionnez l'option Activer pour les notifications, vous devez également configurer le bucket de banque d'objets pour qu'il émette des notifications.

    • Activer pour la programmation : sélectionnez cette option pour configurer une programmation pour le flux de données. Dans les champs d'intervalle de temps, saisissez un nombre, puis sélectionnez un type de temps et les jours auxquels interroger le bucket pour rechercher les fichiers nouveaux ou modifiés. Par exemple, pour effectuer une interrogation toutes les deux heures les lundi, mercredi et vendredi, saisissez 2, sélectionnez Heures, puis sélectionnez Lundi, Mercredi et Vendredi dans les champs appropriés. Vous pouvez sélectionner Tous les jours, du lundi au vendredi, du dimanche au jeudi ou Personnalisé dans la liste déroulante Jours de la semaine. Le champ Personnalisé vous permet de sélectionner Lundi,Mardi, Mercredi, Jeudi et Vendredi.

    Sélectionnez une date de début et une date de fin. Si vous ne sélectionnez pas de date de début, la date et l'heure actuelles seront utilisées comme date de début. La date de fin est facultative. Cependant, sans date de fin, le flux continuera à effectuer des interrogations.

    Les autres champs affichés dans l'assistant, tels que le nom du flux de table en direct, le nom de la table cible et le groupe de destinataires, sont grisés et désactivés pour la sélection ou la modification.

Cliquez sur Enregistrer pour enregistrer et créer un flux de table en direct à partir d'un panier de chargement de données.