Les seaux du service de stockage d'objets OCI vous permettent de stocker les documents que vous souhaitez analyser, puis de créer un jeu de données pour accéder à ces documents dans Oracle Analytics.
Généralement, les documents d'entrée et les modèles d'intelligence artificielle sont stockés dans le même compte (location) Oracle Cloud, ce qui facilite la configuration dans Oracle Analytics.
Si les documents d'entrée et les modèles d'intelligence artificielle sont stockés dans des locations
différentes :
- Assurez-vous que la visibilité du seau de stockage contenant les documents d'entrée est publique. Voir Modifier la visibilité d'un seau.
- Alimentez le jeu de données d'entrée pour le flux de données avec des URL de document individuelles au lieu d'une URL unique pour le seau OCI dans lequel les documents sont stockés.
Lors d'une seule exécution, les flux de données d'Oracle Analytics peuvent traiter jusqu'à 10 000 documents pour les modèles préentraînés et 2 000 documents pour les modèles personnalisés. Si vous dépassez le nombre maximal de documents pouvant être traités en une seule exécution, créez plusieurs seaux dans le stockage d'objets et le stockage d'archives pour OCI, en veillant à ce que chaque seau ne contienne pas plus que le nombre maximal de documents autorisé. Ensuite, créez un jeu de données et un flux de données distincts pour chaque seau et utilisez une séquence pour traiter les flux de données séquentiellement.
Vous pouvez utiliser un seau privé ou public, accessible par l'utilisateur OCI et conforme aux limites génériques d'OCI sur les documents. Consultez la documentation OCI.
- Dans la console OCI, naviguez jusqu'à Stockage d'objets et stockage d'archives, puis créez un seau pour stocker les documents.
- Dans la zone Stockage d'objets et stockage d'archives, cliquez sur un nom de seau, puis sous la région Objets de la page, cliquez sur Charger et chargez vos documents.
Assurez-vous que le seau ne contient pas de fichiers superflus que vous ne voulez pas traiter. Oracle Analytics traite chaque fichier du seau.
- Ajoutez l'URL de chaque seau dans un fichier CSV.
- Dans Stockage d'objets, sélectionnez le seau pour afficher les documents dans la boîte de dialogue Objets.
- Copiez l'URL à partir de la barre d'URL du navigateur.
- Créez un fichier CSV avec des champs pour
ID
, Bucket Name
et Bucket URL
.
- Collez l'URL du seau dans le fichier CSV en tant que valeur
Bucket URL
.
Sinon, si vos documents d'entrée et vos modèles d'intelligence artificielles sont stockés dans des locations différentes, ajoutez-les individuellement au fichier CSV.
Créez un fichier CSV avec des champs pour
ID
,
Document Name
et
Document URL
. Pour chaque document de la zone Stockage d'objets, cliquez sur l'icône de points de suspension

, sélectionnez
Voir les détails de l'objet, et copiez la valeur de
Nom et la valeur de
Chemin de l'URL (URI).
Collez la valeur du champ Nom en tant que valeur Document Name, et collez la valeur du champ Chemin de l'URL (URI) en tant que valeur Document URL.
- Dans Oracle Analytics, pour chaque seau que vous utilisez pour stocker vos documents, cliquez sur Créer, puis sur Jeu de données.
- Chargez le fichier CSV que vous avez créé à l'étape 3 et enregistrez le jeu de données.
Répétez les étapes 4 et 5 pour chaque seau. S'il y a plus de 10 000 documents, créez plusieurs seaux contenant chacun un maximum de 10 000 documents et créez un jeu de données distinct pour chaque seau.