Utilize buckets no OCI Object Storage para armazenar os documentos que pretende analisar e, em seguida, crie um conjunto de dados para aceder a estes documentos no Oracle Analytics.
Normalmente, os documentos de entrada de dados e os modelos de IA são armazenados na mesma conta (tenancy) do Oracle Cloud, o que facilita a configuração no Oracle Analytics.
Se os seus documentos de entrada de dados e modelos de IA estiverem armazenados em tenancies
diferentes:
- Certifique-se de que a visibilidade do bucket de armazenamento que contém os seus documentos de entrada de dados é pública. Consulte Change the visibility of a bucket.
- Preencha o conjunto de dados de entrada de dados para o fluxo de dados com URLs de documentos individuais, em vez de um URL único para o bucket do OCI onde os documentos estão armazenados.
Numa única execução, os fluxos de dados do Oracle Analytics podem processar até 10 000 documentos para modelos pré-treinados e 2000 documentos para modelos customizados. Se tiver mais do que o número máximo de documentos que é possível processar numa execução, no Armazenamento de Objetos e Armazenamento de Arquivos do OCI, crie vários buckets com não mais do que o número máximo de documentos em cada um. Em seguida, crie um conjunto de dados e um fluxo de dados separados para cada bucket e utilize uma sequência para processar sequencialmente os fluxos de dados.
Pode utilizar um bucket privado ou público que esteja acessível ao utilizador do OCI e em conformidade com os limites genéricos do OCI relativos a documentos. Consulte a documentação do OCI.
- Na Consola do OCI, navegue para Armazenamento de Objetos e Armazenamento de Arquivos e crie um bucket para armazenar os seus documentos.
- Na área Armazenamento de Objetos e Armazenamento de Arquivos, clique no nome de um bucket e, em seguida, na região Objetos da página, clique em Carregar e carregue os seus documentos.
Certifique-se de que o bucket não contém ficheiros estranhos que não pretenda processar. O Oracle Analytics processa cada ficheiro no bucket.
- Para cada bucket, acrescente o URL do bucket a um ficheiro de valores separados por vírgulas (CSV).
- No Armazenamento de Objetos, selecione o bucket para apresentar os documentos na caixa de diálogo Objetos.
- Copie o URL a partir da barra do URL do browser.
- Crie um ficheiro CSV com campos para
ID
, Bucket Name
e Bucket URL
.
- Cole o URL do bucket no ficheiro CSV como o valor de
Bucket URL
.
Em alternativa, se os seus documentos de entrada de dados e modelos de IA estiverem armazenados em tenancies diferentes, acrescente-os individualmente ao ficheiro CSV.
Crie um ficheiro CSV com campos para
ID
,
Document Name
e
Document URL
. Para cada documento no Armazenamento de Objetos, clique no ícone de reticências

, selecione
Visualizar Detalhes do Objeto e copie o valor de
Nome e o valor de
Percurso do URL (URI).
Cole o valor do Nome como Nome do Documento e cole o valor do Percurso do URL (URI) como URL do Documento.
- No Oracle Analytics, para cada bucket que estiver a utilizar para armazenar os seus documentos, clique em Criar e, em seguida, em Conjunto de Dados.
- Carregue o ficheiro CSV que criou no Passo 3 e grave o conjunto de dados.
Repita os passos 4 e 5 para cada bucket. Se tiver mais de 10 000 documentos, crie vários buckets com até 10 000 documentos e crie um conjunto de dados separado para cada bucket.