Preparar Documentos para Analisar com um Modelo do OCI Document Understanding

Utilize buckets no OCI Object Storage para armazenar os documentos que pretende analisar e, em seguida, crie um conjunto de dados para aceder a estes documentos no Oracle Analytics.

Normalmente, os documentos de entrada de dados e os modelos de IA são armazenados na mesma conta (tenancy) do Oracle Cloud, o que facilita a configuração no Oracle Analytics.

Se os seus documentos de entrada de dados e modelos de IA estiverem armazenados em tenancies diferentes:
  • Certifique-se de que a visibilidade do bucket de armazenamento que contém os seus documentos de entrada de dados é pública. Consulte Change the visibility of a bucket.
  • Preencha o conjunto de dados de entrada de dados para o fluxo de dados com URLs de documentos individuais, em vez de um URL único para o bucket do OCI onde os documentos estão armazenados.
Os fluxos de dados no Oracle Analytics podem processar até 10 000 documentos numa só execução. Se tiver mais de 10 000 documentos para processar, no Armazenamento de Objetos e Armazenamento de Arquivos do OCI, crie vários buckets com não mais de 10 000 documentos em cada um. Em seguida, crie um conjunto de dados e um fluxo de dados separados para cada bucket e utilize uma sequência para processar sequencialmente os fluxos de dados.

Pode utilizar um bucket privado ou público que esteja acessível ao utilizador do OCI e em conformidade com os limites genéricos do OCI relativos a documentos. Consulte a documentação do OCI.

  1. Na Consola do OCI, navegue para Armazenamento de Objetos e Armazenamento de Arquivos e crie um bucket para armazenar os seus documentos.

  2. Na área Armazenamento de Objetos e Armazenamento de Arquivos, clique no nome de um bucket e, em seguida, na região Objetos da página, clique em Carregar e carregue os seus documentos.
    Certifique-se de que o bucket não contém ficheiros estranhos que não pretenda processar. O Oracle Analytics processa cada ficheiro no bucket.
  3. Para cada bucket, acrescente o URL do bucket a um ficheiro de valores separados por vírgulas (CSV).
    1. No Armazenamento de Objetos, selecione o bucket para apresentar os documentos na caixa de diálogo Objetos.
    2. Copie o URL a partir da barra do URL do browser.
    3. Crie um ficheiro CSV com campos para ID, Bucket Name e Bucket URL.
    4. Cole o URL do bucket no ficheiro CSV como o valor de Bucket URL.
      Em alternativa, se os seus documentos de entrada de dados e modelos de IA estiverem armazenados em tenancies diferentes, acrescente-os individualmente ao ficheiro CSV.
      Crie um ficheiro CSV com campos para ID, Document Name e Document URL. Para cada documento no Armazenamento de Objetos, clique no ícone de reticências ícone de elipse, selecione Visualizar Detalhes do Objeto e copie o valor de Nome e o valor de Percurso do URL (URI).

      Cole o valor do Nome como Nome do Documento e cole o valor do Percurso do URL (URI) como URL do Documento.

  4. No Oracle Analytics, para cada bucket que estiver a utilizar para armazenar os seus documentos, clique em Criar e, em seguida, em Conjunto de Dados.
  5. Carregue o ficheiro CSV que criou no Passo 3 e grave o conjunto de dados.
    Repita os passos 4 e 5 para cada bucket. Se tiver mais de 10 000 documentos, crie vários buckets com até 10 000 documentos e crie um conjunto de dados separado para cada bucket.