Forberede dokumenter, der skal analyseres med en OCI Document Understanding-model

Du bruger beholdere i OCI Object Storage til at lagre de dokumenter, som du vil analysere, og opretter derefter et datasæt for at få adgang til disse dokumenter i Oracle Analytics.

Du lagrer normalt inputdokumenter og AI-modeller i samme Oracle Cloud-konto (leje), hvilket gør dem lettere at konfigurere i Oracle Analytics.

Hvis dine inputdokumenter og AI-modeller er lagret i forskellige lejer:
  • Kontroller, at synligheden for den lagerbeholder, der indeholder dine inputdokumenter, er offentlig. Se Ændre en beholders synlighed.
  • Udfyld inputdatasættet for dataflowet med individuelle dokument-URL'er i stedet for en enkelt URL for OCI-beholderen, hvor dokumenterne er lagret.
I en enkelt kørsel kan Oracle Analytics-dataflows behandle op til 10.000 dokumenter til forudtrænede modeller og 2.000 dokumenter til tilpassede modeller. Hvis du har flere end det maksimale antal dokumenter, som kan behandles i én kørsel, skal du i OCI's Objektlager & Arkivlager oprette flere beholdere, som hver især højst indeholder det maksimale antal dokumenter. Opret derefter et separat datasæt og dataflow for hver beholder, og brug en sekvens til at behandle disse dataflows sekventielt.

Du kan bruge en privat eller offentlig beholder, som er tilgængelig for OCI-brugeren og overholder OCI's generiske grænser for dokumenter. Se OCI-dokumentation.

  1. Naviger til Object Storage & Archive Storage i OCI-konsollen, og opret en ny beholder til lagring af dine dokumenter.

  2. I området Object Storage & Archive Storage klikker du på et beholdernavn. Under området Objekter på siden klikker du nu på Upload og uploader dine dokumenter.
    Sørg for, at beholderen ikke indeholder nogen irrelevante filer, som du ikke vil behandle. Oracle Analytics behandler alle filer i beholderen.
  3. For hver beholder føjer du beholder-URL'en til en fil med kommaseparerede værdier (en CSV-fil).
    1. Vælg beholderen i Object Storage for at vise dokumenterne i dialogboksen Objekter.
    2. Kopier URL'en fra browserens URL-linje.
    3. Opret en CSV-fil med felter til ID, Bucket Name og Bucket URL.
    4. Indsæt beholder-URL'en i CSV-filen som værdien Bucket URL.
      Alternativt, hvis dine inputdokumenter og AI-modeller er lagret i forskellige lejer, skal du føje dem til CSV-filen enkeltvis.
      Opret en CSV-fil med felter til ID, Document Name og Document URL. For hvert dokument i Object Storage klikker du på ellipseikonet ellipseikon og vælger View-objekt-detaljer og kopierer værdierne for henholdsvis Navn og URL-sti (URI).

      Indsæt værdien for Navn som Dokumentnavn, og indsæt værdien for URL-sti (URI) som Dokument-URL.

  4. I Oracle Analytics klikker du for hver beholder, som du bruger til at lagre dine dokumenter, på Opret og derefter Datasæt.
  5. Upload den CSV-fil, som du oprettede i trin 3, og gem datasættet.
    Gentag trin 4 og 5 for hver beholder. Hvis du har mere end 10.000 dokumenter, opretter du flere beholdere med op til 10.000 dokumenter og opretter et separat datasæt for hver enkelt beholder.