Priprema dokumenata za analizu OCI modelom za razumijevanje dokumenata

Možete upotrijebiti spremnike u servisu OCI Object Storage za spremanje dokumenata koje želite analizirati, a zatim stvoriti skup podataka za pristup tim dokumentima u servisu Oracle Analytics.

Ulazni dokumenti i AI modeli obično se spremaju u isti račun za Oracle Cloud (klijentsku particiju), što olakšava njihovo postavljanje u servisu Oracle Analytics.

Ako svoje ulazne dokumente i AI modele spremite u druge klijentske particije:
  • Provjerite je li vidljivost spremnika koji sadrži vaše ulazne dokumente javna. Pogledajte Promjena vidljivosti spremnika.
  • Ulazni skup podataka za tijek podataka popunite URL-ovima pojedinačnih dokumenata umjesto jednim URL-om za OCI spremnik u kojemu su dokumenti spremljeni.
U jednom pokretanju tijekovi podataka servisa Oracle Analyticsa mogu obraditi do 10 000 dokumenata za unaprijed obučene modele i 2000 dokumenata za prilagođene modele. Ako imate više od maksimalnog broja dokumenata koji se mogu obraditi u jednom pokretanju u spremištima Object Storage i Archive Storage OCI-ja stvorite više spremnika koji ne sadrže više od maksimalnog broja dokumenata u svakom spremniku. Zatim stvorite zaseban skup podataka i tijek podataka za svaki od spremnika i upotrijebite nizanje za sekvencijsku obradu tijekova podataka.

Možete upotrijebiti privatni ili javni spremnik koji je dostupan OCI korisnicima i u skladu s generičkim ograničenjima OCI-ja za dokumente. Provjerite OCI dokumentaciju.

  1. U OCI konzoli prijeđite na Object Storage & Archive Storage te stvorite novi spremnik za spremanje svojih dokumenata.

  2. U području Object Storage i Archive Storage pritisnite naziv spremnika te u regiji Objekti na stranici pritisnite Prijenos i prenesite dokumente.
    Pobrinite se da spremnik ne sadrži vanjske datoteke koje ne želite obrađivati. Oracle Analytics obradit će sve datoteke iz spremnika.
  3. Za svaki spremnik dodajte URL spremnika u CSV datoteku s vrijednostima odvojenima zarezima.
    1. U spremištu Object Storage odaberite spremnik za prikaz dokumenata u dijaloškom okviru Objekti.
    2. Kopirajte URL iz trake preglednika za URL.
    3. Stvorite CSV datoteku s poljima za ID, Bucket Name i Bucket URL.
    4. Zalijepite URL spremnika u CSV datoteku kao vrijednost Bucket URL.
      Alternativno, ako su vaši ulazni dokumenti i AI modeli spremljeni u druge klijentske particije, pojedinačno ih dodajte u CSV datoteku.
      Stvorite CSV datoteku s poljima za ID, Document Name i Document URL. Za svaki dokument u modulu Object Storage pritisnite ikonu trotočke ikona trotočke i odaberite Prikaži pojedinosti objekta te kopirajte vrijednost Naziv i vrijednost Put URL-a (URI).

      Zalijepite vrijednost naziva kao naziv dokumenta i zalijepite vrijednost puta URL-a (URI) kao URL dokumenta.

  4. U servisu Oracle Analytics, za svaki spremnik koji upotrebljavate za spremanje dokumenata pritisnite Stvori i zatim Skup podataka.
  5. Prenesite CSV datoteku koju ste stvorili u 3. koraku i spremite skup podataka.
    Za svaki spremnik ponovite 4. i 5. korak. Ako imate više od 10 000 dokumenata, stvorite više spremnika od do 10 000 dokumenata i stvorite zasebni skup podataka za svaki spremnik.