Dokumenty, ktoré chcete analyzovať, uložte v sektoroch objektového ukladacieho priestoru OCI a potom vytvorte množinu dát na prístup k týmto dokumentom v službe Oracle Analytics.
Vstupné dokumenty a modely AI obvykle uložíte v rovnakom konte Oracle Cloud (prenájme), čo uľahčí nastavenie v službe Oracle Analytics.
Ak sú vaše vstupné dokumenty a modely AI uložené v
rôznych prenájmoch:
- Viditeľnosť sektora ukladacieho priestoru, ktorý obsahuje vaše vstupné dokumenty, musí byť verejné. Pozrite si časť Zmena viditeľnosti sektora.
- Vstupnú množinu dát pre dátový tok vyplňte adresami URL jednotlivých dokumentov namiesto jednej adresy URL pre sektor OCI, v ktorom sú uložené dokumenty.
Počas jedného behu môžu dátové toky služby Oracle Analytics spracovať až 10 000 dokumentov pre vopred natrénované modely a 2 000 dokumentov pre vlastné modely. Ak máte viac ako maximálny počet dokumentov, ktoré je možné spracovať v jednom behu, v objektovom aj v archivačnom ukladacom priestore OCI vytvorte viacero sektorov, z ktorých každý bude obsahovať nie viac ako maximálny počet dokumentov. Potom vytvorte samostatnú množinu dát a dátový tok pre každý sektor a použite sekvenciu na sekvenčné spracovanie dátových tokov.
Použiť môžete súkromný alebo verejný sektor, ku ktorému má používateľ OCI prístup a ktorý spĺňa všeobecné limity služby OCI pre dokumenty. Pozrite si dokumentáciu k službe OCI.
- V konzole OCI prejdite do sekcie Objektový ukladací priestor a archivačný ukladací priestor a vytvorte sektor na uloženie dokumentov.
- V oblasti Objektový ukladací priestor a archivačný ukladací priestor kliknite na názov sektora a potom v oblasti Objekty na danej stránke kliknite na tlačidlo Nahrať a nahrajte dokumenty.
Uistite sa, že sektor neobsahuje žiadne zbytočné súbory, ktoré nechcete spracovať. Oracle Analytics spracuje každý súbor v sektore.
- Do súboru CSV pridajte adresu URL každého sektora.
- V objektovom ukladacom priestore vyberte sektor na zobrazenie dokumentov v dialógovom okne Objekty.
- Skopírujte adresu URL z panela s adresou URL prehľadávača.
- Vytvorte súbor CSV s poľami
ID
, Bucket Name
a Bucket URL
.
- Prilepte adresu URL sektora do súboru CSV ako hodnotu
Bucket URL
.
Ak sú vaše vstupné dokumenty a modely AI uložené v rôznych prenájmoch, do súboru CSV ich pridajte jednotlivo.
Vytvorte súbor CSV s poľami
ID
,
Document Name
a
Document URL
. Pre každý dokument v objektovom ukladacom priestore kliknite na ikonu s troma bodkami

, vyberte položku
Zobraziť detaily objektu a skopírujte hodnoty v poliach
Názov a
Cesta URL (URI).
Hodnotu z poľa Názov prilepte ako názov dokumentu a hodnotu z poľa Cesta URL (URI) prilepte ako adresu URL dokumentu.
- V službe Oracle Analytics pre každý sektor, ktorý používate na ukladanie dokumentov, kliknite na položku Vytvoriť a potom na položku Množina dát.
- Nahrajte súbor CSV, ktorý ste vytvorili v kroku 3, a množinu dát uložte.
Pre každý sektor zopakujte kroky 4 a 5. Ak máte viac ako 10 000 dokumentov, vytvorte viacero sektorov obsahujúcich maximálne 10 000 dokumentov a potom pre každý sektor vytvorte samostatnú množinu dát.