Vykonávanie klasifikácie dokumentov a extrakcie hodnôt kľúčov

Vopred natrénované modely služby OCI Document Understanding vám umožňujú do aplikácií zabudovať klasifikáciu dokumentov a extrakciu hodnôt kľúčov aj bez hlbších znalostí strojového učenia (ML) alebo umelej inteligencie (AI). Klasifikáciu dokumentov môžete použiť napríklad na identifikáciu pasov, vodičských preukazov, príjmových dokladov a faktúr.

Poznámka: Služba OCI Document Understanding momentálne podporuje len angličtinu. Pozrite si časť Limity služby Document Understanding.
Ak máte menej ako 10 000 dokumentov pre vopred natrénovaný model alebo 2 000 dokumentov pre vlastný model, môžete ich spracovať v jednom dátovom toku. Ak tieto limity prekračujete, vytvorte samostatný dátový tok na spracovanie každého sektora (t. j. oddelenú množinu dát pre každý sektor) a použite sekvenciu na sekvenčné spracovanie dátových tokov. Pozrite si časť Spracovanie dát pomocou sekvencie dátových tokov.
Predpoklady:
  1. Na domovskej stránke služby Oracle Analytics kliknite na položku Vytvoriť a potom kliknite na položku Dátový tok.
  2. Vyberte množinu dát prepojenú s dokumentmi, ktoré chcete analyzovať, a potom kliknite na položku Pridať.

  3. V editore dátového toku kliknite na tlačidlo Pridať krok (+).
  4. V podokne Kroky dátového toku dvakrát kliknite na položku Použiť model AI a potom vyberte model, ktorý chcete použiť.
    Môžete napríklad vybrať vopred natrénovanú klasifikáciu dokumentov na identifikáciu pasov.
  5. V dialógovom okne Použiť model AI prejdite do sekcie Vstupy a nakonfigurujte parametre Vstupný stĺpec a Typ vstupu.
    • Ak odkazujete na zdrojové dokumenty podľa sektora, v zozname Vstupný stĺpec vyberte položku URL a v zozname Typ vstupu vyberte položku Sektory.

    • Ak odkazujete na zdrojové dokumenty jednotlivo, v zozname Vstupný stĺpec vyberte položku Umiestnenie súboru a v zozname Typ vstupu vyberte položku Dokumenty.
  6. V editore dátového toku kliknite na tlačidlo Pridať krok (+) a vyberte položku Uložiť dáta.
  7. Do poľa Názov zadajte názov výstupnej množiny dát.
    Množinu dát môžete napríklad nazvať „Výsledky analýzy identifikácie pasov“.
  8. Do poľa Uložiť dáta do zadajte umiestnenie výstupnej množiny dát.
  9. Kliknite na tlačidlo Uložiť, zadajte názov dátového toku a potom kliknite na tlačidlo OK.
  10. Kliknite na položku Spustiť dátový tok.
Keď dátový tok dokončí analýzu, otvorte množinu dát, ktorú ste zadali v kroku 7.

Ak chcete vyhľadať generovanú množinu dát, z domovskej stránky služby Oracle Analytics prejdite na položku Dáta a potom prejdite na položku Množiny dát.
Popis GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png je uvedený nižšie
.png

Ďalšie detaily o generovaných výsledkoch nájdete v časti Výstupné dáta generované pre modely služby OCI Document Understanding.