Prehľad klasifikácie dokumentov a extrakcie hodnôt kľúčov

Služba Oracle Cloud Infrastructure (OCI) Document Understanding poskytuje vopred natrénované modely AI, ktoré dokážu extrahovať text, tabuľky a iné kľúčové dáta zo súborov dokumentov. Najskôr klasifikujete dokument alebo extrahujete kľúčové hodnoty dokumentu a potom použijete extrahované dáta ako súčasť analýzy v službe Oracle Analytics.

Služba Document Understanding vám tiež umožňuje vytvárať vlastné modely na extrakciu kľúčových hodnôt a klasifikáciu dokumentov.

V službe Oracle Analytics používate dátové toky na aplikáciu modelov AI služby Document Understanding na vaše dáta.

Služba Oracle Analytics podporuje niekoľko vopred natrénovaných a vlastných modelov AI, ktoré sú k dispozícii v službe Document Understanding:
  • Vopred natrénované modely podporované v službe Oracle Analytics
    • Klasifikácia dokumentov.
    • Extrakcia kľúčových hodnôt (z príjmových dokladov, faktúr, vodičských preukazov a pasov)
  • Vlastné modely podporované v službe Oracle Analytics
    • Vlastná klasifikácia dokumentov
    • Vlastná extrakcia kľúčových hodnôt

Pred použitím vlastných modelov v službe Oracle Analytics je potrebné ich nastaviť a vytvoriť v konzole OCI. Najskôr pomocou služby OCI Data Labeling vytvoríte dobrú množinu dát, ktorú môžete použiť na trénovanie modelu, a potom vytvoríte vlastný model. Pozrite si časť OCI Document Understanding - vlastné modely.

Príklad výstupu z modelu klasifikácie dokumentov

V tomto príklade dátový tok aplikuje vopred natrénovaný model klasifikácie dokumentov na dokumenty vo formáte JPG, aby bolo možné predpovedať, či ide o príjmové doklady, a výsledky analýzy uloží do množiny dát. Množina dát obsahuje hodnotu RECEIPT v stĺpci „Document Type“ (Typ dokumentu) a úroveň predikcie „Confidence“ (Spoľahlivosť) pre každý dokument.


Popis GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png je uvedený nižšie
.png

Skôr ako začnete: