Služba Oracle Cloud Infrastructure (OCI) Document Understanding poskytuje vopred natrénované modely AI, ktoré dokážu extrahovať text, tabuľky a iné kľúčové dáta zo súborov dokumentov. Najskôr klasifikujete dokument alebo extrahujete kľúčové hodnoty dokumentu a potom použijete extrahované dáta ako súčasť analýzy v službe Oracle Analytics.
Služba Document Understanding vám tiež umožňuje vytvárať vlastné modely na extrakciu kľúčových hodnôt a klasifikáciu dokumentov.
V službe Oracle Analytics používate dátové toky na aplikáciu modelov AI služby Document Understanding na vaše dáta.
Pred použitím vlastných modelov v službe Oracle Analytics je potrebné ich nastaviť a vytvoriť v konzole OCI. Najskôr pomocou služby OCI Data Labeling vytvoríte dobrú množinu dát, ktorú môžete použiť na trénovanie modelu, a potom vytvoríte vlastný model. Pozrite si časť OCI Document Understanding - vlastné modely.
Príklad výstupu z modelu klasifikácie dokumentov
V tomto príklade dátový tok aplikuje vopred natrénovaný model klasifikácie dokumentov na dokumenty vo formáte JPG, aby bolo možné predpovedať, či ide o príjmové doklady, a výsledky analýzy uloží do množiny dát. Množina dát obsahuje hodnotu RECEIPT v stĺpci „Document Type“ (Typ dokumentu) a úroveň predikcie „Confidence“ (Spoľahlivosť) pre každý dokument.
Skôr ako začnete: