Přehled klasifikace dokumentů a extrakce klíčových hodnot

Document Understanding v Oracle Cloud Infrastructure (OCI) poskytuje předtrénované modely umělé inteligence, které dokáží extrahovat text, tabulky a další klíčová data ze souborů dokumentů. Provedete klasifikaci dokumentu nebo extrakci klíčových hodnot dokumentu a poté tato extrahovaná data použijete jako součást analýzy v Oracle Analytics.

Document Understanding také umožňuje vytvářet vlastní modely pro extrakci klíčových hodnot a klasifikaci dokumentů.

V Oracle Analytics používáte toky dat, abyste na svá data aplikovali modely umělé inteligence služby Document Understanding.

Oracle Analytics podporuje několik předtrénovaných a přizpůsobených modelů umělé inteligence, které jsou k dispozici ve službě Document Understanding:
  • Předtrénované modely podporované v Oracle Analytics
    • Klasifikace dokumentů
    • Extrakce klíčových hodnot (pro příjmové doklady, faktury, řidičské průkazy a pasy)
  • Přizpůsobené modely podporované v Oracle Analytics
    • Vlastní klasifikace dokumentů
    • Extrakce hodnot přizpůsobených klíčů

Před použitím přizpůsobených modelů v Oracle Analytics je nutné je nastavit a vytvořit v OCI Console. Nejprve pomocí nástroje OCI Data Labeling vytvořte dobrou datovou sadu, kterou můžete použít k trénování modelu, a poté sestavte přizpůsobený model. Prostudujte si téma OCI Document Understanding – Přizpůsobené modely.

Příklad výstupu z modelu klasifikace dokumentů

V tomto příkladu datový tok aplikuje předtrénovaný model klasifikace dokumentů na dokumenty ve formátu JPG s cílem předpovědět, zda se jedná o příjmové doklady, a poskytuje výstup výsledků analýzy do datové sady. Datová sada obsahuje hodnotu PŘÍJMOVÝ DOKLAD pro položku „Typ dokumentu“ a úroveň předpovědi „Spolehlivost“ pro každý dokument.


Popis GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png následuje
.png''

Než začnete: