Provádění klasifikace dokumentů a extrakce klíčových hodnot

Pomocí předem sestavených modelů služby OCI Document Understanding můžete do svých aplikací integrovat klasifikaci dokumentů a extrakci klíčových hodnot, aniž byste museli mít odborné znalosti v oblasti strojového učení (ML) nebo umělé inteligence (AI). Klasifikaci dokumentů můžete použít například k identifikaci pasů, řidičských průkazů, příjmových dokladů a faktur.

Pokud máte méně než 10 000 dokumentů, můžete je zpracovat v jediném datovém toku. Pokud máte více než 10 000 dokumentů, pak vytvořte samostatný datový tok pro zpracování každého sektoru (to znamená, že pro každý sektor použijete samostatnou datovou sadu) a použijte volbu Sekvence k postupnému zpracování datových toků. Prostudujte si téma Zpracování dat pomocí sekvence datových toků.
Předpoklady:
  1. Na Domovské stránce Oracle Analytics klikněte na Vytvořit, a potom na Datový tok.
  2. Vyberte datovou sadu odkazující na dokumenty, které chcete analyzovat, a klikněte na tlačítko Přidat.

  3. V editoru datového toku klikněte na tlačítko Přidat krok (+).
  4. V podokně Kroky datového toku dvakrát klikněte na položku Použít model AI a poté vyberte model, který chcete použít.
    Můžete například vybrat volbu Předem trénovaná klasifikace dokumentů k identifikaci pasů.
  5. V dialogovém okně Použít model AI přejděte do části Vstupy a proveďte konfiguraci parametrů Sloupec vstupuTyp vstupu.
    • Pokud na zdrojové dokumenty odkazujete podle sektoru, pak v poli Sloupec vstupu vyberte volbu Adresa URL a v poli Typ vstupu vyberte volbu Sektory.

    • Pokud na zdrojové dokumenty odkazujete jednotlivě, pak v poli Sloupec vstupu vyberte volbu Umístění souboru a v poli Typ vstupu vyberte volbu Dokumenty.
  6. V editoru datového toku klikněte na tlačítko Přidat krok (+) a vyberte položku Uložit data.
  7. Do pole Název zadejte název výstupní datové sady.
    Datovou sadu můžete například nazvat „Výsledky analýzy identifikace pasů“.
  8. Do pole Uložit data do zadejte umístění pro výstupní datovou sadu.
  9. Klikněte na tlačítko Uložit, zadejte název datového toku a klikněte na tlačítko OK.
  10. Klikněte na volbu Spustit datový tok.
Když datový tok dokončí analýzu, otevřete datovou sadu, kterou jste zadali v kroku 7.

Pokud chcete vyhledat vygenerovanou datovou sadu, na domovské stránce Oracle Analytics přejděte na Data a poté na Datové sady.
Popis GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png následuje
.png''

Další podrobnosti o vygenerovaných výsledcích viz Výstupní data generovaná pro modely služby OCI Document Understanding.