Pomocí předem sestavených modelů služby OCI Document Understanding můžete do svých aplikací integrovat klasifikaci dokumentů a extrakci klíčových hodnot, aniž byste museli mít odborné znalosti v oblasti strojového učení (ML) nebo umělé inteligence (AI). Klasifikaci dokumentů můžete použít například k identifikaci pasů, řidičských průkazů, příjmových dokladů a faktur.
Pokud máte méně než 10 000 dokumentů, můžete je zpracovat v jediném datovém toku. Pokud máte více než 10 000 dokumentů, pak vytvořte samostatný datový tok pro zpracování každého sektoru (to znamená, že pro každý sektor použijete samostatnou datovou sadu) a použijte volbu Sekvence k postupnému zpracování datových toků. Prostudujte si téma
Zpracování dat pomocí sekvence datových toků.
- Na Domovské stránce Oracle Analytics klikněte na Vytvořit, a potom na Datový tok.
- Vyberte datovou sadu odkazující na dokumenty, které chcete analyzovat, a klikněte na tlačítko Přidat.
- V editoru datového toku klikněte na tlačítko Přidat krok (+).
- V podokně Kroky datového toku dvakrát klikněte na položku Použít model AI a poté vyberte model, který chcete použít.
Můžete například vybrat volbu Předem trénovaná klasifikace dokumentů k identifikaci pasů.
- V dialogovém okně Použít model AI přejděte do části Vstupy a proveďte konfiguraci parametrů Sloupec vstupu a Typ vstupu.
- Pokud na zdrojové dokumenty odkazujete podle sektoru, pak v poli Sloupec vstupu vyberte volbu Adresa URL a v poli Typ vstupu vyberte volbu Sektory.
- Pokud na zdrojové dokumenty odkazujete jednotlivě, pak v poli Sloupec vstupu vyberte volbu Umístění souboru a v poli Typ vstupu vyberte volbu Dokumenty.
- V editoru datového toku klikněte na tlačítko Přidat krok (+) a vyberte položku Uložit data.
- Do pole Název zadejte název výstupní datové sady.
Datovou sadu můžete například nazvat „Výsledky analýzy identifikace pasů“.
- Do pole Uložit data do zadejte umístění pro výstupní datovou sadu.
- Klikněte na tlačítko Uložit, zadejte název datového toku a klikněte na tlačítko OK.
- Klikněte na volbu Spustit datový tok.