使用預先建立的 OCI Document Understanding 模型不需有機器學習 (ML) 或人工智慧 (AI) 專業知識,即可在您的應用程式中內建文件分類和索引鍵值擷取。例如,您可以使用文件分類來識別護照、駕照、收據及發票。
如果您的文件少於 10,000 個,可透過單一資料流程處理。如果您的文件超過 10,000 個,請建立個別的資料流程來處理每個儲存桶 (亦即對每個儲存桶使用個別的資料集),並使用「序列」依序處理資料流程。請參閱
使用資料流程序列處理資料。
- 在 Oracle Analytics 首頁中,依序按一下建立和資料流程。
- 選取連結至您要分析之文件的資料集,然後按一下新增。
- 在資料流程編輯器中,按一下新增步驟 (+)。
- 從資料流程步驟窗格中,按兩下套用 AI 模型,然後選取要使用的模型。
例如,您可以選取「預先訓練文件分類」來識別護照。
- 在套用 AI 模型中,前往輸入區段,然後設定輸入資料欄和輸入類型參數。
- 如果您是依儲存桶參照來源文件,請從輸入資料欄中選取 URL,然後從輸入類型中選取儲存桶。
- 如果您是個別參照來源文件,請從輸入資料欄中選取檔案位置,然後從輸入類型中選取文件。
- 在資料流程編輯器中,按一下新增步驟 (+),然後選取儲存資料。
- 在名稱中,輸入輸出資料集的名稱。
例如,您可以呼叫「護照識別分析結果」。
- 在儲存資料至欄位中,指定輸出資料集的位置。
- 按一下儲存,輸入資料流程的名稱,然後按一下確定。
- 按一下執行資料流程。