執行文件分類和索引鍵值擷取

使用預先建立的 OCI Document Understanding 模型不需有機器學習 (ML) 或人工智慧 (AI) 專業知識,即可在您的應用程式中內建文件分類和索引鍵值擷取。例如,您可以使用文件分類來識別護照、駕照、收據及發票。

如果您的文件少於 10,000 個,可透過單一資料流程處理。如果您的文件超過 10,000 個,請建立個別的資料流程來處理每個儲存桶 (亦即對每個儲存桶使用個別的資料集),並使用「序列」依序處理資料流程。請參閱使用資料流程序列處理資料
先決條件:
  1. 在 Oracle Analytics 首頁中,依序按一下建立資料流程
  2. 選取連結至您要分析之文件的資料集,然後按一下新增

  3. 資料流程編輯器中,按一下新增步驟 (+)
  4. 資料流程步驟窗格中,按兩下套用 AI 模型,然後選取要使用的模型。
    例如,您可以選取「預先訓練文件分類」來識別護照。
  5. 套用 AI 模型中,前往輸入區段,然後設定輸入資料欄輸入類型參數。
    • 如果您是依儲存桶參照來源文件,請從輸入資料欄中選取 URL,然後從輸入類型中選取儲存桶

    • 如果您是個別參照來源文件,請從輸入資料欄中選取檔案位置,然後從輸入類型中選取文件
  6. 在資料流程編輯器中,按一下新增步驟 (+),然後選取儲存資料
  7. 名稱中,輸入輸出資料集的名稱。
    例如,您可以呼叫「護照識別分析結果」。
  8. 儲存資料至欄位中,指定輸出資料集的位置。
  9. 按一下儲存,輸入資料流程的名稱,然後按一下確定
  10. 按一下執行資料流程
資料流程完成分析後,開啟您在步驟 7 中指定的資料集。

若要尋找產生的資料集,請從 Oracle Analytics 首頁,依序瀏覽至資料資料集
以下為 GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png 的說明
.png

如需瞭解所產生之結果的更多詳細資訊,請參閱為 OCI Document Understanding 模型產生的輸出資料