準備要以 OCI Document Understanding 模型分析的文件

您可以使用 OCI Object Storage 的儲存桶來儲存要分析的文件,然後建立資料集以在 Oracle Analytics 中存取這些文件。

您通常會將輸入文件與 AI 模型儲存在相同 Oracle Cloud 帳戶 (租用戶) 中,以便在 Oracle Analytics 中設定。

如果您的輸入文件與 AI 模型儲存在不同租用戶中:
  • 確定包含輸入文件之儲存的儲存桶可見性為公用。請參閱變更儲存桶的可見性
  • 在資料流程的輸入資料集填入個別文件 URL,而不是填入儲存文件的單一 OCI 儲存桶 URL。
Oracle Analytics 的資料流程一次最多可處理 10,000 個文件。如果您的文件超過 10,000 個,請在 OCI 的「物件儲存與存檔儲存」中建立多個儲存桶,每個儲存桶內含的文件不可超過 10,000 個。然後,為每個儲存桶建立個別資料集和資料流程,並使用序列來依序處理資料流程。

您可以使用 OCI 使用者可存取並符合 OCI 一般文件限制的專用或公用儲存桶。請參閱 OCI 文件。

  1. 在 OCI 主控台中,瀏覽至物件儲存與存檔儲存,然後建立儲存桶來儲存文件。

  2. 物件儲存與存檔儲存區域中,按一下某個儲存桶名稱,然後在頁面的物件區域下,按一下上傳並上傳文件。
    請確定儲存桶未包含您不想處理的無關檔案。Oracle Analytics 會處理儲存桶中的每個檔案。
  3. 針對每個儲存桶,將儲存桶 URL 新增至逗號區隔值 (CSV) 檔案中。
    1. 在「物件儲存」中,選取儲存桶以在「物件」對話方塊中顯示文件。
    2. 複製瀏覽器 URL 列中的 URL。
    3. 建立一個包含 IDBucket NameBucket URL 欄位的 CSV 檔案。
    4. 將儲存桶 URL 貼到 CSV 檔案作為 Bucket URL 值。
      或著,如果您的輸入文件與 AI 模型儲存在不同租用戶中,則請將它們個別新增至 CSV 檔案中。
      建立一個包含 IDDocument NameDocument URL 欄位的 CSV 檔案。針對「物件儲存」中的每個文件,按一下省略符號圖示 省略符號圖示 並選取檢視物件詳細資訊,然後複製名稱值與 URL 路徑 (URI) 值。

      貼上「名稱」值作為「文件名稱」,並貼上「URL 路徑 (URI)」值作為「文件 URL」。

  4. 在 Oracle Analytics 中,針對您用來儲存文件的每個儲存桶,按一下建立,然後按一下資料集
  5. 上傳您在步驟 3 建立的 CSV 檔案,然後儲存資料集。
    針對每個儲存桶重複執行步驟 4 和 5。如果您的文件超過 10,000 個,請建立多個最多內含 10,000 個文件的儲存桶,然後為每個儲存桶建立個別資料集。