2 瞭解 Content Capture 的處理程序

讓我們來看看擷取內容並將內容上傳至 Oracle Content Management 的基本處理作業。

顯示從第一個階段到最後一個階段的文件處理方式

來源

您可以從各種來源擷取內容:

處理器

無論來源為何,每份擷取的文件在上傳至 Oracle Content Management 進行儲存和 (或) 進一步處理之前,都會先透過數個處理器遞送:
  • 匯入處理器提供從來源 (例如檔案系統資料夾、以符號分隔的清單文字檔,或電子郵件伺服器帳戶的收件匣/資料夾) 自動大量匯入的功能。匯入工作會監督來源並以指定頻率匯入內容 (例如一分鐘、一小時或一天一次)。

  • TIFF 轉換處理器會自動將非影像文件和附件轉換成 TIFF 或 JPEG 格式。您可以在轉換時選擇不同方式來合併文件和附件。例如,轉換處理器可將文件檔案 (例如 PDF 或 Microsoft Office 文件) 轉換成 TIFF 影像以進行條碼處理。

  • PDF 轉換處理器可將文件、影像和附件轉換成 PDF。
  • 辨識處理器可自動辨識條碼、組織文件和編製文件索引。

  • 確認處理器可執行確認設定檔,以批次方式自動輸出文件並上傳至 Oracle Content Management,然後移除程序中的批次。

    確認設定檔可指定如何輸出文件及其描述資料,其中包括描述資料欄位對應、輸出格式、錯誤處理指示,以及確認驅動程式設定值。

  • 資產查尋處理器可讓從屬端使用者搜尋 Oracle Content Management 儲存區域中支援的資產。

  • XML 轉換處理器可讓從屬端使用者根據 XSLT 檔案,將 XML 文件轉換為想要的樣式。

如果您已設定使用所有處理器,則每個處理器都可以互相搭配使用。批次流程中的許多工作都是由匯入處理器來開始進行,然後傳送至 PDF 或 TIFF 轉換處理器以將文件轉換成設定的格式。辨識處理器隨後會接管辨識條碼、以指定方式組織文件並編製文件索引。最後,則由確認處理器將輸出傳遞 (上傳) 至 Oracle Content Management。

在內容擷取處理作業過程中,所有擷取的文件都會上傳並儲存在 Oracle Content Management 中,作為已指定描述資料的個別內容項目。您可以存取並管理這些項目,就如同 Oracle Content Management 中的任何其他項目一樣。

程序

程序是從起始來源一直到最後上傳至 Oracle Content Management 為止,一整套經過定義的內容擷取工作流程。每個程序都代表一個完整的內容擷取系統,為特定環境提供一個集中位置來設定描述資料、處理規則、組態設定檔及批次資料。Content Capture 從屬端使用者可以在被授予存取權的程序內建立並存取批次。

您可以為組織建立多個程序,透過有效率的方式 (例如,依部門或位置) 管理所有內容擷取和處理需求。您也可以在不同程序間共用一般組態元素,以達到最佳的重複使用效果。您還可以複製程序,如此更能夠在其他環境中運用自如。

批次

批次包含一或多個文件,這些文件可能是彼此相關 (例如單一客戶的多個文件),或是彼此沒有關係的 (例如由分隔頁區隔的不同文件)。
  • 文件可能包含掃描的影像或電子檔 (例如 Microsoft Word 或 PDF 檔)。

  • 文件可能或可能沒有包含附件 (例如影像或電子檔)。

當您處理批次時,可以把批次鎖定。如果某個批次遭到您或其他使用者的鎖定,就會有鎖定圖示。釋出批次將會移除鎖定圖示,同時系統會根據從屬端設定檔的設定值,將批次釋出給另一個使用者或系統處理器。

從屬端設定檔

您要使用程序管理者為您定義的從屬端設定檔,來掃描匯入批次中的頁面群組。從屬端設定檔是一組設定值,決定如何對批次中的文件進行掃描、匯入或編製索引。從屬端設定檔能夠執行下列作業:
  • 它可控制下列作業:掃描器設定值、如何建立與分隔批次中的文件、描述資料欄位是否可用、是否處理條碼及如何處理,以及批次在釋出後會發生什麼情況。

  • 它可決定您是否只能擷取文件、擷取文件並編製文件索引,或只能編製文件索引。

  • 它可決定是否保留非影像電子檔 (例如 PDF 文件) 的原始格式、將檔案轉換成影像格式,或禁止匯入此類檔案。

  • 它可識別要針對所選文件完成的一組描述資料欄位。

如果您的從屬端設定檔包含編製索引,您就可以指定文件的描述資料值,例如客戶 ID 或名稱。批次中不同類型的文件一般會有不同的可用描述資料欄位集。您可以將描述資料值指定給僅編製索引批次中的文件,但無法附加、插入或取代頁面。

完成處理批次中的文件後,您可以釋出批次,如此可解除鎖定您所專用的批次 (若未定義任何釋出處理作業)。如果您釋出批次並選取了可用的釋出處理作業,對該批次執行的下一個動作就會取決於該釋出處理作業。接下來會發生什麼狀況則視從屬端設定檔設定值而定:
  • 批次可能會從批次窗格清單中移除並在 Oracle Content Management 確認,或可能放置在佇列中以進一步處理 (例如執行 PDF/TIFF 轉換或條碼辨識)。

  • 批次可能保留在清單中,但已解除鎖定 (未顯示鎖定圖示)。這可讓您或其他使用者鎖定批次,以便進一步進行變更。