1 瞭解 Content Capture

Oracle Content Management 內容擷取功能提供一個可讓您擷取、編製索引、儲存及管理關鍵任務業務內容的系統。您可以大量掃描與匯入文件,並在上傳至 Oracle Content Management 之前自動處理這些文件。文件包含從掃描器取得或從檔案匯入的一或多個影像,或是包含非影像電子檔 (例如 Microsoft Word 或 PDF 檔案)。當您匯入非影像檔時,定義的擷取流程可決定是否保留檔案的原始格式、將檔案轉換成影像格式,或禁止匯入此類檔案。

您可以擴充建立的文件批次來重新組織文件、自動將文件分組以符合您的業務需求、基於計費或歸檔考量讀取條碼、編製文件索引讓文件更容易搜尋,以及將文件轉換成組織適用的標準格式。您可以建立內容擷取工作流程 (或程序),來自動大量處理並遞送實際和電子文件。

擷取內容的兩個關鍵概念是批次和文件。系統會掃描匯入文件,並在批次中進行維護。批次包含掃描的影像或電子文件檔案 (例如 PDF 或 Microsoft Office 檔案),系統會將這些檔案分成多份文件並指定描述資料值 (編製索引)。每份文件都共用一組描述資料值。Oracle Content Management 提供各種內容擷取 處理器,可供匯入文件、將文件轉換成 PDF 和 (或) TIFF、自動辨識條碼、自動分隔文件、填入描述資料值,以及將最後輸出傳遞至 Oracle Content Management

內容擷取處理作業涉及下列主要元件:

擷取

利用內容擷取程序,將文件掃描或匯入到批次中的方法有許多種:

  • 使用生產環境文件影像化掃描器的大量掃描作業

  • 特別的遠端掃描或匯入作業,例如利用商業應用程式來完成

  • 自動化的匯入作業,例如從電子郵件帳戶或受監督的資料夾匯入

一般使用者可以 (根據由程序管理者建立的從屬端設定檔) 利用「Content Capture 從屬端」軟體,手動將實體文件掃描到批次中,或是將電子文件匯入批次中。或者,匯入處理器也可以使用存放在匯入工作中的設定值,直接從電子郵件、網路資料夾或清單檔案自動匯入影像或其他電子文件。

轉換

視您的業務需求而定,您可能需要將非影像輸入文件和附件轉換成不同的格式。例如,您可能需要將附加在已匯入電子郵件訊息上的 PDF 費用報表轉換成影像格式,以便讀取其中的條碼。在這個案例中,TIFF 轉換處理器會把 PDF 檔案轉換成 TIFF 影像。TIFF 轉換處理器會自動轉換文件或附件,並利用存放在轉換工作中的設定值,將這些文件或附件合併在批次中。PDF 轉換處理器會將文件轉換成與來源文件相同之內容類型的 PDF,也會轉換成可搜尋的 PDF。

分類

分類是將批次分隔成邏輯文件並指定文件設定檔的過程。從屬端設定檔可指定每份文件可用的一組描述資料欄位附件類型。分類也涉及指定批次的狀態

有各種方式可以手動或自動分類:

文件分隔

  • 由 Content Capture 從屬端使用者手動執行。例如,使用者可以選取為每份文件特定頁數設定的從屬端設定檔。使用者也可以在掃描之前在文件之間插入文件分隔頁,以識別新文件。Content Capture 從屬端使用者可以在目視檢查批次時,將大型文件分割成多份較小的文件來建立新文件。

  • 在 Content Capture 從屬端中匯入檔案時,由使用者手動執行。

  • 在匯入處理器根據工作設定值匯入文件時自動執行。

  • 在辨識處理器辨識條碼時自動執行。若將批次傳送至辨識處理器,處理器就會自動執行條碼辨識並將文件分類。

描述資料指定

根據文件設定檔為文件指定一組文件描述資料值,這稱為編製索引。此設定檔可識別用於編製特定類型文件索引的描述資料欄位。有數種方式可以指定描述資料值:

  • 由使用者在 Content Capture 從屬端的描述資料窗格中手動指定。

  • 在匯入處理器根據工作設定值匯入文件時自動指定。

  • 在辨識處理器根據工作設定值進行處理時自動指定。

  • 在資產查尋處理器根據工作設定值進行處理時自動指定。

有各種方式可以設定描述資料欄位。您可以設定輸入項遮罩和顯示格式,或提供正規表示式進行驗證。系統可以自動填入從選項清單 (或衍生自條碼) 和相依選項清單中選取的描述資料值。程序管理者會在程序中設定這些描述資料欄位定義,然後在從屬端設定檔或處理器工作中使用。

附件類型

附件是與主要文件關聯的影像檔或非影像檔。程序管理者可定義指定至文件設定檔的附件類型。這些附件類型可用來對已指定給文件設定檔之文件的附件進行分類。Content Capture 從屬端使用者可以檢視附件、變更附件類型、建立附件以及修改影像附件。

批次狀態

程序管理者會定義批次狀態來滿足業務需求。使用者可在內容擷取過程中的任何時間手動指定批次的批次狀態,或是由其中一個處理器自動指定給批次。

釋出

Oracle Content Management 使用鎖定和釋出方法,確保在任何指定時間只有一個使用者或處理器可存取任何內容擷取批次。當您建立或開啟 (展開) 批次時,批次就會自動被您鎖定。您必須釋出或解除鎖定批次,其他使用者才能夠使用。您可以在完成處理批次之後,將它釋出或解除鎖定。如果是在從屬端設定檔中設定,釋出批次會自動將其文件和描述資料與 Oracle Content Management 同步,並遞送批次以進一步處理 (確認、辨識或轉換)。

確認

批次確認之後,它的所有文件與其描述資料都會上傳至 Oracle Content Management,然後從批次中移除。如此可透過文件的描述資料或內容,在 Oracle Content Management 中找到並存取該文件。部分文件可能沒有確認。例如,系統會略過沒有填入必要欄位的文件。如果批次中的所有文件都已確認,則該批次也會從程序中刪除。

確認處理作業期間,沒有轉換成影像格式的非影像檔會保留自己的原始格式。