1 Content Capture에 대해 알아보기

Oracle Content Management의 콘텐츠 캡처 기능은 미션 크리티컬 비즈니스 콘텐츠를 캡처, 인덱스화, 저장 및 관리할 수 있는 하나의 시스템을 제공합니다. 문서를 대량으로 스캔 및 임포트하고 Oracle Content Management에 업로드하기 전에 자동으로 처리할 수 있습니다. 문서는 스캐너를 통해 얻거나 파일에서 임포트된 하나 이상의 이미지로 구성되거나, Microsoft Word 또는 PDF 파일과 같은 비이미지 전자 파일일 수 있습니다. 비이미지 파일을 임포트할 때 정의된 캡처 플로우에서 원래 형식으로 유지되는지, 이미지 형식으로 변환되는지, 임포트가 금지되는지 여부를 결정합니다.

직접 생성한 문서 일괄처리는 확장 가능하므로 문서를 재구성하고, 비즈니스 요구에 맞게 그룹핑을 자동화하고, 청구 또는 파일링 목적으로 바코드를 읽고, 문서를 쉽게 검색할 수 있도록 인덱스화하고, 조직의 표준 형식으로 변환할 수 있습니다. 콘텐츠 캡처 워크플로우(또는 프로시저)를 생성하여 물리적/전자적 문서의 대량 처리 및 공정을 자동화합니다.

콘텐츠 캡처의 주요 동인은 일괄처리 및 문서입니다. 문서는 스캔 또는 임포트되고 일괄처리로 유지 관리됩니다. 일괄처리는 스캔 이미지 또는 전자 문서 파일(예: PDF 또는 Microsoft Office 파일)로 구성되며, 이들을 문서로 구성하고 메타데이터 값을 지정(인덱스화)할 수 있습니다. 각 문서는 일련의 메타데이터 값을 공유합니다. Oracle Content Management는 문서를 임포트하고, PDF 및/또는 TIFF로 변환하고, 바코드를 자동 인식하고, 자동으로 문서를 구분하고, 메타데이터 값을 채우고, Oracle Content Management에 최종 출력을 전달하는 다양한 콘텐츠 캡처 프로세서를 제공합니다.

콘텐츠 캡처 프로세스에는 다음과 같은 주요 구성요소가 관여합니다.

캡처

다음과 같은 다양한 방식으로 문서를 스캔하거나 Content Capture 프로시저 내 일괄처리로 임포트할 수 있습니다.

  • 운용 문서 이미징 스캐너를 사용하여 고용량 스캔

  • 비즈니스 애플리케이션 등에서 임시 원격 스캔 또는 임포트

  • 전자메일 계정 또는 모니터 대상 폴더 등에서 자동 임포트

일반 사용자는 수동으로 하드카피 문서를 스캔하거나, 프로시저 관리자가 생성한 클라이언트 프로파일에 기반하여 Content Capture 클라이언트 소프트웨어를 사용하여 전자 문서를 일괄처리로 임포트할 수 있습니다. 또는 임포트 작업에 저장된 설정을 사용하여 임포트 프로세서가 전자메일, 네트워크 폴더 또는 목록 파일에서 직접 이미지 및 기타 전자 문서를 자동으로 임포트할 수도 있습니다.

변환

비즈니스 요구에 따라 비이미지 입력 문서와 첨부 파일을 다른 형식으로 변환해야 할 수 있습니다. 예를 들어, 임포트한 전자메일 메시지에 첨부된 PDF 경비 보고서는 바코드를 읽을 수 있도록 이미지 형식으로 변환해야 할 수 있습니다. 이 경우 TIFF 변환 프로세서가 PDF 파일을 TIFF 이미지로 변환합니다. TIFF 변환 프로세서는 문서나 첨부 파일을 자동으로 변환하고 변환 작업에 저장된 설정을 사용하여 일괄처리 내에 병합합니다. PDF 변환 프로세서는 문서를 소스 문서와 동일한 콘텐츠 유형의 PDF로 변환하고 검색 가능한 PDF로도 변환합니다.

분류

분류는 일괄처리를 논리적 문서로 구분하고 문서 프로파일을 지정하는 프로세스입니다. 클라이언트 프로파일은 각 문서에 사용 가능한 메타데이터 필드첨부 유형을 지정합니다. 분류에는 일괄처리에 상태를 지정하는 것도 포함됩니다.

분류는 다양한 방법으로 수동 또는 자동으로 발생할 수 있습니다.

문서 구분

  • Content Capture 클라이언트 사용자가 수동으로 실행합니다. 예를 들어, 사용자는 문서당 특정 페이지 수에 대해 구성된 클라이언트 프로파일을 선택할 수 있습니다. 또한 새 문서를 식별하기 위해 스캔 전 문서 사이에 구분자 시트를 삽입할 수 있습니다. 일괄처리를 시각적으로 검사하는 동안 Content Capture 클라이언트 사용자는 큰 문서를 여러 개의 작은 문서로 분할하여 새 문서를 생성할 수 있습니다.

  • Content Capture 클라이언트에서 파일 임포트 중 사용자가 수동으로 실행합니다.

  • 작업 설정에 따라 임포트 프로세서가 문서를 임포트할 때 자동으로 진행됩니다.

  • 인식 프로세서가 바코드 인식 중에 자동으로 진행됩니다. 일괄처리가 인식 프로세서로 전송되면 프로세서가 자동으로 바코드 인식 및 문서 분류를 수행합니다.

메타데이터 지정

문서에는 문서 프로파일에 준하여 일련의 메타데이터 값이 지정되는데, 이를 인덱스화라고 합니다. 이 프로파일은 특정 유형의 문서를 인덱스화할 수 있도록 메타데이터 필드를 식별합니다. 다양한 방법으로 메타데이터 값을 지정할 수 있습니다.

  • Content Capture 클라이언트의 메타데이터 창에서 사용자가 수동으로 실행합니다.

  • 작업 설정에 따라 임포트 프로세서가 문서를 처리할 때 자동으로 진행됩니다.

  • 작업 설정에 따라 인식 프로세서가 처리 중에 자동으로 진행됩니다.

  • 작업 설정에 따라 자산 조회 프로세서가 처리 중에 자동으로 진행됩니다.

다양한 방법으로 메타데이터 필드를 구성할 수 있습니다. 입력 마스크 및 표시 형식을 구성하거나 검증을 위한 정규 표현식을 제공할 수 있습니다. 메타데이터 값은 자동으로 채워지거나, 선택 목록 및 종속 선택 목록에서 선택되거나, 바코드에서 파생될 수 있습니다. 프로시저 관리자는 이 메타데이터 필드 정의를 프로시저에 구성하여 클라이언트 프로파일 또는 프로세서 작업에서 사용할 수 있습니다.

첨부 유형

첨부 파일은 기본 문서와 연관된 이미지 또는 비이미지 파일입니다. 프로시저 관리자는 문서 프로파일에 지정할 수 있는 첨부 유형,을 정의합니다. 해당 첨부 유형은 문서 프로파일에 지정된 문서로 첨부 파일을 분류하는 데 사용될 수 있습니다. Content Capture 클라이언트 사용자는 첨부 파일을 확인하고, 첨부 유형을 변경하고, 첨부 파일을 생성하고, 이미지 첨부 파일을 수정할 수 있습니다.

일괄처리 상태

프로시저 관리자는 비즈니스 요구에 맞게 일괄처리 상태를 정의합니다. 콘텐츠 캡처 프로세스 중 언제든지 사용자가 수동으로 일괄처리에 지정하거나, 프로세서 중 하나에서 자동으로 지정됩니다.

해제

Oracle Content Management는 잠금-해제 방식을 사용하여 주어진 시간에 한 사용자나 프로세서만 콘텐츠 캡처 일괄 처리에 액세스할 수 있도록 합니다. 사용자가 일괄처리를 생성하거나 열면(확장하면) 일괄처리가 자동으로 나에게 잠깁니다. 다른 사람이 사용할 수 있으려면 일괄처리를 해제하거나 잠금 해제해야 합니다. 일괄처리 작업을 마치면 해제하거나 잠금 해제합니다. 일괄 처리를 해제하면 해당 문서 및 메타데이터가 Oracle Content Management와 자동으로 동기화되고, 클라이언트 프로파일에 구성된 경우 후속 처리(커밋, 인식 또는 변환)를 위해 일괄 처리 경로를 지정합니다.

커밋

일괄 처리가 커밋되면 모든 문서 및 해당 메타데이터가 Oracle Content Management로 업로드된 후 일괄 처리에서 제거됩니다. 그러면 메타데이터 또는 콘텐츠를 통해 Oracle Content Management에서 문서를 찾아 액세스할 수 있습니다. 일부 문서는 커밋되지 않을 수 있습니다. 예를 들어, 필수 필드가 채워지지 않은 문서는 커밋에서 제외됩니다. 일괄처리의 모든 문서가 커밋되면 프로시저에서도 해당 일괄처리가 삭제됩니다.

커밋 프로세스 도중 이미지 형식으로 변환되지 않은 비이미지 파일은 원래 형식으로 유지됩니다.