2 Noções sobre o Processo do Content Capture

Analisemos o processo básico de capturar conteúdo e de carregá-lo para o Oracle Content Management.

Mostrar de que forma os documentos são processados desde a primeira página até à última

Origens

O conteúdo pode ser capturado a partir de várias origens:

Processadores

Independentemente da origem, cada documento capturado é encaminhado através de vários processadores antes de ser carregado para o Oracle Content Management para armazenamento e/ou futuro processamento:
  • O processador de importações fornece uma importação em massa automatizada a partir de origens como uma pasta do sistema de ficheiros, um ficheiro de texto de lista delimitada ou a caixa de entrada/pasta de uma conta de servidor de correio eletrónico. A tarefa de importação monitoriza a origem e importa o conteúdo a uma frequência especificada (por exemplo, uma vez por minuto, hora ou dia).

  • O processador de conversões em TIFF converte automaticamente documentos sem imagem e anexos em formato TIFF ou JPEG. O utilizador pode escolher fundir documentos e anexos de várias formas durante a conversação. Por exemplo, o processador de conversões pode converter ficheiros de documentos como PDFs ou documentos do Microsoft Office em imagens TIFF para processamento do código de barras.

  • O processador de conversões em PDF converte documentos, imagens e anexos em PDFs.
  • Oprocessador de reconhecimentos reconhece automaticamente códigos de barras, organiza documentos e indexa-os.

  • O processador de confirmações executa perfis de confirmação para efetuar saídas de dados automáticas e carregar documentos de um batch para o Oracle Content Management e, em seguida, retirar os batches do processamento.

    Um perfil de confirmações especifica como efetuar a saída de dados dos documentos e dos respetivos metadados, e inclui as correspondências de campo de metadados, formato de saída de dados, instruções de tratamento de erros e definições do driver de confirmações.

  • O Processador de Lookup de Ativos permite aos utilizadores do cliente pesquisarem ativos suportados no repositório do Oracle Content Management.

  • O Processador de Transformação XML permite aos utilizadores do cliente transformar documentos XML num estilo pretendido com base num ficheiro XSLT.

Cada processador, caso tenha optado por utilizá-los todos, funciona em conjunto com os outros. Várias tarefas do fluxo de um batch iniciam-se pelo processador de importações e, em seguida, são transmitidas para o processador de conversões em PDF ou TIFF para converter documentos nos formatos configurados. O processador de reconhecimentos substitui subsequentemente o reconhecimento de códigos de barras, a organização de documentos de formas específicas e a indexação dos mesmos. E, por fim, o processador de confirmações fornece (carrega) a saída de dados para o Oracle Content Management.

Todos os documentos capturados são carregados e armazenados no Oracle Content Management como itens de conteúdo separados com os metadados atribuídos durante o processo de captura de conteúdo. Pode aceder e gerir estes itens de forma semelhante a muitos outros itens no Oracle Content Management.

Procedimentos

Os Procedimentos são fluxos de trabalho definidos do Content Capture, desde o início da origem até ao carregamento final para o Oracle Content Management. Cada procedimento representa um sistema completo do Content Capture, fornecendo uma localização centralizada para configurar metadados, regras de processamento, perfis de configuração e dados de batch para um determinado ambiente. Os utilizadores do Cliente do Content Capture criam e acedem a batches dentro de um procedimento ao qual lhes foi concedido acesso.

Pode criar vários procedimentos para a sua organização para que consiga gerir eficazmente a captura de conteúdo integral e as necessidades de processamento, por exemplo, por departamento ou localização. Também pode partilhar elementos comuns de configuração entre procedimentos para reutilização otimizada. O utilizador também pode copiar um procedimento para adaptar facilmente a outros ambientes.

Batches

Um batch contém um ou mais documentos, que poderão estar relacionados (por exemplo, vários documentos de um cliente) ou não relacionados (por exemplo, documentos divididos por folhas separadoras).
  • Os documentos poderão ser constituídos por imagens digitalizadas ou por ficheiros eletrónicos, como, por exemplo, um ficheiro do Microsoft Word ou um ficheiro PDF.

  • Um documento pode ou não conter anexos como imagens ou um ficheiro eletrónico.

Quando trabalhar com um batch, pode bloqueá-lo. É apresentado um ícone de cadeado quando o batch está bloqueado pelo utilizador ou por outro utilizador. A libertação de um batch retira o ícone de bloqueio e, consoante as definições do perfil de cliente, liberta o batch para outro utilizador ou processador do sistema o utilizar.

Perfis de Cliente

O utilizador pode digitalizar ou importar grupos de páginas em batches que utilizam um perfil de cliente que o gestor de procedimentos definiu para o utilizador. O perfil de cliente é um grupo de definições que determina como digitalizar, importar ou indexar os documentos num batch. O perfil de cliente concretiza o seguinte:
  • Controla as definições do digitalizador, o modo como os documentos são criados e separados no batch, se os campos de metadados estão disponíveis, se os códigos de barras são processados e como são, e o que acontece aos batches depois de os libertar.

  • Determina se o utilizador pode capturar documentos apenas, capturar e indexar documentos ou só indexar documentos.

  • Determina se os ficheiros eletrónicos sem imagem (por exemplo, documentos PDF) devem ser retidos no respetivo formato original, convertidos num formato de imagem ou impedidos de serem importados.

  • Identifica o conjunto de campos de metadados que devem ser preenchidos para um documento selecionado.

Se o perfil do seu cliente incluir a indexação, pode atribuir a documentos valores de metadados, como a ID do cliente e o nome. Num batch, os documentos de tipos diferentes têm, normalmente, conjuntos diferentes de campos de metadados disponíveis. É possível atribuir valores de metadados aos documentos nos batches só de indexação, mas não é possível anexar, inserir ou substituir páginas.

Quando termina de trabalhar nos documentos de um batch, liberta o batch, o que o desbloqueia da sua utilização exclusiva (se não existirem processos de libertação definidos). Se libertar um batch e tiver selecionado um processo de libertação disponível, a ação seguinte efetuada no batch depende desse processo de libertação. O que acontece a seguir depende das definições do perfil de cliente:
  • É possível retirar o batch da lista da secção do batch e confirmá-lo no Oracle Content Management ou colocá-lo numa fila de espera para processamento adicional, como a conversão em PDF/TIFF ou o reconhecimento do código de barras.

  • É possível que o batch se mantenha na lista, mas desbloqueado (não é apresentado nenhum ícone de bloqueio). Isto permite ao utilizador ou a outro utilizador bloquear o batch e efetuar mais alterações.