1 Saiba Mais sobre o Content Capture

As funcionalidades do Content Capture do Oracle Content Management fornecem-lhe um sistema para capturar, indexar, armazenar e gerir o seu conteúdo empresarial indispensável. Pode digitalizar e importar documentos em massa, e processá-los automaticamente antes de serem carregados para o Oracle Content Management. Os documentos poderão ser constituídos por uma ou mais imagens obtidas a partir de um digitalizador ou importadas a partir de um ficheiro, ou podem ser ficheiros eletrónicos sem imagem, como ficheiros do Microsoft Word ou PDF. Quando importa ficheiros sem imagem, a fluência de captura definida determina se são mantidos no respetivo formato original, convertidos para um formato de imagem ou impedidos de serem importados.

Os batches de documentos que criar são redimensionáveis, permitindo-lhe reorganizar documentos, automatizar o respetivo agrupamento de acordo com as suas necessidades de negócio, ler códigos de barras para fins de faturação e preenchimento, indexar documentos para os tornar pesquisáveis e convertê-los em formatos standard para a sua organização. O utilizador cria fluxos de trabalho de captura de conteúdo ou procedimentos, que automatizam o processamento e o encaminhamento de documentos físicos e eletrónicos em massa.

Os drivers principais para capturar conteúdo são batches e documentos. Os documentos são digitalizados ou importados e são mantidos em batches. Um batch consiste em imagens digitalizadas ou ficheiros de documentos eletrónicos (como, por exemplo, ficheiros PDF ou do Microsoft Office) organizados em documentos e aos quais são atribuídos valores dos metadados (indexado). Cada documento partilha um conjunto de valores de metadados. O Oracle Content Management fornece uma variedade de processadores do Content Capture que importa documentos, converte-os em PDF e/ou TIFF, efetua o reconhecimento automático de códigos de barras, separa documentos automaticamente, preenche valores de metadados e fornece a saída de dados final para o Oracle Content Management.

O processo de captura de conteúdo envolve os seguintes componentes principais:

Capturar

A digitalização ou importação de documentos em batches dentro de um procedimento de captura de conteúdo pode ser feita de várias formas:

  • Digitalização de elevado volume através de um digitalizador de processamento de imagens do documento de produção

  • Digitalização ou importação remota ad hoc, tal como a partir de uma aplicação empresarial

  • Importação automatizada, tal como a partir de uma conta de correio eletrónico ou de uma pasta monitorizada

Os utilizadores finais podem digitalizar manualmente documentos físicos ou importar documentos eletrónicos em batches utilizando o software de Cliente do Content Capture (tendo por base perfis de cliente criados por gestores de procedimento). Em alternativa, se utilizar definições armazenadas numa tarefa de importação, o processador de importações também pode importar automaticamente imagens e outros documentos eletrónicos diretamente do correio eletrónico, de pastas de redes ou de ficheiros de listas.

Conversão

Consoante as suas necessidades de negócio, poderá precisar de converter documentos de entrada sem imagem e anexos num formato diferente. Por exemplo, os relatórios de despesas em PDF anexados às mensagens de correio eletrónico importadas podem necessitar de conversão num formato de imagem que permita a leitura dos respetivos códigos de barras. Neste caso, o processador de conversões de TIFF converte ficheiros PDF em imagens TIFF. O processador de conversões de TIFF converte automaticamente documentos ou anexos e funde-os dentro de um batch utilizando definições armazenadas numa tarefa de conversão. O processador de conversão para PDF converte os documentos para PDF com um tipo de conteúdo idêntico ao do documento de origem e também para PDFs pesquisáveis.

Classificação

Classificação é o processo de separar batches nos respetivos documentos lógicos e de atribuir perfis de documento. O perfil de cliente especifica um conjunto de possíveis campos de metadados e tipos de anexo disponíveis para cada documento. A classificação também envolve a atribuição de um estado a um batch.

A classificação também pode ocorrer manual ou automaticamente de várias formas:

Separação de um Documento

  • Manualmente por utilizadores do Cliente do Content Capture. Por exemplo, os utilizadores podem selecionar um perfil de cliente configurado para um número específico de páginas por documento. Também podem inserir folhas separadoras entre documentos antes de digitalizar para identificar um novo documento. Enquanto inspecionam um batch visualmente, os utilizadores do Cliente do Content Capture podem criar novos documentos dividindo documentos maiores em vários documentos mais pequenos.

  • Manualmente por utilizadores durante a importação do ficheiro para o Cliente do Content Capture.

  • Automaticamente quando o processador de importações importa documentos com base nas definições da tarefa.

  • Automaticamente durante o reconhecimento do código de barras pelo processador de reconhecimentos. Se um batch for enviado para o processador de reconhecimentos, o processador efetua automaticamente um reconhecimento do código de barras e a classificação do documento.

Atribuição de Metadados

É atribuído aos documentos um conjunto de valores de metadados com base num perfil do documento, processo este denominado de indexação. Este perfil identifica os campos de metadados disponíveis para indexar determinado tipo de documento. Os valores de metadados podem ser atribuídos de várias formas:

  • Manualmente por utilizadores na secção de metadados do Cliente do Content Capture.

  • Automaticamente, quando o processador de importações processa documentos com base nas definições da tarefa.

  • Automaticamente, durante o processamento pelo processador de reconhecimentos com base nas definições da tarefa.

  • Automaticamente, durante o processamento pelo processador de lookups de ativos com base nas definições da tarefa.

Os campos de metadados podem ser configurados de várias formas. Pode configurar uma máscara de entrada de dados e um formato para visualização ou fornecer uma expressão regular para validação. Os valores dos metadados também podem ser preenchidos automaticamente, selecionados a partir de listas de escolhas (ou derivados de códigos de barras) e serem listas de escolhas dependentes. Os gestores dos procedimentos configuram estas definições do campo de metadados no procedimento e depois utilizam-nas em perfis de cliente ou tarefas do processador.

Tipo de Anexo

Um anexo é um ficheiro com imagem ou sem imagem associado a um documento principal. Os gestores de procedimentos definem os tipos de anexo, que podem ser atribuídos a perfis de documento. Estes tipos de anexo podem ser utilizados para classificar anexos com documentos que foram atribuídos a um perfil de documento. Os utilizadores do Cliente do Content Capture podem visualizar anexos, alterar um tipo de anexo, criar anexos e modificar anexos com imagem.

Estado do Batch

Os gestores de procedimento definem os estados do batch para se adequarem às respetivas necessidades empresariais. O utilizador atribui-os a um batch manualmente em qualquer momento durante o processo de captura de conteúdo ou automaticamente por um dos processadores.

Libertar

O Oracle Content Management utiliza um método de bloqueio e desbloqueio para garantir que apenas um utilizador ou processador tem sempre acesso a qualquer batch de captura de conteúdo. Um batch bloqueia automaticamente para o utilizador quando cria ou abre (expande) o batch. O utilizador deve libertar ou desbloquear o batch para o tornar disponível para outros. Quando terminar de trabalhar com um batch, deve libertá-lo ou desbloqueá-lo. O desbloqueio de um batch automaticamente sincroniza os respetivos documentos e metadados com o Oracle Content Management e encaminha o batch para futuro processamento (confirmação, reconhecimento ou conversão), caso seja configurado no respetivo perfil de cliente.

Confirmar

Quando um batch é confirmado, todos os respetivos documentos e metadados são carregados para o Oracle Content Management e, em seguida, retirados do batch. Permitindo assim que os documentos sejam localizados e acedidos no Oracle Content Management através dos respetivos metadados ou conteúdos. É possível que alguns dos documentos não sejam confirmados. Por exemplo, os documentos sem os respetivos campos necessários preenchidos são ignorados. Se todos os documentos num batch forem confirmados, o batch é também apagado do procedimento.

Durante o processo de confirmação, os ficheiros sem imagem que não tenham sido convertidos num formato de imagem permanecem no respetivo formato original.