1 Más información sobre Content Capture

Las funciones de captura de contenido de Oracle Content Management le proporcionan un sistema para capturar, indexar, almacenar y gestionar el contenido de negocio esencial. Puede escanear e importar documentos en bloque y procesarlos automáticamente antes de cargarlos en Oracle Content Management. Los documentos están formados por una o más imágenes obtenidas de un escáner o importadas de un archivo, o bien, pueden ser archivos electrónicos sin imágenes, como los archivos PDF o de Microsoft Word. Cuando se importan archivos sin imágenes, el flujo de captura definido determina si se mantienen con su formato original, se convierten a un formato de imagen o se evita su importación.

Los lotes de documentos que crea son escalables, lo que le permite reorganizar los documentos, automatizar su agrupación para adaptarla a sus necesidades de negocio, leer códigos de barras con fines de facturación o archivado, indexar documentos para que se puedan buscar fácilmente y convertirlos a formatos estándar para su organización. Puede crear flujos de trabajo de captura de contenido, o procedimientos, que automatizan el procesamiento y el direccionamiento de los documentos físicos y electrónicos en bloque.

Los impulsores primarios para capturar contenido son los lotes y los documentos. Los documentos se escanean o importan y se mantienen en lotes. Un lote está formado por imágenes escaneadas o archivos de documento electrónico (como los archivos PDF o de Microsoft Office) que se organizan en documentos y tienen asignados valores de metadatos (indexados). Cada documento comparte un conjunto de valores de metadatos. Oracle Content Management proporciona una serie de procesadores de captura de contenido que importan documentos, los convierten a PDF y/o TIFF, realizan el reconocimiento automático de códigos de barras, separan documentos automáticamente, rellenan valores de metadatos y entregan el resultado final a Oracle Content Management.

El proceso de captura de contenido incluye los siguientes componentes principales:

Captura

El escaneado o la importación de documentos en lotes en un procedimiento de captura de contenido puede realizarse de varias maneras:

  • Escaneado de gran volumen con un escáner de edición de imágenes de documentos de producción.

  • Importación o escaneado remoto ad hoc, por ejemplo, desde una aplicación de negocio

  • Importación automatizada, por ejemplo, desde una cuenta de correo electrónico o una carpeta supervisada

Los usuarios finales pueden escanear documentos impresos o importar documentos electrónicos en lotes manualmente mediante el software de Content Capture Client (según los perfiles de cliente creados por los gestores de procedimientos). Como alternativa, utilizando la configuración almacenada en un trabajo de importación, el procesador de importación también puede importar imágenes y otros documentos electrónicos de forma automática directamente del correo electrónico, carpetas de red o archivos de lista.

Conversión

En función de sus necesidades de negocio, puede que necesite convertir documentos y anexos de entrada sin imágenes a un formato diferente. Por ejemplo, puede que necesite convertir informes de gastos PDF asociados a mensajes de correo electrónico importados a un formato de imagen para que puedan leerse sus códigos de barras. En este caso, el procesador de conversión a TIFF convierte los archivos PDF a imágenes TIFF. El procesador de conversión a TIFF convierte documentos o anexos automáticamente y los fusiona en un lote utilizando la configuración almacenada en un trabajo de conversión. El procesador de conversión a PDF convierte documentos a archivos PDF del mismo tipo de contenido que el documento de origen y también a archivos PDF que permiten búsquedas.

Clasificación

La Clasificación es el proceso que consiste en separar lotes en sus documentos lógicos y asignar perfiles de documento. El perfil de cliente especifica un juego de posibles campos de metadatos y tipos de anexo disponibles para cada documento. La clasificación también implica asignar un estado a un lote.

La clasificación también puede realizar manual o automáticamente de varias maneras:

Separación de documentos

  • Manualmente por los usuarios de Content Capture Client. Por ejemplo, los usuarios pueden seleccionar un perfil de cliente configurado para un número específico de páginas por documento. También pueden insertar hojas de separación entre documentos antes del escaneado para identificar un nuevo documento. Mientras inspeccionan visualmente un lote, los usuarios de Content Capture Client pueden crear nuevos documentos mediante la división de documentos más grandes en varios documentos más pequeños.

  • Manualmente por los usuarios durante la importación de archivos en Content Capture Client.

  • Automáticamente, cuando el procesador de importación importa documentos según la configuración del trabajo.

  • Automáticamente, durante el reconocimiento de códigos de barras por parte del procesador de reconocimiento. Si se envía un lote al procesador de reconocimiento, el procesador realiza automáticamente un reconocimiento de códigos de barras y la clasificación de los documentos.

Asignación de metadatos

A los documentos se les asigna un juego de valores de metadatos según un perfil de documento, lo que se denomina indexación. Este perfil identifica los campos de metadatos disponibles para indexar un tipo de documento concreto. Los valores de metadatos se pueden asignar de varias formas:

  • De forma manual, por los usuarios en el panel de metadatos de Content Capture Client.

  • De forma automática, cuando el procesador de importación procesa los documentos según la configuración del trabajo.

  • De forma automática, durante el procesamiento realizado por el procesador de reconocimiento según la configuración del trabajo.

  • De forma automática, durante el procesamiento realizado por el procesador de búsqueda de activos según la configuración del trabajo.

Los campos de metadatos se pueden configurar de diferentes formas. Puede configurar una máscara de entrada y un formato de visualización o proporcionar una expresión regular para su validación. Los valores de metadatos se pueden rellenar automáticamente, y se pueden seleccionar de listas de opciones (o derivar de códigos de barras) y listas de opciones dependientes. Los gestores de procedimientos configuran estas definiciones de campos de metadatos en el procedimiento y posteriormente las utilizan en perfiles de cliente o trabajos de procesador.

Tipo de anexo

Un anexo es un archivo de imagen o sin imágenes asociado a un documento primario. Los gestores de procedimientos definen tipos de anexo, que pueden asignarse a perfiles de documento. Estos tipos de anexo se pueden utilizar para clasificar anexos con documentos que se han asignado a un perfil de documento. Los usuarios de Content Capture Client pueden ver anexos, cambiar un tipo de anexo, crear anexos y modificar anexos de imagen.

Estado de lote

Los gestores de procedimientos definen los estados de Lote para ajustarlos a sus necesidades de negocio. El usuario los asigna a un lote manualmente en cualquier momento durante el proceso de captura de contenido, o bien los asigna uno de los procesadores automáticamente.

Versión

Oracle Content Management utiliza un método de bloque y liberación para garantizar que solo un usuario o un procesador tiene acceso a cualquier lote de captura de contenido en un momento dado. Un lote se bloque automáticamente para usted cuando crea o abre (amplía) el lote. Debe liberar o desbloquear el lote para hacer que esté disponible para otros usuarios. Cuando termine de trabajar con un lote, debe liberarlo o desbloquearlo. La liberación automática de un lote sincroniza sus documentos y metadatos con Oracle Content Management y envía el lote para su procesamiento posterior (confirmación, reconocimiento o conversión), si esto se ha configurado en su perfil de cliente.

Confirmación

Cuando se confirma un lote, todos sus documentos y sus metadatos se cargan en Oracle Content Management y, a continuación, se eliminan del lote. Esto permite que se puedan localizar los documentos y acceder a ellos en Oracle Content Management a través de sus metadatos o contenido. Puede que no se confirmen algunos de los documentos. Por ejemplo, se omiten los documentos que no tienen los campos necesarios rellenados. Si se confirman todos los documentos de un lote, el lote se suprime también del procedimiento.

Durante el proceso de confirmación, los archivos sin imágenes que no se han convertido a un formato de imagen permanecen en su formato original.