1 En savoir plus sur Content Capture

Les fonctionnalités de capture de contenu d'Oracle Content Management mettent à votre disposition un système centralisé pour la capture, l'indexation, le stockage et la gestion de vos contenus professionnels essentiels. Vous pouvez scanner et importer des documents en masse, puis les traiter de façon automatique avant de les télécharger dans Oracle Content Management. Les documents se composent d'images obtenues à partir d'un scanner ou importées à partir d'un fichier. Ils peuvent également comprendre des fichiers électroniques non-image, comme des fichiers Microsoft Word ou PDF. Lorsque vous importez des fichiers non-image, le flux de capture défini détermine s'ils sont conservés dans leur format initial, s'ils sont convertis dans un format d'image ou si leur import est bloqué.

Les batches de documents que vous créez sont évolutifs. Par conséquent, vous pouvez réorganiser leurs documents, automatiser leur regroupement en fonction de vos besoins professionnels, lire des code-barre à des fins de facturation ou de profilage, indexer des documents pour faciliter leur recherche et effectuer des opérations de conversion dans les formats standard de votre entreprise. Vous pouvez créer des workflows de capture, aussi appelés procédures, pour automatiser le traitement et l'acheminement de documents physiques et électroniques en masse.

Les principaux pilotes de capture de contenu sont les batches et les documents. Les documents sont scannés ou importés, puis conservés dans des batches. Un batch se compose d'images scannées ou de fichiers électroniques (PDF, Microsoft Office, etc.) qui sont organisés en documents et auxquels des valeurs de métadonnées sont affectées (ils sont indexés). Chaque document partage un ensemble de valeurs de métadonnées. Oracle Content Management fournit divers processeurs de capture de contenu pour importer des documents, les convertir au format PDF et/ou TIFF, reconnaître automatiquement les codes-barres, séparer automatiquement les documents, remplir les valeurs de métadonnées et envoyer la sortie finale à Oracle Content Management.

Le processus de capture de contenu implique principalement les composants suivants :

Capture

Vous disposez de plusieurs méthodes pour scanner ou importer des documents en batches à l'aide de la procédure Content Capture :

  • Scannage d'un grand volume de documents à l'aide d'un scanner de production

  • Scannage ou import à distance ad hoc, par exemple à partir d'une application métier

  • Import automatisé, par exemple à partir d'un compte de messagerie électronique ou d'un dossier surveillé

Les utilisateurs finals peuvent scanner manuellement des documents physiques ou import des documents électroniques en batches à l'aide du logiciel client Content Capture (sur la base des profils client créés par les gestionnaires de procédures). Le processeur d'import peut également utiliser les paramètres stockés dans un travail d'import pour importer automatiquement des images et d'autres documents électroniques à partir de comptes de messagerie, de dossiers réseau ou de fichiers de liste.

Conversion

En fonction des besoins de votre entreprise, vous pouvez avoir besoin de convertir les documents et les pièces jointes non-image entrants dans un autre format. Par exemple, vous pouvez choisir de convertir les notes de frais attachées aux courriels importées du format PDF à un format image afin de permettre la lecture des codes-barres. Dans ce cas, le processeur de conversion au format convertit les fichiers PDF en images TIFF. Le processeur de conversion au format TIFF convertit automatiquement les documents ou les pièces jointes, puis les fusionne au sein d'un batch en fonction des paramètres stockés dans le travail de conversion. Le processeur de conversion au format PDF convertit des documents en fichiers PDF du même type de contenu que celui du document source, ainsi qu'en fichiers PDF pouvant faire l'objet d'une recherche.

La classification

La classification désigne les processus de séparation des batches en documents logiques et d'affectation des profils de document. Le profil client définit un ensemble de champs de métadonnées et de types de pièce jointe disponibles pour chaque document. La classification implique aussi l'affection d'un statut à un batch.

Vous pouvez procéder à la classification manuellement ou automatiquement de diverses façons :

Séparation des documents

  • Manuellement, par les utilisateurs du client Content Capture. Par exemple, les utilisateurs peuvent sélectionner un profil client configuré pour un nombre de pages précis par document. Ils peuvent également insérer des feuilles de séparation entre les documents avant de les scanner afin d'identifier le début d'un nouveau document. Lorsqu'ils examinent visuellement un batch, les utilisateurs du client Content Capture peuvent créer plusieurs documents en divisant un document plus volumineux.

  • Manuellement, par les utilisateurs, lors de l'import des fichiers dans le client Content Capture.

  • Automatiquement, sur la base des paramètres de travail du processeur d'import lorsque celui-ci importe des documents.

  • Automatiquement, lorsque le processeur de reconnaissance analyse les codes-barres. Si un batch est envoyé au processeur de reconnaissance, celui-ci procède automatiquement à la reconnaissance des codes-barres et à la classification des documents.

Affectation de métadonnées

Un ensemble de valeurs de métadonnées est affecté à chaque document en fonction de son profil de document. Ce processus est appelé indexation. Le profil identifie les champs de métadonnées disponibles pour l'indexation d'un certain type de document. Les valeurs de métadonnées peuvent être affectées de diverses façons :

  • Manuellement, par l'utilisateur, dans le panneau des métadonnées du client Content Capture.

  • Automatiquement, sur la base des paramètres de travail du processeur d'import lorsque celui-ci traite des documents.

  • Automatiquement, sur la base des paramètres de travail du processeur de reconnaissance lorsque celui-ci traite des documents.

  • Automatiquement, sur la base des paramètres de travail du processeur de recherche de ressource lorsque celui-ci traite des documents.

Vous pouvez configurer les champs de métadonnées de diverses manières. Vous pouvez configurer un masque de saisie avec un format d'affichage ou indiquer une expression régulière de validation. Vous pouvez remplir automatiquement les valeurs de métadonnées, les dériver à partir de codes-barres ou les sélectionner dans des listes d'options et des listes d'options dépendantes. Les gestionnaires de procédures configurent ces définitions de champ de métadonnées dans la procédure pour les utiliser dans les profils client ou les travaux de processeur.

Type de pièce jointe

Une pièce jointe est un fichier (image ou non) associé à un document principal. Les gestionnaires de procédures définissent des types de pièce jointe, pouvant être affectés à des profils de document. Ces types de pièce jointe peuvent être utilisés pour classer les pièces jointes avec des documents affectés à un profil de document. Les utilisateurs du client Content Capture peuvent visualiser les pièces jointes, modifier un type de pièce jointe, créer des pièces jointes et modifier les pièces jointes image.

Statut du batch

Les gestionnaires de procédures définissent les statuts de batch en fonction des besoins de l'entreprise. Les utilisateurs les affectent manuellement à un batch à tout moment au cours du processus de capture de contenu. Ces statuts peuvent également être affectés automatiquement par un des processeurs.

Libération

Oracle Content Management utilise une méthode de verrouillage et de libération pour s'assurer qu'un seul utilisateur ou processeur à la fois peut accéder à un batch Content Capture. Un batch est automatiquement verrouillé pour vous lorsque vous le créez ou l'ouvrez (le développez). Vous devez le libérer ou le déverrouiller pour permettre à d'autres utilisateurs d'y accéder. Lorsque vous avez fini de traiter un batch, libérez-le ou déverrouillez-le. Lorsqu'un batch est libéré, ses documents et ses métadonnées sont automatiquement synchronisés avec Oracle Content Management et il est soumis à des opérations de traitement supplémentaires, validation (commit), reconnaissance ou conversion, selon la configuration de son profil client.

Validation (commit)

Lorsqu'un batch est validé (commit), tous ses documents et leurs métadonnées sont téléchargés vers Oracle Content Management, puis enlevés du batch. Les documents sont ainsi localisables et accessibles dans Oracle Content Management via leurs métadonnées ou leur contenu. Certains documents peuvent ne pas être validés (commit). Par exemple, les documents dont les champs obligatoires ne sont pas remplis sont ignorés. Si tous les documents d'un batch sont validés (commit), le batch est également supprimé de la procédure.

Pendant le processus de validation (commit), les fichiers non-image qui n'ont pas été convertis au format d'image conservent leur format d'origine.