2 Présentation du processus Content Capture

Ci-dessous est présenté le processus de base de capture et de téléchargement de contenu vers Oracle Content Management.

Illustre le processus de traitement des documents de A à Z

Sources

Vous pouvez capturer du contenu à partir de diverses sources :

Processeurs

Quelle que soit la source utilisée, les documents capturés traversent plusieurs processeurs avant d'être téléchargés dans Oracle Content Management à des fins de stockage et/ou de traitement ultérieur :
  • Le processeur d'import permet d'importer des documents en masse à partir de diverses sources, comme un dossier de système de fichiers, un fichier texte de liste délimitée ou encore la boîte de réception ou un autre dossier d'un compte de serveur de messagerie. Le processeur d'import surveille la source et importe son contenu à un intervalle défini (par exemple, toutes les minutes, toutes les heures ou quotidiennement).

  • Le processeur de conversion au format TIFF convertit automatiquement les documents non-image et les pièces jointes au format TIFF ou JPEG. Vous pouvez choisir de fusionner les documents et les pièces jointes de différentes manières au cours de la conversion. Par exemple, le processeur de conversion peut convertir des fichiers tels que des documents PDF ou Microsoft Office en images à des fins de reconnaissance de code-barre.

  • Le processeur de conversion au format PDF convertit des documents, des images et des pièces jointes en fichiers PDF.
  • Le processeur de reconnaissance reconnaît automatiquement les codes-barres, puis organise et indexe les documents.

  • Le processeur de validation (commit) exécute des profils de validation (commit) pour générer et télécharger automatiquement les documents d'un batch dans Oracle Content Management, puis enlève ce batch de la procédure.

    Un profil de validation (commit) définit la génération des documents et de leurs métadonnées. Il contient des paramètres relatifs à la mise en correspondance des champs de métadonnées, au format de sortie, aux instructions de gestion des erreurs et au pilote de validation (commit).

  • Le processeur de recherche de ressource permet aux utilisateurs du client de rechercher des ressources prises en charge dans le référentiel Oracle Content Management.

  • Le processeur de transformation XML permet aux utilisateurs du client de convertir des documents XML dans un style souhaité à l'aide d'un fichier XSLT.

Les processeurs oeuvrent de concert (si vous avez choisi de tous les utiliser). Plusieurs tâches d'un flux de batch commencent dans le processeur d'import, puis transmettent les documents au processeur de conversion au format PDF ou TIFF afin de les convertir aux formats configurés. Le processeur de reconnaissance prend ensuite la relève pour identifier les codes-barres, organiser les documents de la façon indiquée et les indexer. Enfin, le processeur de validation (commit) envoie (télécharge) le résultat dans Oracle Content Management.

Tous les documents capturés sont téléchargés et stockés dans Oracle Content Management en tant qu'éléments de contenu distincts avec les métadonnées qui leur ont été affectées pendant le processus de capture de contenu. Vous pouvez accéder à ces éléments et les gérer comme n'importe quel autre élément dans Oracle Content Management.

Les procédures

Les procédures sont des workflows définis qui gèrent toutes les étapes de capture de contenu, du sourcing au téléchargement final dans Oracle Content Management. Chaque procédure constitue un système de capture de contenu complet, qui fournit un emplacement centralisé pour configurer les métadonnées, les règles de traitement, les profils de configuration et les données de batch d'un environnement spécifique. Les utilisateurs du client Content Capture peuvent créer des batches et y accéder au sein d'une procédure à laquelle ils ont accès.

Vous pouvez créer plusieurs procédures pour votre organisation, ce qui permet de gérer efficacement toutes vos exigences de capture de contenu et de traitement, par exemple par service ou par site. Vous pouvez également partager des éléments de configuration communs entre les procédures pour une réutilisation optimale. Vous pouvez également copier une procédure pour l'adapter facilement à d'autres environnements.

Batches

Un batch contient des documents qui peuvent avoir un lien entre eux (par exemple, divers documents d'un même client) ou non (par exemple, des documents séparés à l'aide de feuilles de séparation).
  • Les documents peuvent consister en des images scannées ou en un fichier électronique, tel qu'un document Microsoft Word ou un fichier PDF.

  • Un document peut contenir des pièces jointes, comme des images ou un fichier électronique.

Lorsque vous traitez un batch, vous pouvez le verrouiller. Une icône en forme de verrou apparaît si un autre utilisateur ou vous-même avez verrouillé le batch. Lorsque vous libérez un batch, l'icône disparaît et, selon les paramètres du profil client, le batch est libéré afin qu'un autre utilisateur ou un processeur système puisse le traiter.

Profils client

Vous pouvez scanner ou importer des groupes de pages dans des batches à l'aide d'un profil client configuré pour vous par le gestionnaire de procédures. Un profil client est un groupe de paramètres qui déterminent la façon de scanner, d'importer ou d'indexer les documents dans un batch. Un profil client gère les opérations suivantes :
  • Il contrôle divers éléments, comme les paramètres du scanner, la méthode de création et de séparation des documents dans le batch, la disponibilité des champs de métadonnées, le traitement des codes-barres, ainsi que les opérations à effectuer sur un batch une fois celui-ci libéré.

  • Il indique si vous pouvez capturer des documents uniquement, capturer et indexer des documents, ou indexer des documents uniquement.

  • Il détermine si les fichiers électroniques non-image (par exemple, les documents PDF) doivent conserver leur format original, être convertis en format image ou être exclus de l'import.

  • Il identifie l'ensemble des champs de métadonnées à remplir pour un document sélectionné.

Si votre profil client comprend l'indexation, vous pouvez affecter des valeurs de métadonnées aux documents, comme un nom et un ID de client. Des documents de différents types dans un batch présentent généralement différents ensembles de champs de métadonnées disponibles. Vous pouvez affecter des valeurs de métadonnées aux documents des batches avec indexation uniquement, mais vous ne pouvez pas ajouter, insérer ou remplacer des pages.

Lorsque vous avez fini de traiter les documents d'un batch, vous devez libérer ce dernier afin qu'il ne soit plus verrouillé pour votre seul usage (si aucun processus de libération n'est défini). Lorsque vous libérez un batch en sélectionnant un processus de libération disponible, l'opération suivante réalisée sur le batch dépend du processus de libération en question. Ce qui se passe ensuite dépend des paramètres de profil client :
  • Le batch peut être enlevé de la liste des batches dans le panneau correspondant, puis validé (commit) dans Oracle Content Management. Il peut également être mis en file d'attente, puis soumis à d'autres étapes de traitement, comme la conversion au format PDF/TIFF ou la reconnaissance de code-barres.

  • Le batch peut rester dans la liste tout en étant déverrouillé (aucune icône de verrou n'est affichée). Ainsi, vous ou un autre utilisateur pouvez le verrouiller pour le consulter et y apporter des modifications supplémentaires.