1 Informationen zu Content Capture

Mit den Inhaltserfassungsfeatures von Oracle Content Management erhalten Sie ein System, mit dem Sie Ihren erfolgsentscheidenden Geschäftsinhalt erfassen, indexieren, speichern und verwalten können. Sie können Dokumente im Bulkverfahren scannen und importieren sowie automatisch verarbeiten, bevor sie in Oracle Content Management hochgeladen werden. Dokumente bestehen aus Bildern, die über einen Scanner gescannt oder aus einer Datei importiert werden. Sie können auch elektronische Nicht-Bilddateien wie Microsoft Word- oder PDF-Dateien sein. Wenn Sie Nicht-Bilddateien importieren, bestimmt der definierte Erfassungsfluss, ob diese im Originalformat beibehalten, in ein Bildformat konvertiert oder überhaupt nicht importiert werden.

Die von Ihnen erstellten Dokumentbatches sind skalierbar. Sie können die darin enthaltenen Dokumente neu organisieren, die Gruppierung entsprechend Ihren Geschäftsanforderungen automatisieren, Barcodes zu Abrechnungs- oder Ablagezwecken lesen, Dokumente für das einfache Durchsuchen indexieren und sie in Standardformate für Ihre Organisation konvertieren. Sie erstellen Workflows oder Prozeduren für die Inhaltserfassung. Damit werden die Verarbeitung und Weiterleitung physischer und elektronischer Dokumente im Bulkverfahren automatisiert.

Die Hauptelemente beim Erfassen von Inhalt sind Batches und Dokumente. Dokumente werden gescannt oder importiert und in Batches verwaltet. Ein Batch besteht aus gescannten Bildern oder elektronischen Dokumentdateien (wie PDF- oder Microsoft Office-Dateien), die als Dokumente organisiert und mit Metadatenwerten versehen (indexiert) werden können. Jedes Dokument verwendet bestimmte Metadatenwerte. Oracle Content Management stellt mehrere Prozessoren für die Inhaltserfassung bereit. Damit können Sie Dokumente importieren, sie in PDF und/oder TIFF konvertieren, Barcodes automatisch erkennen, Dokumente automatisch trennen, Metadatenwerte ausfüllen und die endgültige Ausgabe an Oracle Content Management übermitteln.

Der Inhaltserfassungsprozess umfasst die folgenden Hauptkomponenten:

Erfassung

Sie können Dokumente in einer Inhaltserfassungsprozedur auf verschiedene Arten in Batches scannen oder importieren:

  • Scannen großer Dokumentmengen mit einem Produktions-Imaging-Scanner

  • Ad-hoc-Remotescan oder -import, z.B. aus einer Geschäftsanwendung

  • Automatisierter Import, z.B. aus einem E-Mail-Account oder überwachten Ordner

Endbenutzer können gedruckte Dokumente manuell scannen oder elektronische Dokumente in Batches Importieren, indem sie die Content Capture-Clientsoftware verwenden (dazu werden Clientprofile genutzt, die von Prozedur-Managern erstellt wurden). Alternativ dazu kann der Importprozessor auch die in einem Importjob gespeicherten Einstellungen verwenden und Bilder und andere elektronische Dokumente automatisch direkt aus E-Mails, Netzwerkordnern oder Listendateien importieren.

Konvertierung

Je nach Ihren Geschäftsanforderungen müssen Sie möglicherweise Eingabedokumente und Anhänge, die keine Bilder sind, in ein anderes Format konvertieren. Beispiel: PDF-Spesenberichte, die an importierte E-Mail-Nachrichten angehängt wurden, müssen unter Umständen in ein Bildformat konvertiert werden, damit ihre Barcodes gelesen werden können. In diesem Fall konvertiert der TIFF-Konvertierungsprozessor PDF-Dateien in TIFF-Bilder. Der TIFF-Konvertierungsprozessor konvertiert Dokumente oder Anhänge automatisch und führt diese mit den in einem Konvertierungsjob gespeicherten Einstellungen in einem Batch zusammen. Der PDF-Konvertierungsprozessor konvertiert Dokumente in PDFs mit demselben Inhaltstyp wie das Quelldokument sowie in durchsuchbare PDFs.

Klassifizierung

Bei der Klassifizierung werden Batches in logische Dokumente aufgeteilt und Dokumentprofile zugewiesen. Das Clientprofil gibt die möglichen Metadatenfelder und Anhangstypen für jedes Dokument an. Bei der Klassifizierung wird einem Batch zudem ein Status zugewiesen.

Die Klassifizierung kann manuell oder automatisch erfolgen:

Dokumententrennung

  • Manuell durch Content Capture-Clientbenutzer. Beispiel: Benutzer können ein Clientprofil auswählen, das für eine bestimmte Anzahl an Seiten pro Dokument konfiguriert wurde. Sie können auch vor dem Scannen Trennblätter zwischen Dokumenten einfügen, um ein neues Dokument zu identifizieren. Bei der visuellen Prüfung eines Batches können Content Capture-Clientbenutzer neue Dokumente erstellen, indem sie größere Dokumente in mehrere kleinere Dokumente aufteilen.

  • Manuell durch Benutzer beim Dateiimport in den Content Capture-Client.

  • Automatisch, wenn der Importprozessor Dokumente basierend auf Jobeinstellungen importiert.

  • Automatisch bei der Barcodeerkennung durch den Erkennungsprozessor. Wenn ein Batch an den Erkennungsprozessor gesendet wird, führt der Prozessor automatisch die Barcodeerkennung und Dokumentklassifizierung durch.

Metadatenzuweisung

Dokumenten wird ein Set aus Metadatenwerten basierend auf einem Dokumentprofil zugewiesen. Dieser Vorgang wird als Indexierung bezeichnet. Dieses Profil gibt die Metadatenfelder an, die zum Indexieren eines spezifischen Dokumenttyps verfügbar sind. Metadatenwerte können auf verschiedene Arten zugewiesen werden:

  • Manuell durch Benutzer im Metadatenbereich des Content Capture-Clients.

  • Automatisch, wenn der Importprozessor Dokumente basierend auf Jobeinstellungen verarbeitet.

  • Automatisch bei der Verarbeitung durch den Erkennungsprozessor basierend auf Jobeinstellungen.

  • Automatisch bei der Verarbeitung durch den Asset-Lookup-Prozessor basierend auf Jobeinstellungen.

Metadatenfelder können auf verschiedene Arten konfiguriert werden. Sie können eine Eingabemaske und ein Anzeigeformat konfigurieren oder einen regulären Ausdruck zur Validierung angeben. Metadatenwerte können automatisch ausgefüllt, in Auswahllisten und abhängigen Auswahllisten ausgewählt oder von Barcodes abgeleitet werden. Prozedurmanager konfigurieren diese Metadatenfelddefinitionen in der Prozedur und verwenden sie dann in Clientprofilen oder Prozessorjobs.

Anhangstyp

Ein Anhang ist eine Bild- oder andere Datei, die mit einem primären Dokument verknüpft ist. Prozedurmanager definieren Anhangstypen,, die Dokumentprofilen zugewiesen werden können. Mit diesen Anhangstypen können Sie Anhänge mit Dokumenten klassifizieren, die einem Dokumentprofil zugewiesen wurden. Benutzer des Content Capture-Clients können Anhänge anzeigen, den Anhangstyp ändern, Anhänge erstellen und Bildanhänge ändern.

Batchstatus

Prozedurmanager definieren Batchstatus entsprechend ihren Geschäftsanforderungen. Sie werden einem Batch jederzeit während der Inhaltserfassung manuell vom Benutzer oder automatisch von einem der Prozessoren zugewiesen.

Freigabe

Oracle Content Management stellt per Sperren und Freigeben sicher, dass immer nur ein Benutzer oder Prozessor Zugriff auf einen Inhaltserfassungsbatch hat. Ein Batch wird automatisch für Sie gesperrt, wenn Sie ihn erstellen oder öffnen (einblenden). Sie müssen den Batch freigeben oder entsperren, damit andere Benutzer ihn verwenden können. Wenn Sie mit der Arbeit an einem Batch fertig sind, geben Sie ihn frei, bzw. entsperren Sie ihn. Bei der Freigabe eines Batches werden dessen Dokumente und Metadaten automatisch mit Oracle Content Management synchronisiert. Außerdem wird der Batch zur weiteren Verarbeitung (Commit, Erkennung oder Konvertierung) weitergeleitet, falls dies im Clientprofil konfiguriert ist.

Commit

Wenn ein Batch festgeschrieben wird, werden alle zugehörigen Dokumente und deren Metadaten in Oracle Content Management hochgeladen und anschließend aus dem Batch entfernt. So können die Dokumente anhand ihrer Metadaten oder Inhalte in Oracle Content Management gesucht und aufgerufen werden. Einige der Dokumente werden möglicherweise nicht festgeschrieben. Beispiel: Dokumente, deren Pflichtfelder nicht gefüllt wurden, werden übersprungen. Wenn alle Dokumente in einem Batch festgeschrieben werden, wird der Batch ebenfalls aus der Prozedur gelöscht.

Während des Commit-Prozesses bleiben Nicht-Bilddateien, die nicht in ein Bildformat konvertiert wurden, in ihrem ursprünglichen Format.