2 Der Content Capture-Prozess

Im Folgenden wird der allgemeine Prozess beschrieben, mit dem Inhalt erfasst und in Oracle Content Management hochgeladen wird.

Zeigt die Verarbeitung von Dokumenten von der ersten bis zur letzten Phase

Quellen

Sie können Inhalt aus verschiedenen Quellen erfassen:

Prozessoren

Unabhängig von der Quelle wird jedes erfasste Dokument durch mehrere Prozessoren geleitet, bevor es zur Speicherung und/oder weiteren Verarbeitung in Oracle Content Management hochgeladen wird:
  • Der Importprozessor ermöglicht automatisierten Bulkimport von Quellen wie Dateisystemordnern, Listentextdateien mit Begrenzungszeichen oder Posteingang/Ordner eines E-Mail-Serveraccounts. Der Importjob überwacht die Quelle und importiert Inhalt in einem angegebenen Intervall (z.B. einmal pro Minute, Stunde oder Tag).

  • Der TIFF-Konvertierungsprozessor konvertiert Nicht-Bilddokumente und -anhänge automatisch in das TIFF- oder JPEG-Format. Sie können Dokumente und Anhänge bei der Konvertierung auf verschiedene Arten zusammenführen. Beispiel: Der Konvertierungsprozessor kann Dokumentdateien wie PDF- oder Microsoft Office-Dokumente für die Barcodeverarbeitung in TIFF-Bilder konvertieren.

  • Der PDF-Konvertierungsprozessor konvertiert Dokumente, Bilder und Anhänge in PDF-Dateien.
  • Der Erkennungsprozessor erkennt Barcodes automatisch und kann Dokumente organisieren und indexieren.

  • Der Commit-Prozessor führt Commit-Profile aus, um Dokumente automatisch auszugeben und in einem Batch in Oracle Content Management hochzuladen. Anschließend werden die Batches aus der Prozedur entfernt.

    Ein Commit-Profil gibt an, wie die Dokumente und ihre Metadaten ausgegeben werden. Es umfasst Metadatenfeldzuordnungen, das Ausgabeformat, Anweisungen zum Fehlerhandling und Einstellungen für den Commit-Treiber.

  • Mit dem Asset-Lookup-Prozessor können Clientbenutzer nach unterstützten Assets im Oracle Content Management-Repository suchen.

  • Mit dem XML-Transformationsprozessor können Clientbenutzer XML-Dokumente basierend auf einer XSLT-Datei in einen gewünschten Stil transformieren.

Wenn Sie alle Prozessoren konfigurieren, wird die Funktion jedes Prozessors auf die anderen abgestimmt. Viele Aufgaben in einem Batchfluss beginnen mit dem Importprozessor, gefolgt vom PDF- oder TIFF-Konvertierungsprozessor, um Dokumente in die konfigurierten Formate zu konvertieren. Der Erkennungsprozessor erkennt anschließend Barcodes und organisiert und indexiert Dokumente. Schließlich übermittelt der Commit-Prozessor die Ausgabe an Oracle Content Management (per Upload).

Alle erfassten Dokumente werden als separate Inhaltselemente in Oracle Content Management gespeichert. Sie erhalten dabei die Metadaten, die ihnen bei der Inhaltserfassung zugewiesen wurden. Sie können diese Elemente genauso wie alle anderen Objekte in Oracle Content Management aufrufen und verwalten.

Prozeduren

Prozeduren sind definierte Inhaltserfassungsworkflows vom anfänglichen Abruf bis zum endgültigen Upload in Oracle Content Management. Jede Prozedur stellt ein komplettes Inhaltserfassungssystem dar, das einen zentralen Speicherort für die Konfiguration von Metadaten, Verarbeitungsregeln, Konfigurationsprofilen und Batchdaten für eine bestimmte Umgebung bereitstellt. Benutzer des Content Capture-Clients erstellen und öffnen Batches in einer Prozedur, für die ihnen Zugriff erteilt wurde.

Sie können mehrere Prozeduren für Ihre Organisation erstellen und damit effizient alle Ihre Inhaltserfassungs- und Verarbeitungsanforderungen erfüllen, z.B. nach Abteilung oder Standort. Außerdem können Sie gemeinsame Konfigurationselemente zwischen Prozeduren für die optimale Wiederverwendung teilen. Sie können eine Prozedur auch für die einfache Anpassung an andere Umgebungen kopieren.

Batches

Ein Batch enthält ein oder mehrere Dokumente, die zusammengehören (z.B. mehrere Dokumente für einen Kunden) oder nicht miteinander in Zusammenhang stehen (z.B. Dokumente, die durch Trennblätter getrennt sind).
  • Ein Dokument kann aus gescannten Bildern oder einer elektronischen Datei bestehen, wie einer Microsoft Word- oder PDF-Datei.

  • Ein Dokument kann Anhänge wie Bilder oder elektronische Dateien enthalten.

Sie können Batches sperren, wenn Sie damit arbeiten. Sie sehen ein Sperrsymbol, wenn ein Batch von Ihnen oder einem anderen Benutzer gesperrt wurde. Wenn Sie einen Batch freigeben, wird das Sperrsymbol entfernt. Je nach den Einstellungen des Clientprofils wird der Batch dann für die Bearbeitung durch einen anderen Benutzer oder Systemprozessor freigegeben.

Clientprofile

Sie scannen oder Importieren Gruppen von Seiten in Batches mit einem Clientprofil, das der Prozedurmanager definiert hat. Ein Clientprofil ist eine Gruppe von Einstellungen, die bestimmen, wie die Dokumente in einem Batch gescannt, importiert oder indexiert werden. Ein Clientprofil führt folgende Aufgaben aus:
  • Es steuert unter anderem Scannereinstellungen, wie Dokumente im Batch erstellt und getrennt werden, ob Metadatenfelder verfügbar sind, ob und wie Barcodes verarbeitet werden und was mit Batches geschieht, nachdem sie freigegeben wurden.

  • Es bestimmt, ob Sie Dokumente nur erfassen, Dokumente erfassen und indexieren oder Dokumente nur indexieren können.

  • Es bestimmt, ob elektronische Dateien, die keine Bilder sind (z.B. PDF-Dokumente) in ihrem ursprünglichen Format beibehalten oder in ein Bildformat konvertiert werden sollen oder ob ihr Import verhindert werden soll.

  • Es identifiziert die Gruppe von Metadatenfeldern, die für ein ausgewähltes Dokument ausgefüllt werden müssen.

Wenn das Clientprofil die Indexierung umfasst, können Sie Metadatenwerte wie Kunden-ID und Kundenname zu Dokumenten zuweisen. Dokumente mit unterschiedlichen Typen in einem Batch verfügen im Allgemeinen über unterschiedliche Gruppen von Metadatenfeldern. Sie können Dokumenten in Batches nur für die Indexierung Metadatenwerte zuweisen, aber keine Seiten anhängen, einfügen oder ersetzen.

Nachdem Sie die Dokumente eines Batches fertig bearbeitet haben, können Sie den Batch freigeben. Dadurch wird er für andere Benutzer entsperrt (wenn keine Freigabeprozesse definiert sind). Wenn Sie einen Batch freigeben und einen verfügbaren Freigabeprozess ausgewählt haben, hängt die nächste Aktion, die mit dem Batch ausgeführt wird, von diesem Freigabeprozess ab. Was als Nächstes geschieht, hängt von den Einstellungen des Clientprofils ab:
  • Der Batch kann aus der Batchbereichsliste entfernt und in Oracle Content Management festgeschrieben oder zur weiteren Verarbeitung (z.B. zur PDF-/TIFF-Konvertierung oder Barcodeerkennung) in eine Queue gestellt werden.

  • Der Batch kann in der Liste verbleiben, wird jedoch entsperrt (es wird kein Sperrsymbol angezeigt). Dadurch können Sie oder ein anderer Benutzer den Batch sperren und weitere Änderungen vornehmen.