1 Informazioni sull'acquisizione di contenuto

Le funzioni di acquisizione del contenuto di Oracle Content Management forniscono un sistema per acquisire, indicizzare, memorizzare e gestire il contenuto business di importanza critica per determinate attività aziendali. È possibile eseguire la scansione o importare i documenti in bulk, quindi elaborarli in modo automatico prima del caricamento in Oracle Content Management. I documenti sono costituiti da una o più immagini ottenute da uno scanner o importate da un file oppure possono essere file elettronici non di immagine, ad esempio file Microsoft Word o PDF. Quando si importano file non di immagine, il flusso di acquisizione definito determina se i file devono essere conservati nel formato originale, se devono essere convertiti in un formato immagine oppure se ne deve essere impedita l'importazione.

I batch di documenti creati sono scalabili e consentono di riorganizzare i documenti, automatizzarne il raggruppamento in base alle esigenze aziendali, leggere i codici a barre per la fatturazione o l'archiviazione, nonché indicizzare i documenti per semplificarne la ricerca e convertirli in formati standard per l'organizzazione. L'utente crea i workflow di acquisizione del contenuto, o procedure, che rendono automatiche le fasi di elaborazione e instradamento in bulk dei documenti fisici ed elettronici.

I driver principali per l'acquisizione del contenuto sono i batch e i documenti. I documenti vengono sottoposti a scansione o importati e gestiti in batch. Un batch costituito da immagini di cui è stata eseguita la scansione o da file di documenti elettronici, ad esempio file PDF o di Microsoft Office, organizzati in documenti logici, a cui vengono assegnati valori di metadati (indicizzati). Ogni documento condivide un set di valori di metadati. In Oracle Content Management sono disponibili vari processori di acquisizione del contenuto, in grado di importare i documenti e convertirli nel formato PDF e/o TIFF, riconoscere automaticamente i codici a barre, separare automaticamente i documenti, inserire i valori dei metadati e distribuire l'output finale a Oracle Content Management.

Il processo di acquisizione del contenuto è costituito dai componenti principali seguenti:

Acquisizione

La scansione o l'importazione di documenti in batch all'interno di una procedura di acquisizione del contenuto può essere eseguita in vari modi:

  • Scansione di grandi volumi mediante uno scanner di imaging per documenti di produzione

  • Scansione o importazione remota ad hoc, ad esempio da un'applicazione business

  • Importazione automatica, ad esempio da un account di posta elettronica o da una cartella monitorata

Gli utenti finali possono eseguire la scansione manuale dei documenti cartacei oppure importare documenti elettronici in batch utilizzando il software del client di Content Capture (in base ai profili client create dai responsabili delle procedure). In alternativa, utilizzando le impostazioni memorizzate in un job di importazione, il processore di importazione può anche importare automaticamente immagini e altri documenti elettronici direttamente da posta elettronica, cartelle di rete o file lista.

Conversione

A seconda delle esigenze aziendali, potrebbe essere necessario convertire i documenti e gli allegati di input non di immagine in un formato diverso. Ad esempio, potrebbe essere necessario convertire in un formato immagine le note spese in formato PDF associate ai messaggi di posta elettronica importati per consentire la lettura dei codici a barre. In questo caso il processore di conversione in TIFF converte i file PDF in immagini TIFF. Il processore di conversione in TIFF converte automaticamente i documenti o gli allegati e li unisce all'interno di un batch utilizzando le impostazioni memorizzate in un job di conversione. Il processore di conversione in PDF converte i documenti in file PDF dello stesso tipo di contenuto del documento di origine e anche in file PDF ricercabili.

Classificazione

La Classificazione è il processo di separazione dei batch nei rispettivi documenti logici e di assegnazione dei profili documento. Il profilo client specifica un set di possibili campi di metadati e tipi di allegato disponibili per ogni documento. La classificazione comprende inoltre l'assegnazione di uno stato a un batch.

La classificazione può avvenire in modo manuale o automatico in vari modi:

Separazione dei documenti

  • Manualmente, da parte degli utenti del client di Content Capture. Ad esempio, gli utenti possono selezionare un profilo client configurato per un numero specifico di pagine per documento. Possono inoltre inserire fogli di separazione tra i documenti prima della scansione per identificare un nuovo documento. Durante l'ispezione visiva di un batch, gli utenti del client di Content Capture possono creare nuovi documenti mediante la suddivisione di documenti di grandi dimensioni in vari documenti più piccoli.

  • Manualmente, da parte degli utenti durante l'importazione di file nel client di Content Capture.

  • In modo automatico, quando il processore di importazione importa i documenti in base alle impostazioni del job.

  • In modo automatico, durante il riconoscimento dei codici a barre da parte del processore di riconoscimento. Se un batch viene inviato al processore di riconoscimento, il processore esegue automaticamente il riconoscimento dei codici a barre e la classificazione dei documenti.

Assegnazione dei metadati

Ai documenti viene assegnato un set di valori di metadati in base a un profilo documento, un procedimento definito indicizzazione. Questo profilo identifica i campi di metadati disponibili per l'indicizzazione di un tipo di documento specifico. I valori dei metadati possono essere assegnati nei modi descritti di seguito.

  • Manualmente, da parte degli utenti, nel riquadro dei metadati del client di Content Capture.

  • In modo automatico, quando il processore di importazione elabora i documenti in base alle impostazioni del job.

  • In modo automatico, durante l'elaborazione da parte del processore di riconoscimento, in base alle impostazioni del job.

  • In modo automatico, durante l'elaborazione da parte del processore di ricerca asset, in base alle impostazioni del job.

I campi di metadati possono essere configurati in vari modi. È possibile configurare una maschera di input e un formato di visualizzazione oppure fornire un'espressione regolare per la convalida. I valori dei metadati possono essere inseriti in modo automatico, selezionati da liste di scelte (o derivate da codici a barre) e liste di scelte dipendenti. I responsabili delle procedure configurano queste definizioni di campo metadati nella procedura e le utilizzano nei profili client o nei job processore.

Tipo di allegato

Per allegato si intende un file immagine o non di immagine associato a un documento principale. I responsabili delle procedure definiscono i tipi di allegato, che possono essere assegnati ai profili documento. Questi tipi di allegato possono essere utilizzati per classificare gli allegati con i documenti che sono stati assegnati a un profilo documento. Gli utenti del client di Content Capture possono visualizzare allegati, modificare un tipo di allegato, creare nuovi allegati e modificare gli allegati immagine.

Stato batch

I responsabili delle procedure definiscono gli stati batch per soddisfare esigenze business specifiche. Questi stati vengono assegnati manualmente dall'utente in qualsiasi momento durante il processo di acquisizione del contenuto oppure automaticamente da uno dei processori.

Rilascio

Oracle Content Management utilizza un metodo di blocco e rilascio per garantire che un solo utente o processore disponga dell'accesso a qualsiasi batch di acquisizione del contenuto in un determinato momento. Un batch viene bloccato automaticamente quando lo si crea o apre (espande). È necessario rilasciare o sbloccare il batch per renderlo disponibile per altri utenti. Al termine della sessione di lavoro, rilasciare o sbloccare il batch. Il rilascio comporta la sincronizzazione automatica dei documenti e dei metadati con Oracle Content Management e l'instradamento del batch per un'ulteriore elaborazione (commit, riconoscimento o conversione), se configurata nel profilo client.

Eseguire il commit

Quando si esegue il commit di un batch, tutti i documenti che ne fanno parte e i relativi metadati vengono caricati in Oracle Content Management e quindi rimossi dal batch. In questo modo è possibile trovare i documenti e accedervi in Oracle Content Management tramite i relativi metadati o contenuti. È possibile che il commit di alcuni documenti non venga eseguito. Ad esempio, i documenti privi di dati nei campi obbligatori vengono saltati. Se il commit viene eseguito per tutti i documenti di un batch, il batch viene eliminato anche dalla procedura.

Durante il processo di commit, i file non di immagine che non sono stati convertiti in un formato immagine rimangono nel formato originale.