2 Descrizione del processo di acquisizione del contenuto

In questa sezione viene descritto il processo di base di acquisizione e caricamento del contenuto in Oracle Content Management.

Vengono illustrate le modalità di elaborazione dei documenti dalla prima all'ultima fase.

Origini

Il contenuto può essere acquisito da varie origini:

Processori

A prescindere dall'origine, ogni documento acquisito viene instradato verso numerosi processori prima di essere caricato in Oracle Content Management per la memorizzazione e/o un'ulteriore elaborazione.
  • Il processore di importazione esegue l'importazione in modalità bulk da origini quali una cartella del file system, un file lista di testo delimitato oppure la posta in entrata o una cartella di un account di server di posta elettronica. Il job di importazione monitora l'origine e importa il contenuto alla frequenza specificata, ad esempio una volta al minuto, all'ora o al giorno.

  • Il processore di conversione in TIFF converte in modo automatico i documenti e gli allegati non di immagine nel formato TIFF o JPEG. Durante la conversione è possibile scegliere di unire i documenti e gli allegati in vari modi. Ad esempio, il processore di conversione può convertire file documento quali i file PDF o i documenti di Microsoft Office in immagini TIFF per l'elaborazione dei codici a barre.

  • Il processore di conversione in PDF converte documenti, immagini e allegati nel formato PDF.
  • Il processore di riconoscimento riconosce in modo automatico i codice a barre e organizza e indicizza i documenti.

  • Il processore di commit esegue i profili di commit per la restituzione e il caricamento automatici dei documenti di un batch in Oracle Content Management, quindi rimuove i batch dalla procedura.

    Un profilo di commit specifica come restituire i documenti e i relativi metadati e include i mapping dei campi di metadati, il formato di output, le istruzioni di gestione degli errori e le impostazioni del driver di commit.

  • Il processore di ricerca asset consente agli utenti del client di cercare gli asset supportati nel repository di Oracle Content Management.

  • Il processore di trasformazione XML consente agli utenti del client di trasformare i documenti XML nello stile desiderato in base a un file XSLT.

Ogni processore, se la configurazione definita prevede di utilizzarli tutti, funziona in modo coordinato con gli altri. Numerosi task in un flusso di batch iniziano con il processore di importazione, quindi avanzano al processore di conversione in PDF o TIFF per convertire i documenti nei formati configurati. Viene quindi attivato il processore di riconoscimento per il riconoscimento dei codici a barre, l'organizzazione dei documenti secondo le modalità specificate e l'indicizzazione dei documenti. Infine, il processore di commit distribuisce (carica) l'output in Oracle Content Management.

Tutti i documenti acquisiti vengono caricati e memorizzati in Oracle Content Management come elementi di contenuto distinti con i metadati assegnati durante il processo di acquisizione del contenuto. È possibile accedere e gestire tali elementi come qualsiasi altro elemento di Oracle Content Management.

Procedure

Le Procedure sono i workflow di acquisizione del contenuto, dalla definizione dell'origine iniziale fino al caricamento finale in Oracle Content Management. Ogni procedura rappresenta un sistema di acquisizione del contenuto completo, che fornisce una posizione centralizzata per la configurazione di metadati, regole di elaborazione, profili di configurazione e dati batch per un determinato ambiente. Gli utenti del client di Content Capture creano e accedono ai batch all'interno della procedura per la quale dispongono dei diritti di accesso.

È possibile creare più procedure per l'organizzazione per gestire in modo efficiente tutte le esigenze di acquisizione e elaborazione del contenuto, ad esempio per reparto o luogo. È inoltre possibile condividere gli elementi di configurazione comuni tra le procedure per un riutilizzo ottimale, nonché copiare una procedura per adattarla con facilità ad altri ambienti.

Batch

Un batch contiene uno o più documenti, che possono essere correlati (ad esempio più documenti per lo stesso cliente) o non correlati (ad esempio i documenti divisi mediante fogli di separazione).
  • Un documento può essere costituito da immagini sottoposte a scansione o da un file elettronico, ad esempio un file Microsoft Word o PDF.

  • Un documento può contenere o meno allegati, ad esempio immagini o un file elettronico.

Quando si utilizza un batch, è possibile bloccarlo. Quando un batch è stato bloccato dall'utente o da un altro utente, viene visualizzata un'icona a forma di lucchetto. Il rilascio di un batch comporta la rimozione dell'icona lucchetto e, a seconda delle impostazioni del profilo client, libera il batch in modo che possa essere utilizzato da un altro utente o da un processore di sistema.

Profili client

Per eseguire la scansione o importare gruppi di pagine in batch si utilizza un profilo client definito per l'utente dal responsabile delle procedure. Per profilo client si intende un gruppo di impostazioni che determinano come eseguire la scansione, importare o indicizzare i documenti in un batch. Di seguito vengono descritte le caratteristiche di un profilo client.
  • Controlla le impostazioni dello scanner, il modo in cui i documenti vengono creati e separati nel batch, se i campi di metadati sono disponibili, se e in che modo vengono elaborati i codici a barre, nonché l'azione da eseguire sui batch quando vengono rilasciati.

  • Determina se è possibile eseguire solo l'acquisizione dei documenti, l'acquisizione e l'indicizzazione dei documenti o solo l'indicizzazione dei documenti.

  • Determina se i file elettronici non di immagine, ad esempio i documenti PDF, devono essere conservati nel formato originale, convertiti in un formato immagine oppure esclusi dall'importazione.

  • Identifica il set di campi di metadati da completare per un documento selezionato.

Se il profilo client include l'indicizzazione, è possibile assegnare i valori dei metadati ai documenti, ad esempio l'ID e il nome di un cliente. Documenti di tipo diverso in un batch dispongono in genere di set diversi di campi di metadati disponibili. È possibile assegnare valori di metadati a documenti nei batch di sola indicizzazione, ma non è possibile aggiungere, inserire o sostituire le pagine.

Al termine dell'elaborazione dei documenti in un batch, si esegue il rilascio del batch, ovvero l'operazione che consente di sbloccare il batch dall'uso esclusivo (se non è definito alcun processo di rilascio). Se si rilascia un batch e si seleziona un processo di rilascio disponibile, l'azione successiva eseguita sul batch dipende dal processo di rilascio selezionato. Cosa si verifica in seguito dipende dalle impostazioni del profilo client.
  • Il batch può essere rimosso dalla lista del riquadro dei batch ed essere sottoposto a commit in Oracle Content Management oppure essere inserito in una coda per ulteriore elaborazione, ad esempio per la conversione in PDF o TIFF o il riconoscimento dei codici a barre.

  • Il batch può rimanere nella lista ma essere sbloccato (non viene visualizzata alcuna icona a forma di lucchetto). Ciò consente a chiunque di bloccare il batch e apportare ulteriori modifiche.