1 Čo je to Content Capture

Funkcie na digitalizáciu obsahu v službe Oracle Content Management vám poskytujú komplexný systém na digitalizáciu, indexovanie, ukladanie a správu kľúčového podnikového obsahu. Môžete hromadne skenovať a importovať dokumenty a automaticky ich spracovať pred nahratím do služby Oracle Content Management. Dokumenty pozostávajú z obrázkov, ktoré sa získajú zo skenera alebo importujú zo súboru, prípadne to môžu byť neobrazové elektronické súbory, ako sú súbory programu Microsoft Word alebo súbory PDF. Definovaný tok digitalizácie pri importe neobrazových súborov určuje, či sa uchovajú v pôvodnom formáte, skonvertujú na formát obrázka alebo či sa zabráni ich importu.

Vytvorené dávky dokumentov sú škálovateľné, čiže môžete zmeniť usporiadanie dokumentov, automatizovať ich zoskupovanie podľa vašich podnikových požiadaviek, čítať čiarové kódy na účely fakturácie alebo evidencie, indexovať dokumenty, aby sa dali jednoducho prehľadávať, a konvertovať ich na štandardne používané formáty vo vašej organizácii. Vytvárate toky činností digitalizácie obsahu, nazývané aj procedúry, ktoré automatizujú hromadné spracovanie a smerovanie fyzických a elektronických dokumentov.

Primárnymi jednotkami digitalizácie obsahu sú dávky a dokumenty. Dokumenty sa naskenujú alebo importujú a uchovávajú v dávkach. Dávka pozostáva z naskenovaných obrázkov alebo súborov elektronických dokumentov (ako sú dokumenty PDF alebo súbory programov z balíka Microsoft Office), ktoré sú usporiadané do dokumentov a priradia sa k nim hodnoty metadát (čiže sú indexované). Každý dokument zdieľa množinu hodnôt metadát. Služba Oracle Content Management poskytuje rozličné procesory na digitalizáciu obsahu, ktoré importujú dokumenty, konvertujú ich na formát PDF alebo TIFF, automaticky rozpoznávajú čiarové kódy, automaticky oddeľujú dokumenty, vypĺňajú hodnoty metadát a odosielajú výsledný výstup do služby Oracle Content Management.

Proces digitalizácie obsahu pozostáva z nasledujúcich hlavných komponentov:

Digitalizácia

Skenovanie alebo importovanie dokumentov do dávok v rámci procedúry digitalizácie obsahu možno vykonávať rôznymi spôsobmi:

  • Veľkoobjemové skenovanie pomocou produkčného obrazového skenera dokumentov.

  • Jednorazové vzdialené skenovanie alebo import, napríklad z podnikovej aplikácie.

  • Automatizovaný import, napríklad z e-mailového konta alebo monitorovaného priečinka.

Koncoví používatelia môžu manuálne skenovať tlačené dokumenty alebo importovať elektronické dokumenty do dávok pomocou softvéru klienta Content Capture (na základe profilov klienta vytvorených správcami procedúry). Alebo môže procesor importu automaticky importovať obrázky a iné elektronické dokumenty priamo z e-mailov, sieťových priečinkov alebo zo súborov so zoznamom podľa nastavení uložených v úlohe importu.

Konverzia

V závislosti od vašich obchodných potrieb môže byť potrebné skonvertovať neobrazové vstupné dokumenty a prílohy na iný formát. Napríklad vyúčtovania výdavkov vo formáte PDF priložené k importovaným e-mailovým správam môže byť potrebné skonvertovať na obrazový formát, ktorý bude umožňovať načítanie ich čiarových kódov. Procesor konverzie na formát TIFF v tomto prípade skonvertuje súbory PDF na obrázky vo formáte TIFF. Procesor konverzie na formát TIFF automaticky konvertuje dokumenty alebo prílohy a zlučuje ich v rámci dávky použitím nastavení uložených v úlohe konverzie. Procesor konverzie do formátu PDF konvertuje dokumenty na dokumenty PDF rovnakého typu obsahu, ako je zdrojový dokument, a tiež na vyhľadateľné PDF.

Klasifikácia

Klasifikácia je proces rozdelenia dávok do ich logických dokumentov a priradenia profilov dokumentov. Profil klienta určuje množinu možných polia metadát a typy príloh, ktoré sú k dispozícii pre každý dokument. Klasifikácia zahŕňa aj priradenie stavu k dávke.

Klasifikáciu je možné uskutočniť manuálne alebo automaticky rôznymi spôsobmi:

Oddeľovanie dokumentov

  • Manuálne používateľmi klienta Content Capture. Používatelia môžu napríklad vybrať profil klienta, ktorý je nakonfigurovaný pre konkrétny počet strán na dokument. Môžu tiež vložiť oddeľovacie hárky medzi dokumenty pred ich naskenovaním na identifikáciu nového dokumentu. Počas vizuálnej kontroly dávky môžu používatelia klienta Content Capture vytvoriť nové dokumenty rozdelením väčších dokumentov do viacerých menších dokumentov.

  • Manuálne používateľmi počas importovania súborov v klientovi Content Capture.

  • Automaticky, keď procesor importu importuje dokumenty podľa nastavení úloh.

  • Automaticky počas rozpoznávania čiarových kódov procesorom rozpoznávania. Keď sa dávka odošle do procesora rozpoznávania, procesor automaticky vykoná rozpoznávanie čiarových kódov a klasifikáciu dokumentov.

Priradenie metadát

Na základe profilu dokumentu sa k dokumentom priraďuje množina hodnôt metadát, čo sa označuje ako indexovanie. Tento profil identifikuje polia metadát dostupné na indexovanie konkrétneho typu dokumentu. Hodnoty metadát môžu byť priradené rôznymi spôsobmi:

  • manuálne používateľmi v podokne metadát klienta Content Capture,

  • automaticky pri spracovaní dokumentov procesorom importu na základe nastavení úloh,

  • automaticky počas spracovania procesorom rozpoznávania na základe nastavení úloh,

  • automaticky počas spracovania procesorom vyhľadania položiek na základe nastavení úloh.

Polia metadát je možné konfigurovať rôznymi spôsobmi. Môžete nakonfigurovať masku vstupu a formát zobrazenia alebo poskytnúť regulárny výraz na overenie. Hodnoty metadát môžu byť automaticky vyplnené, vybrané zo zoznamov volieb (alebo odvodené od čiarových kódov) a závislých zoznamov volieb. Správcovia procedúr konfigurujú tieto definície polí metadát v procedúre a potom ich používajú v profiloch klienta alebo úlohách procesorov.

Typ prílohy

Príloha je obrazový alebo neobrazový súbor priradený k primárnemu dokumentu. Správcovia procedúr definujú typy príloh,, ktoré možno priradiť k profilom dokumentov. Pomocou týchto typov príloh možno klasifikovať prílohy s dokumentmi, ktoré boli priradené k profilu dokumentu. Používatelia klienta Content Capture môžu zobrazovať prílohy, zmeniť typ prílohy, vytvárať prílohy a modifikovať obrazové prílohy.

Stav dávky

Správcovia procedúr definujú stavy dávok, ktoré zodpovedajú ich obchodným potrebám. K dávke ich priradí používateľ manuálne kedykoľvek počas procesu digitalizácie obsahu alebo automaticky prostredníctvom jedného z procesorov.

Uvoľnenie

Služba Oracle Content Management využíva metódu uzamykania a uvoľňovania, pomocou ktorej zaisťuje, aby prístup k dávke digitalizácie obsahu mal v určitom čase vždy iba jeden používateľ alebo procesor. Keď vytvoríte alebo otvoríte (rozbalíte) určitú dávku, túto dávku si tým automaticky uzamknete len pre seba. Na sprístupnenie dávky pre ostatných je potrebné ju uvoľniť alebo odomknúť. Keď skončíte s prácou na dávke, uvoľníte ju alebo ju odblokujete. Uvoľnením dávky sa jej dokumenty a metadáta automaticky synchronizujú so službou Oracle Content Management a dávka sa nasmeruje na ďalšie spracovanie (potvrdenie, rozpoznávanie alebo konverziu), ak to má nakonfigurované vo svojom profile klienta.

Potvrdenie

Keď sa dávka potvrdí, všetky jej dokumenty a ich metadáta sa nahrajú do služby Oracle Content Management a následne sa odstránia z dávky. Dokumenty sa tak v službe Oracle Content Management dajú vyhľadať a otvoriť prostredníctvom ich metadát alebo obsahu. Niektoré dokumenty nie je možné potvrdiť. Vynechávajú sa napríklad dokumenty, v ktorých nie sú vyplnené povinné polia. Keď sú v dávke potvrdené všetky dokumenty, z procedúry sa odstráni aj samotná dávka.

Neobrazové súbory, ktoré neboli skonvertované na obrazový formát, zostanú počas procesu potvrdenia v pôvodnom formáte.