1 Information om Content Capture

Med innehållsinhämtningsfunktionerna i Oracle Content Management har du ett system för fångst, indexering, lagring och hantering av verksamhetskritiskt affärsinnehåll. Du kan skanna och importera dokuments bulkvis och bearbeta dem automatiskt innan de laddas upp till Oracle Content Management. Dokument består av en eller flera bilder som kommer från en skanner eller importerats från en fil, eller de kan vara elektroniska filer som inte är bilder, till exempel Microsoft Word-filer eller PDF-filer. När du importerar filer som inte är bilder avgör det angivna registreringsflödet om de ska behållas i sitt ursprungliga format, konverteras till ett bildformat eller förhindras från import.

De dokumentbatchar du skapar är skalbara, och du kan omorganisera dokument och automatisera deras gruppering för att passa verksamhetens behov, läsa streckkoder för debitering eller arkivering, indexera dokument så att de blir enklare att söka i och konvertera dem till organisationens standardformat. Du skapar arbetsflöden för fångst av innehåll, eller procedurer, vilket automatiserar bearbetning och dirigering av fysiska och elektroniska dokument i bulk.

De primära faktorerna för inhämtning av innehåll är batchar och dokument. Dokument skannas eller importeras och hanteras i batchar. En batch består av skannade bilder eller elektroniska dokumentfiler (som PDF- eller Microsoft Office-filer) som ordnats i dokument och tilldelats metadatavärden (indexeras). Varje dokument delar en uppsättning av metadatavärden. Oracle Content Management erbjuder en rad olika processorer för fångst av innehåll som importerar dokument, konverterar dem till PDF och/eller TIFF, känner igen streckkoder automatiskt, separerar dokument automatiskt, fyller i metadatavärden och levererar slutgiltiga utdata till Oracle Content Management.

Processen för fångst av innehåll innefattar följande huvuddelar:

Fånga

Du kan skanna eller importera dokument till batchar med en Content Capture-procedur på flera olika sätt:

  • Skanning av stora volymer med hjälp av en produktionsskanner för bildbehandling av dokument

  • Tillfällig fjärrskanning eller -import, till exempel från en affärsapplikation

  • Automatiserad import, till exempel från ett e-postkonto eller en övervakad mapp

Slutanvändare kan manuellt skanna utskrivna dokument eller importera elektroniska dokument till batchar med hjälp av Content Capture-klientprogramvaran (baserat på klientprofiler som skapats av ansvariga för procedur). Med hjälp av de lagrade inställningarna kan även importprocessorn automatiskt importera bilder och andra elektroniska dokument direkt från e-postmeddelanden, nätverksmappar eller listfiler.

Konvertering

Beroende på verksamhetens behov kan du behöva konvertera indatadokument och bilagor som inte är bilder till ett annat format. Utläggsrapporter i PDF-format som bifogats till importerade e-postmeddelanden, till exempel, kanske måste konverteras till ett bildformat för att streckkoden ska kunna läsas. I detta fall konverteras PDF-filer till TIFF-bilder av TIFF-konverteringsprocessorn. TIFF-konverteringsprocessorn konverterar automatiskt dokument eller bilagor och slår samman dem inom en batch med inställningar som finns lagrade i ett konverteringsjobb. PDF-konverteringsprocessorn konverterar dokument till PDF:er av samma innehållstyp som källdokumentets och även till sökbara PDF:er.

Klassificering

Klassificering är processen att separera batchar i deras logiska dokument och tilldela dokumentprofiler. Klientprofilen specificerar en uppsättning möjliga metadatafält och bilagetyper som finns tillgängliga för varje dokument. Klassificering innefattar också att tilldela en status till en batch.

Klassificering kan utföras manuellt eller automatiskt på en rad olika sätt:

Dokumentavgränsning

  • Manuellt av användare av Content Capture-klienten. Exempel: Användare kan välja en klientprofil som konfigurerats för ett specifikt antal sidor per dokument. De kan också infoga skiljesidor mellan dokument före skanningen för att identifiera ett nytt dokument. När de inspekterar en batch visuellt kan användare av Content Capture-klienten skapa nya dokument genom att dela upp större dokument i flera mindre dokument.

  • Manuellt av användare under filimport i Content Capture-klienten.

  • Automatiskt, när importprocessorn importerar dokument baserat på jobbinställningarna.

  • Automatiskt, under streckkodsigenkänning av igenkänningsprocessorn. Om en batch skickas till igenkänningsprocessorn utför processorn automatiskt streckkodsigenkänning och dokumentklassificering.

Tilldelning av metadata

Dokument tilldelas en uppsättning metadatavärden baserat på en dokumentprofil, vilket kallas indexering. Den här profilen identifierar de metadatafält som finns tillgängliga för indexering av en viss typ av dokument. Metadatavärden kan tilldelas på olika sätt:

  • Manuellt, av användare i metadatarutan i Content Capture-klienten.

  • Automatiskt, när importprocessorn bearbetar dokument baserat på jobbinställningarna.

  • Automatiskt, under igenkänningsprocessorns bearbetning, baserat på jobbinställningarna.

  • Automatiskt, under tillgångsuppslagningsprocessorns bearbetning, baserat på jobbinställningarna.

Metadatafält kan konfigureras på olika sätt. Du kan konfigurera en indatamask och ett visningsformat, eller lägga in ett reguljärt uttryck för validering. Metadatavärden kan också fyllas i automatiskt, väljas från urvalslistor (eller härledas från streckkoder) och beroende urvalslistor. Dessa definitioner av metadatafält konfigureras i proceduren av proceduransvariga som sedan använder dem i klientprofiler eller processorjobb.

Bilagetyp

En bilaga är en bildfil eller icke-bildfil som är associerad med ett primärt dokument. Proceduransvariga definierar bilagetyper, som kan tilldelas till dokumentprofiler. Dessa bilagetyper kan användas för att klassificera bilagor med dokument som har tilldelats till en dokumentprofil. Content Capture-klientanvändare kan visa bilagor, ändra en bilagetyp, skapa bilagor och ändra bildbilagor.

Batchstatus

Proceduransvariga definierar batchstatusvärden så att de passar deras affärsbehov. Användaren tilldelar dem till en batch manuellt när som helst under Content Capture-processen eller automatiskt via någon av processorerna.

Frisläpp

Oracle Content Management använder en metod med låsning och frisläppande för att säkerställa att endast en användare eller processor har åtkomst till en batch med fångat innehåll vid en given tidpunkt. En batch låses automatiskt av dig när du skapar eller öppnar (expanderar) batchen. Du måste frisläppa eller låsa upp batchen för att den ska bli tillgänglig för andra. När du har arbetat klart med en batch frisläpper du den eller låser upp den. När en batch frisläpps synkroniseras dess dokument och metadata automatiskt med Oracle Content Management och batchen dirigeras för vidare bearbetning (bekräftelse, igenkänning eller konvertering), om detta har konfigurerats i dess klientprofil.

Bekräfta

När en batch bekräftas laddas alla dess dokument och tillhörande metadata upp till Oracle Content Management, varefter de tas bort från batchen. På så sätt kan dokumenten hittas och öppnas i Oracle Content Management via deras metadata eller innehåll. Vissa av dokumenten kanske inte bekräftas. Exempelvis hoppas dokument över om obligatoriska fält inte är ifyllda. Om alla dokument i en batch bekräftas tas batchen också bort från proceduren.

Under bekräftelseprocessen behåller icke-bildfiler som inte har konverterats till bildformat sitt ursprungliga format.