1 Przechwytywanie zawartości

Dostępne w Oracle Content Management funkcje przechwytywania zawartości tworzą jeden system pozwalający użytkownikom przechwytywać, indeksować i składować kluczową zawartość biznesową oraz nią zarządzać. Można masowo skanować i importować dokumenty oraz przetwarzać je automatycznie, zanim zostaną wysłane do Oracle Content Management. Dokumenty składają się jednego lub większej liczby obrazów uzyskanych ze skanera lub zaimportowanych z pliku, a mogą być także plikami niebędącymi obrazem, takimi jak dokumenty w formacie Microsoft Word lub PDF. Gdy są importowane pliki niebędące obrazem, zdefiniowany przepływ przechwytywania określa, czy pliki te zachowają swój oryginalny format bądź będą konwertowane do formatu obrazu albo nie będzie można ich zaimportować.

Tworzone partie dokumentów są skalowalne; można zmieniać organizację dokumentów, automatyzować ich grupowanie zgodnie z wymaganiami biznesowymi, odczytywać kody kreskowe na potrzeby fakturowania lub katalogowania, indeksować dokumenty w celu ułatwienia ich wyszukiwania oraz konwertować je do formatów standardowych w danej organizacji. Można tworzyć procesy Workflow przechwytywania zawartości lub procedury używane do automatyzacji masowego przetwarzania i kierowania dokumentów fizycznych i elektronicznych.

Głównymi elementami przy przechwytywaniu zawartości są partie i dokumenty. Dokumenty są skanowane lub importowane i utrzymywane w partiach. Partia składa się z plików zeskanowanych obrazów lub dokumentów elektronicznych (takich jak pliki PDF czy pliki w formacie Microsoft Office), które są organizowane w postaci dokumentów i do których są przypisywane wartości metadanych (indeksowanie). Każdy dokument współdzieli zbiór wartości metadanych. Oracle Content Management udostępnia różnorodne procesory przechwytywania zawartości, które importują dokumenty, konwertują je do formatu PDF i/lub TIFF, automatycznie rozpoznają kody kreskowe, automatycznie separują dokumenty, wypełniają pola wartościami metadanych oraz dostarczają końcowy wynik do Oracle Content Management.

Na proces przechwytywania zawartości składają się następujące główne etapy:

Przechwytywanie

Skanowanie lub importowanie dokumentów do partii może w ramach procedury przechwytywania być wykonywane na różne sposoby:

Skanowanie dużych wolumenów za pomocą produkcyjnego skanera dokumentów
Doraźne skanowanie lub importowanie na przykład z aplikacji biznesowej
Zautomatyzowany import, na przykład z konta e-mailowego lub monitorowanego folderu

Użytkownicy końcowi mogą — używając klienta Content Capture — ręcznie skanować dokumenty papierowe lub importować dokumenty elektroniczne do partii (na podstawie profili klienta utworzonych przez menedżerów procedur). Alternatywnie, procesor importu, używając ustawień ze zlecenia importu, może automatycznie importować obrazy i inne dokumenty elektroniczne bezpośrednio z konta e-mailowego lub folderu sieciowego bądź na podstawie pliku listy.

Konwersja

W zależności od wymagań biznesowych może okazać się niezbędne przekonwertowanie wejściowych dokumentów (i załączników) niebędących obrazami do innego formatu. Na przykład może okazać się konieczna konwersja raportów PDF dotyczących wydatków (załączonych do importowanych wiadomości e-mail) do formatu obrazu, aby umożliwić odczyt kodów kreskowych. W takim przypadku procesor konwersji do formatu TIFF przekonwertuje pliki PDF na obrazy TIFF. Procesor konwersji do formatu TIFF automatycznie konwertuje dokumenty i/lub załączniki i scala je w ramach partii, używając ustawień ze zlecenia konwersji. Procesor konwersji do formatu PDF konwertuje dokumenty do plików PDF o tym samym typie zawartości co dokument źródłowy oraz konwertuje do przeszukiwalnych plików PDF.

Klasyfikacja

Klasyfikacja jest to proces podziału partii na dokumenty logiczne i przypisana profili dokumentów. W profilu dokumentu są określane zestaw możliwych pól metadanych oraz zestaw typów załączników, dostępne dla każdego dokumentu. W procesie klasyfikacji następuje także przypisaniestatusu do partii.

Klasyfikacja może być dokonywana ręcznie lub automatycznie na różne sposoby:

Separacja dokumentów

Ręcznie przez użytkowników klienta Content Capture. Na przykład użytkownicy mogą wybrać profil klienta skonfigurowany z określoną liczbą stron przypadających na dokument. Mogą także przed skanowaniem wstawiać arkusze separujące między dokumentami w celu identyfikacji nowego dokumentu. Użytkownicy klienta Content Capture, badając wizualnie partię, mogą tworzyć nowe dokumenty, dzieląc większe na kilka mniejszych.
Ręcznie przez użytkowników podczas importu plików za pomocą klienta Content Capture.
Automatycznie, gdy procesor importu importuje dokumenty na podstawie ustawień zlecenia.
Automatycznie podczas rozpoznawania kodów kreskowych przez procesor rozpoznawania. Jeśli partia zostanie wysłana do procesora rozpoznawania, przeprowadzi on automatycznie operację rozpoznawania kodów kreskowych i klasyfikowania dokumentów.

Przypisywanie metadanych

Do dokumentów jest na podstawie profilu dokumentu przypisywany zbiór wartości metadanych; proces ten jest nazywany indeksowaniem. Profil ten identyfikuje pola metadanych dostępne do indeksowania określonego typu dokumentu. Wartości metadanych mogą być przypisywane na różne sposoby:

Ręcznie przez użytkowników w okienku metadanych w kliencie Content Capture.
Automatycznie, gdy procesor importu przetwarza dokumenty na podstawie ustawień zlecenia.
Automatycznie, na podstawie ustawień zlecenia, podczas przetwarzania przez procesor rozpoznawania.
Automatycznie, na podstawie ustawień zlecenia, podczas przetwarzania przez procesor wyszukiwania zasobów.

Pola metadanych mogą być konfigurowane na różne sposoby. Można skonfigurować maskę danych wejściowych i format wyświetlania lub określić wyrażenie regularne, używane do weryfikacji. Wartości metadanych mogą być automatycznie wypełniane bądź wybierane z list wyboru (lub wyprowadzane z kodów kreskowych) i zależnych list wyboru. Menedżerowie procedur konfigurują te definicje pól metadanych w procedurze, a następnie używają ich w profilach klienta lub w zleceniach dla procesora.

Typ załącznika

Załącznik to plik będący lub niebędący obrazem, powiązany z dokumentem podstawowym. Menedżerowie procedur definiują typy załączników,, które można przypisać do profili dokumentów. Typy te mogą być używane do klasyfikowania załączników z dokumentami, które zostały przypisane do profilu dokumentu. Użytkownicy klienta Content Capture mogą tworzyć i wyświetlać załączniki, zmieniać typy załączników oraz modyfikować załączniki będące obrazami.

Status partii

Menedżerowie procedur definiują statusy partii, dostosowane do potrzeb biznesowych. Statusy są przypisywane do partii ręcznie przez użytkownika w trakcie procesu przechwytywania zawartości lub automatycznie przez jeden z procesorów.

Zwalnianie

Oracle Content Management używa metody blokowania i zwalniania, mającej na celu zapewnienie, że w danej chwili tylko jeden użytkownik lub procesor ma dostęp do danej partii przechwytywania zawartości. Partia jest automatycznie blokowana, gdy użytkownik tworzy partię lub ją otwiera (rozwija). Aby partia stała się dostępna dla innych użytkowników, trzeba ją zwolnić lub odblokować. Po zakończeniu pracy z partią powinno się ją zwalniać lub odblokowywać. Gdy partia zostanie zwolniona, jej dokumenty i metadane są automatycznie synchronizowane z Oracle Content Management i partia jest kierowana do dalszego przetwarzania (zatwierdzanie, rozpoznawanie lub konwersja), jeśli zostało ono skonfigurowane w profilu klienta.

Zatwierdzanie

Gdy partia zostanie zatwierdzona, wszystkie zawarte w niej dokumenty i metadane są wysyłane do Oracle Content Management, a następnie usuwane z partii. Dzięki temu można odszukiwać dokumenty w Oracle Content Management na podstawie ich metadanych i zawartości. Niektóre z dokumentów mogą nie zostać zatwierdzone. Na przykład są pomijane dokumenty niemające wypełnionych wszystkich wymaganych pól. Jeśli zostaną zatwierdzone wszystkie dokumenty z partii, także i ona zostanie usunięta z procedury.

W trakcie procesu zatwierdzania pliki niebędące obrazem, które nie zostały przekonwertowane do formatu obrazu, pozostają w swoim pierwotnym formacie.