2 Omówienie procesu Content Capture

Przyjrzyjmy się podstawowemu procesowi przechwytywania zawartości i wysyłania jej do usługi Oracle Content Management.

Na rysunku jest pokazywane, w jaki sposób jest przetwarzany dokument (od pierwszego do ostatniego etapu).

Źródła

Zawartość może być przechwytywana z różnych źródeł:

Procesory

Bez względu na rodzaj źródła każdy przechwycony dokument, zanim zostanie wysłany do Oracle Content Management w celu składowania i/lub dalszego przetwarzania, jest kierowany przez szereg procesorów:
  • Procesor importu zapewnia automatyczny, masowy import z różnych źródeł, takich jak folder z systemu plików, tekstowy plik listy lub skrzynka odbiorcza/folder z konta serwera poczty elektronicznej. Procesor importu monitoruje źródło i importuje zawartość z określoną częstotliwością (na przykład co minutę, co godzinę lub co dzień).

  • Procesor konwersji do formatu TIFF automatycznie konwertuje dokumenty i załączniki niebędące obrazami do formatu TIFF lub JPEG. Można wybrać sposób scalania dokumentów i załączników podczas konwersji. Na przykład procesor konwersji może konwertować pliki dokumentów (np. w formacie PDF lub Microsoft Office) do obrazów TIFF w celu przetwarzania z użyciem kodów kreskowych.

  • Procesor konwersji do formatu PDF konwertuje dokumenty, obrazy i załączniki do formatu PDF.
  • Procesor rozpoznawania automatycznie rozpoznaje kody kreskowe oraz organizuje i indeksuje dokumenty.

  • Procesor zatwierdzania uruchamia profile zatwierdzania, umożliwiające automatyczne wyprowadzanie i wysyłanie dokumentów z partii do Oracle Content Management, po czym usuwa partie z procedury.

    Profil zatwierdzania określa, w jaki sposób mają być wyprowadzane dokumenty i ich metadane, oraz zawiera odwzorowania pól metadanych, format wyjściowy, instrukcje obsługi błędów i ustawienia sterownika zatwierdzania.

  • Procesor wyszukiwania zasobów umożliwia użytkownikom klienta wyszukiwanie — w repozytorium Oracle Content Management — obsługiwanych zasobów.

  • Procesor transformacji XML umożliwia użytkownikom-klientom transformację dokumentów XML do odpowiedniego stylu w oparciu o plik XSLT.

Każdy z procesorów, jeśli zostało skonfigurowane używanie ich wszystkich, współpracuje w skoordynowany sposób z innymi. Wiele zadań związanych z przepływem partii zaczyna się od procesora importu, skąd są przekazywane — w celu konwersji do skonfigurowanych formatów — do procesora konwersji do formatu PDF lub TIFF. Następnie procesor rozpoznawania zajmuje się rozpoznawaniem kodów kreskowych oraz organizowaniem dokumentów w określony sposób i ich indeksowaniem. Na koniec procesor zatwierdzania wysyła wynik do Oracle Content Management.

Wszystkie przechwycone dokumenty są wysyłane do Oracle Content Management i przechowywane jako osobne elementy zawartości z metadanymi przypisanymi w trakcie procesu przechwytywania zawartości. Do elementów tych można uzyskiwać dostęp i zarządzać nimi tak samo, jak w przypadku innych elementów w Oracle Content Management.

Procedury

Procedury są to zdefiniowane procesy Workflow przechwytywania zawartości: od początkowego uzyskania jej ze źródeł aż do ostatecznego wysłania do Oracle Content Management. Każda procedura przedstawia pełny system przechwytywania zawartości, udostępniający scentralizowaną lokalizację do konfigurowania danych, reguły przetwarzania, profile konfiguracji oraz dane partii dla określonego środowiska. Użytkownicy klienta Content Capture tworzą partie i uzyskują do nich dostęp w obrębie procedury, do której mają prawa dostępu.

Dla swojej organizacji można utworzyć wiele procedur, pozwalających skutecznie zarządzać wszystkimi potrzebami z zakresie przechwytywania zawartości i jej przetwarzania, na przykład dla określonych działów lub lokalizacji. Wspólne elementy konfiguracji można, w celu ich optymalnego wykorzystania, współużytkować w różnych procedurach. Procedury można także kopiować, a utworzone kopie — z łatwością dostosowywać do innych środowisk.

Partie

Partia składa się z jednego lub większej liczby dokumentów, które mogą być powiązane (np. wiele dokumentów dotyczących konkretnego klienta) lub niepowiązane (np. dokumenty rozdzielone arkuszami separującymi).
  • Dokument może się składać z zeskanowanych obrazów lub plików niebędących obrazami, np. programu Microsoft Word lub w formacie PDF.

  • Dokument może (nie musi) zawierać załączniki, takie jak obrazy lub pliki elektroniczne.

Podczas pracy z partią można ją zablokować. Ikona blokady jest wyświetlana, gdy dana partia została zablokowana przez bieżącego lub innego użytkownika. Zwolnienie partii usuwa ikonę blokady i – w zależności od ustawień profilu klienta – umożliwia korzystanie z tej partii innym użytkownikom lub procesorowi systemu.

Profile klienta

Można skanować lub importować grupy stron partiami, korzystając z profilu klienta zdefiniowanego przez menedżera procedur. Profil klienta to grupa ustawień określających sposób skanowania, importowania lub indeksowania dokumentów w partii. Profil klienta:
  • Określa m.in. ustawienia skanera, sposób tworzenia i rozdzielania dokumentów w partii, dostępność pól metadanych, sposób przetwarzania kodów kreskowych oraz sposób postępowania z partią po jej zwolnieniu.

  • Decyduje, czy można tylko przechwytywać dokumenty, przechwytywać je i indeksować czy tylko indeksować.

  • Decyduje, czy elektroniczne pliki niebędące obrazami (na przykład dokumenty PDF) mają pozostać w swoim pierwotnym formacie, mają zostać przekonwertowane do formatu obrazu bądź nie mają być importowane.

  • Służy do określania zestawu wypełnianych pól metadanych, związanego z wybranym dokumentem.

Jeśli profil klienta obejmuje indeksowanie, można przypisać wartości metadanych do dokumentów, takie jak ID i nazwa klienta. Dla zawartych w partii dokumentów różnych typów zazwyczaj są dostępne różne zestawy pól metadanych. Do dokumentów zawartych w partiach "tylko indeksowanie" można przypisywać wartości metadanych, lecz nie można dołączać ani dodawać stron (nie można też ich zamieniać).

Po ukończeniu pracy z dokumentami w partii można tę partię zwolnić, co spowoduje zdjęcie z niej blokady założonej przez bieżącego użytkownika (jeśli nie ma żadnych zdefiniowanych procesów zwalniania). Jeśli użytkownik wybierze dostępny proces zwalniania i zwolni partię, następna czynność wykonywana w odniesieniu do partii będzie zależała od wybranego procesu zwalniania. Dalszy sposób postępowania zależy od ustawień w profilu klienta:
  • Partia może zostać usunięta z listy w okienku partii i przekazana do usługi Oracle Content Management lub umieszczona w kolejce w celu dalszego jej przetwarzania, np. konwersji PDF/TIFF lub rozpoznawania kodów kreskowych.

  • Partia może pozostać na liście jako odblokowana (nie jest wyświetlana ikona blokady). Pozwala to bieżącemu użytkownikowi i innym użytkownikom na zablokowanie tej partii i dokonywanie w niej kolejnych modyfikacji.