2 Общие сведения о работе Content Capture

Рассмотрим базовый процесс захвата и загрузки контента в Oracle Content Management.

Показывает обработку документов с первого этапа до последнего

Источники

Контент может быть захвачен из различных источников:

Обработчики

Независимо от источника каждый полученный документ направляется через несколько обработчиков перед загрузкой в Oracle Content Management для хранения и/или дальнейшей обработки:
  • Обработчик импорта обеспечивает автоматический импорт пакетов из таких источников, как папка файловой системы, текстовый файл списков с разделителями или папка входящих сообщений/папка учетной записи сервера электронной почты. Задание импорта отслеживает источник и импортирует контент с указанной частотой (например, раз в минуту, час или день).

  • Обработчик преобразования в TIFF автоматически преобразует документы и вложения, не являющиеся изображениями, в формат TIFF или JPEG. Во время преобразования можно объединять документы и вложения различными способами. Например, обработчик преобразования может преобразовывать файлы документов, такие как PDF-документы или документы Microsoft Office, в изображения TIFF для обработки штрихкодов.

  • Обработчик преобразования в PDF преобразует документы, изображения и вложения в PDF-файлы.
  • Обработчик распознавания автоматически распознает штрихкоды, организует документы и индексирует их.

  • Обработчик фиксации исполняет профили фиксации для автоматического вывода и загрузки документов в пакет для Oracle Content Management, а затем удаляет пакеты из процедуры.

    Профиль фиксации определяет способ вывода документов и их метаданных, а также включает сопоставления полей метаданных, формат вывода, инструкции по обработке ошибок и настройки драйвера фиксации.

  • Обработчика поиска активов позволяет пользователям клиентов искать поддерживаемые активы в репозитории Oracle Content Management.

  • Обработчик преобразования XML позволяет пользователям-клиентам преобразовывать документы XML в документы требуемого стиля на основе XSLT-файла.

Если настроить использование всех обработчиков, каждый из них работает в координации с другими. Многие задачи в потоке пакетов начинаются с обработчика импорта, а затем передаются обработчику преобразования в PDF или TIFF для преобразования документов в настроенные форматы. Затем обработчик распознавания принимает на себя управление для распознавания штрихкодов, упорядочения документов указанными способами и их индексирования. И наконец, обработчик фиксации доставляет (загружает) вывод в Oracle Content Management.

Все захваченные документы загружаются и хранятся в Oracle Content Management в виде отдельных элементов контента с метаданными, назначенными в процессе захвата контента. Эти элементы открыты для доступа и управления в Oracle Content Management, как и любые другие элементы.

Процедуры

Процедуры — это определенные рабочие потоки захвата контента, от первоначального поиска до окончательной загрузки в Oracle Content Management. Каждая процедура представляет комплексную систему захвата контента, обеспечивающую централизованный подход к настройке метаданных, правил обработки, профилей конфигурации и данных пакетов для конкретной среды. Пользователи Content Capture Client создают пакеты и получают доступ к ним в рамках процедуры, к которой им предоставлен доступ.

Вы можете создать для своей организации несколько процедур, чтобы эффективно управлять всеми задачами по захвату и обработке контента, например, с учетом отделов или местоположения. Для оптимального повторного использования можно также предоставить совместный доступ к общим элементам конфигурации. Кроме того, процедуру можно скопировать для упрощения адаптации к другим средам.

Пакеты

Пакет включает один или несколько документов, которые могут быть связаны (например, несколько документов для одного и того же заказчика) или не связаны (например, документы, разделенные с помощью листов-разделителей).
  • Документ может представлять собой отсканированные изображения или электронный файл, например файл Microsoft Word или PDF.

  • Документ может содержать или не содержать вложения, например изображения или электронные файлы.

Работая с пакетом, его можно заблокировать. Если пакет заблокирован вами или другим пользователем, отображается значок блокировки. При освобождении пакета удаляется значок блокировки, и в зависимости от настроек профиля клиента пакет освобождается для другого пользователя или системного обработчика.

Профили клиента

Вы можете сканировать или импортировать группы страниц в пакетах, используя профиль клиента, определенный для вас менеджером процедуры. А Профиль клиента — это группа настроек, определяющая способ сканирования, импорта или индексирования документов в пакете. Профиль клиента отвечает за следующее:
  • Он определяет настройки сканера, способы создания и разделения документов в пакете, доступность полей метаданных, необходимость и способ обработки штрихкодов, а также действия, выполняемые с пакетами после их освобождения.

  • Он определяет, можно ли только захватывать документы, захватывать и индексировать документы, или только индексировать документы.

  • Он определяет способ обработки электронных файлов (например, PDF-документов): сохранять в исходном формате, преобразовывать в формат изображения или не импортировать.

  • Он определяет набор полей метаданных, которые необходимо заполнить для выбранного документа.

Если профиль клиента включает индексирование, документам можно назначать значения метаданных, такие как идентификатор и имя заказчика. Документы различных типов в пакете обычно обладают различными наборами полей метаданных. Документам, включенным в пакет, предназначенный только для индексирования, можно присваивать значения метаданных, но при этом нельзя добавлять, вставлять или заменять страницы.

После завершения работы с документами в пакете освободите пакет. При этом он освобождается исключительного использования (если не определены процессы освобождения). Если вы освобождаете пакет и при этом выбран доступный процесс освобождения, с пакетом выполняется следующее действие, определяемое выбранным процессом освобождения. Последующие действия зависят от настроек профиля клиента.
  • Пакет может быть удален из списка на панели "Пакет" и зафиксирован в Oracle Content Management. Также пакет может быть добавлен в очередь для дальнейшей обработки, например для преобразования в PDF/TIFF или распознавания штрихкода.

  • Пакет может остаться в списке в разблокированном состоянии (при этом значок блокировки не отображается). Это позволяет текущему или другому пользователю заблокировать пакет и вносить дальнейшие изменения.