Рассмотрим базовый процесс захвата и загрузки контента в Oracle Content Management.
вручную, путем сканирования бумажных (напечатанных) копий документов с помощью ПО Content Capture Client
вручную, путем импорта электронных документов с помощью ПО Content Capture Client,
автоматически из отслеживаемой папки с файлами (через агента импорта файлов),
автоматически из папки входящих сообщений или папки отслеживаемой учетной записи сервера электронной почты.
Обработчик импорта обеспечивает автоматический импорт пакетов из таких источников, как папка файловой системы, текстовый файл списков с разделителями или папка входящих сообщений/папка учетной записи сервера электронной почты. Задание импорта отслеживает источник и импортирует контент с указанной частотой (например, раз в минуту, час или день).
Обработчик преобразования в TIFF автоматически преобразует документы и вложения, не являющиеся изображениями, в формат TIFF или JPEG. Во время преобразования можно объединять документы и вложения различными способами. Например, обработчик преобразования может преобразовывать файлы документов, такие как PDF-документы или документы Microsoft Office, в изображения TIFF для обработки штрихкодов.
Обработчик распознавания автоматически распознает штрихкоды, организует документы и индексирует их.
Обработчик фиксации исполняет профили фиксации для автоматического вывода и загрузки документов в пакет для Oracle Content Management, а затем удаляет пакеты из процедуры.
Профиль фиксации определяет способ вывода документов и их метаданных, а также включает сопоставления полей метаданных, формат вывода, инструкции по обработке ошибок и настройки драйвера фиксации.
Обработчика поиска активов позволяет пользователям клиентов искать поддерживаемые активы в репозитории Oracle Content Management.
Если настроить использование всех обработчиков, каждый из них работает в координации с другими. Многие задачи в потоке пакетов начинаются с обработчика импорта, а затем передаются обработчику преобразования в PDF или TIFF для преобразования документов в настроенные форматы. Затем обработчик распознавания принимает на себя управление для распознавания штрихкодов, упорядочения документов указанными способами и их индексирования. И наконец, обработчик фиксации доставляет (загружает) вывод в Oracle Content Management.
Все захваченные документы загружаются и хранятся в Oracle Content Management в виде отдельных элементов контента с метаданными, назначенными в процессе захвата контента. Эти элементы открыты для доступа и управления в Oracle Content Management, как и любые другие элементы.
Процедуры — это определенные рабочие потоки захвата контента, от первоначального поиска до окончательной загрузки в Oracle Content Management. Каждая процедура представляет комплексную систему захвата контента, обеспечивающую централизованный подход к настройке метаданных, правил обработки, профилей конфигурации и данных пакетов для конкретной среды. Пользователи Content Capture Client создают пакеты и получают доступ к ним в рамках процедуры, к которой им предоставлен доступ.
Вы можете создать для своей организации несколько процедур, чтобы эффективно управлять всеми задачами по захвату и обработке контента, например, с учетом отделов или местоположения. Для оптимального повторного использования можно также предоставить совместный доступ к общим элементам конфигурации. Кроме того, процедуру можно скопировать для упрощения адаптации к другим средам.
Документ может представлять собой отсканированные изображения или электронный файл, например файл Microsoft Word или PDF.
Документ может содержать или не содержать вложения, например изображения или электронные файлы.
Работая с пакетом, его можно заблокировать. Если пакет заблокирован вами или другим пользователем, отображается значок блокировки. При освобождении пакета удаляется значок блокировки, и в зависимости от настроек профиля клиента пакет освобождается для другого пользователя или системного обработчика.
Он определяет настройки сканера, способы создания и разделения документов в пакете, доступность полей метаданных, необходимость и способ обработки штрихкодов, а также действия, выполняемые с пакетами после их освобождения.
Он определяет, можно ли только захватывать документы, захватывать и индексировать документы, или только индексировать документы.
Он определяет способ обработки электронных файлов (например, PDF-документов): сохранять в исходном формате, преобразовывать в формат изображения или не импортировать.
Он определяет набор полей метаданных, которые необходимо заполнить для выбранного документа.
Если профиль клиента включает индексирование, документам можно назначать значения метаданных, такие как идентификатор и имя заказчика. Документы различных типов в пакете обычно обладают различными наборами полей метаданных. Документам, включенным в пакет, предназначенный только для индексирования, можно присваивать значения метаданных, но при этом нельзя добавлять, вставлять или заменять страницы.
Пакет может быть удален из списка на панели "Пакет" и зафиксирован в Oracle Content Management. Также пакет может быть добавлен в очередь для дальнейшей обработки, например для преобразования в PDF/TIFF или распознавания штрихкода.
Пакет может остаться в списке в разблокированном состоянии (при этом значок блокировки не отображается). Это позволяет текущему или другому пользователю заблокировать пакет и вносить дальнейшие изменения.