Используйте предварительно обученные модели OCI Document Understanding для классификации документов и извлечения ключевых значений в свои приложения без использования машинного обучения (МО) или искусственного интеллекта (ИИ). Например, можно использовать классификацию документов для определения паспортов, водительских прав, чеков или счетов.
Если у вас меньше 10 000 документов для предварительно обученной модели или меньше 2000 документов для пользовательской модели, их можно обработать в одном потоке данных. Если у вас больше указанного числа документов, создайте отдельный поток данных для обработки каждого контейнера (т. е. отдельный набор данных для каждого контейнера) и используйте последовательность для последовательной обработки нескольких потоков данных. См. раздел "
Обработка данных с помощью последовательности потоков данных".
- На главной странице Oracle Analytics нажмите Создать, а затем выберите Поток данных.
- Выберите набор данных, связанный с документами, которые необходимо проанализировать, и нажмите Добавить.
- В редакторе потоков данных нажмите Добавить шаг (+).
- На панели "Шаги потоков данных" дважды щелкните Применить модель ИИ, а затем выберите модель для использования.
Например, можно выбрать "Предварительно обученная классификацию документов" для определения паспортов.
- В разделе "Применить модель ИИ" перейдите в раздел "Входные данные" и настройте параметры Столбец ввода и Тип ввода.
- Если вы ссылаетесь на исходные документы по контейнеру, в поле Столбец ввода выберите URL-адрес, а в поле Тип ввода выберите Контейнеры.
- Если вы ссылаетесь на исходные документы по отдельности, в поле Столбец ввода выберите Расположение файла, а в поле Тип ввода выберите Документы.
- В редакторе потоков данных нажмите Добавить шаг (+) и выберите Сохранить данные.
- В поле Имя введите имя выходного набора данных.
Например, набор данных можно назвать "Результаты анализа идентификации паспортов".
- В поле Сохранить данные в, укажите расположение выходного набора данных.
- Нажмите Сохранить, введите имя потока данных и нажмите OK.
- Нажмите Запустить поток данных.