Выполнение классификации документов и извлечение ключевых значений

Используйте предварительно обученные модели OCI Document Understanding для классификации документов и извлечения ключевых значений в свои приложения без использования машинного обучения (МО) или искусственного интеллекта (ИИ). Например, можно использовать классификацию документов для определения паспортов, водительских прав, чеков или счетов.

Примечание. В настоящий момент сервис OCI Document Understanding поддерживает только английский язык. См. раздел "Ограничения для сервиса Document Understanding".
Если у вас меньше 10 000 документов для предварительно обученной модели или меньше 2000 документов для пользовательской модели, их можно обработать в одном потоке данных. Если у вас больше указанного числа документов, создайте отдельный поток данных для обработки каждого контейнера (т. е. отдельный набор данных для каждого контейнера) и используйте последовательность для последовательной обработки нескольких потоков данных. См. раздел "Обработка данных с помощью последовательности потоков данных".
Предварительные условия:
  1. На главной странице Oracle Analytics нажмите Создать, а затем выберите Поток данных.
  2. Выберите набор данных, связанный с документами, которые необходимо проанализировать, и нажмите Добавить.

  3. В редакторе потоков данных нажмите Добавить шаг (+).
  4. На панели "Шаги потоков данных" дважды щелкните Применить модель ИИ, а затем выберите модель для использования.
    Например, можно выбрать "Предварительно обученная классификацию документов" для определения паспортов.
  5. В разделе "Применить модель ИИ" перейдите в раздел "Входные данные" и настройте параметры Столбец ввода и Тип ввода.
    • Если вы ссылаетесь на исходные документы по контейнеру, в поле Столбец ввода выберите URL-адрес, а в поле Тип ввода выберите Контейнеры.

    • Если вы ссылаетесь на исходные документы по отдельности, в поле Столбец ввода выберите Расположение файла, а в поле Тип ввода выберите Документы.
  6. В редакторе потоков данных нажмите Добавить шаг (+) и выберите Сохранить данные.
  7. В поле Имя введите имя выходного набора данных.
    Например, набор данных можно назвать "Результаты анализа идентификации паспортов".
  8. В поле Сохранить данные в, укажите расположение выходного набора данных.
  9. Нажмите Сохранить, введите имя потока данных и нажмите OK.
  10. Нажмите Запустить поток данных.
После завершения анализа потока данных откройте набор данных, указанный в ходе выполнения шага 7.

Чтобы найти созданный набор данных, на главной странице Oracle Analytics перейдите в раздел Данные, а затем выберите Наборы данных.
Описание GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png ниже
.png

Подробнее о полученных результатах см. в разделе Выходные данные, генерируемые для моделей OCI Document Understanding.