Wykonywanie klasyfikacji dokumentów i ekstrakcji kluczowych wartości

Dzięki wykorzystaniu wstępnie wytrenowanych modeli OCI Document Understanding nawet osoby niemające doświadczenia w dziedzinie uczenia maszynowego (ML) lub sztucznej inteligencji (AI) mogą konstruować funkcje klasyfikacji dokumentów i ekstrakcji kluczowych wartości oraz używać ich w swoich aplikacjach. Na przykład można używać funkcji klasyfikacji dokumentów w celu identyfikowania paszportów, praw jazdy, paragonów i faktur.

Uwaga: usługa OCI Document Understanding obecnie obsługuje tylko język angielski. Zob. Ograniczenia dotyczące usługi Document Understanding.
Jeśli liczba dokumentów dla wstępnie wytrenowanego modelu nie przekracza 10 000, a dla modelu niestandardowego nie przekracza 2000, można przetworzyć je w ramach jednego przepływu danych. Jeśli liczba dokumentów przekracza te limity, należy dla każdego z koszyków utworzyć osobny przepływ danych (czyli użyć osobnego zbioru danych dla każdego koszyka), a następnie użyć sekwencji w celu sekwencyjnego przetworzenia tych przepływów danych. Zob. Przetwarzanie danych za pomocą sekwencji przepływów danych.
Wymagania wstępne:
  1. Na stronie startowej Oracle Analytics kliknąć kolejno Utwórz i Przepływ danych.
  2. Wybrać zbiór danych powiązany z dokumentami, które mają zostać przeanalizowane, a następnie kliknąć Dodaj.

  3. W edytorze przepływu danych kliknąć na węźle Dodaj etap (+).
  4. W okienku "Etapy przepływu danych" kliknąć dwukrotnie Stosowanie modelu AI, po czym wybrać model, który ma być używany.
    Na przykład można wybrać wstępnie przeszkolony model klasyfikacji dokumentów w celu identyfikowania paszportów.
  5. W oknie dialogowym Stosowanie modelu AI przejść do sekcji Dane wejściowe, a następnie skonfigurować parametry Kolumna wejściowa i Typ wejściowy.
    • Jeśli odwołanie do dokumentów źródłowych następuje na podstawie koszyka, wybrać z listy Kolumna wejściowa opcję URL, a z listy Typ wejściowy - opcję Koszyki.

    • Jeśli odwołanie do dokumentów źródłowych następuje indywidualnie, wybrać z listy Kolumna wejściowa opcję Lokalizacja pliku, a z listy Typ wejściowy - opcję Dokumenty.
  6. W edytorze przepływu danych kliknąć na węźle Dodaj etap (+), po czym wybrać Zapisywanie danych.
  7. W polu Nazwa wprowadzić nazwę wyjściowego zbioru danych.
    Na przykład można wywołać zbiór danych "Wyniki analizy identyfikacji paszportów".
  8. W polu Zapisz dane w określić lokalizację wyjściowego zbioru danych.
  9. Kliknąć Zapisz, wprowadzić nazwę przepływu danych i kliknąć OK.
  10. Kliknąć Uruchom przepływ danych.
Gdy analiza z użyciem przepływu danych zostanie ukończona, otworzyć zbiór danych określony w punkcie 7.

Aby zlokalizować wygenerowany zbiór danych, należy na stronie startowej Oracle Analytics przejść kolejno do Dane i Zbiory danych.
Opis "GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png" znajduje się poniżej
.png"

Więcej informacji dotyczących wygenerowanych wyników: Dane wyjściowe generowane dla modeli OCI Document Understanding.