Przegląd funkcji klasyfikacji dokumentów i ekstrakcji kluczowych wartości

Dostępna w Oracle Cloud Infrastructure (OCI) usługa Document Understanding dostarcza wstępnie wytrenowane modele AI, które mogą wyodrębniać tekst, tabele i inne kluczowe dane z plików dokumentów. Można przeprowadzić klasyfikację dokumentów lub wyodrębnianie kluczowych wartości, a następnie użyć wyodrębnionych danych w analizach wykonywanych w Oracle Analytics.

Usługa Document Understanding umożliwia także tworzenie modeli niestandardowych służących do wyodrębniania kluczowych wartości oraz klasyfikacji dokumentów.

W Oracle Analytics można używać przepływów danych, aby stosować modele AI usługi Document Understanding do swoich danych.

Oracle Analytics obsługuje kilka wstępnie wytrenowanych i niestandardowych modeli AI, które są dostępne w usłudze Document Understanding:
  • Wstępnie wytrenowane modele obsługiwane w Oracle Analytics
    • Klasyfikacja dokumentów
    • Ekstrakcja kluczowych wartości (z paragonów, faktur, praw jazdy i paszportów)
  • Modele niestandardowe obsługiwane w Oracle Analytics
    • Klasyfikacja dokumentów niestandardowych
    • Ekstrakcja niestandardowych wartości kluczowych

Zanim modeli niestandardowych będzie można używać w Oracle Analytics, należy je skonfigurować i skompilować w konsoli OCI. Najpierw należy użyć usługi OCI Data Labeling, aby utworzyć dobry zbiór danych, za pomocą którego będzie można wytrenować model, a następnie skompilować model niestandardowy. Zob. OCI Document Understanding - modele niestandardowe.

Przykładowe dane wyjściowe z modelu klasyfikacji dokumentów

W tym przykładzie w ramach przepływu danych do dokumentów w formacie JPG jest stosowany wstępnie wytrenowany model klasyfikacji dokumentów w celu ustalenia, czy przedstawiają one paragony. Wyniki analizy są umieszczane w zbiorze danych. Zbiór danych zawiera wartość "RECEIPT" (paragon) dla właściwości "Document Type" oraz poziom predykcji "Confidence" dla każdego dokumentu.


Opis "GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png" znajduje się poniżej
.png"

Przed rozpoczęciem: