Panoramica sulla classificazione dei documenti e sull'estrazione del valore chiave

Nell'infrastruttura Oracle Cloud (OCI), Document Understanding fornisce modelli AI pre-addestrati in grado di estrarre testo, tabelle e altri dati chiave dai file di documenti. È possibile eseguire la classificazione dei documenti o l'estrazione dei valori chiave su un documento, quindi utilizzare i dati estratti come parte dell'analisi in Oracle Analytics.

Document Understanding consente inoltre di creare modelli personalizzati per l'estrazione dei valori chiave e la classificazione dei documenti.

In Oracle Analytics, è possibile utilizzare i flussi dati per applicare ai dati i modelli AI di Document Understanding.

Oracle Analytics supporta diversi modelli AI pre-addestrati e personalizzati disponibili da Document Understanding:
  • Modelli pre-addestrati supportati in Oracle Analytics
    • Classificazione dei documenti
    • Estrazione dei valori chiave (per ricevute, fatture, ID conducente e passaporti)
  • Modelli personalizzati supportati in Oracle Analytics
    • Classificazione personalizzata dei documenti
    • Estrazione del valore chiave personalizzato

È necessario impostare e creare modelli personalizzati in OCI Console prima di poterli utilizzare in Oracle Analytics. Innanzitutto, utilizzare OCI Data Labeling per creare un data set ottimale da usare per addestrare il modello, quindi creare il modello personalizzato. Vedere OCI Document Understanding - Modelli personalizzati.

Output di esempio di un modello di classificazione dei documenti

In questo esempio, un flusso dati applica un modello pre-addestrato di classificazione dei documenti ai documenti in formato JPG per prevedere se si tratta di ricevute e restituisce i risultati dell'analisi in un data set. Il data set include un valore RECEIPT per "Tipo di documento" e un livello di previsione "Confidenza" per ogni documento.


Segue la descrizione di GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png
.png

Prima di iniziare effettuare le operazioni riportate di seguito.