Classificazione documento

La classificazione del documento può essere utilizzata per classificare un documento.

Document Understanding fornisce un elenco di possibili tipi di documento per il documento analizzato. Ogni tipo di documento ha un punteggio di affidabilità. Il punteggio di affidabilità è un numero decimale. I punteggi più vicini a 1 indicano una maggiore fiducia nel testo estratto, mentre i punteggi più bassi indicano un punteggio di affidabilità più basso. L'intervallo del punteggio di affidabilità per ogni etichetta è compreso tra 0 e 1. L'elenco dei possibili tipi di documento è il seguente:
  • Fattura
  • Ricevuta
  • CV o curriculum vitae
  • Modulo fiscale
  • Patente di guida
  • Passport
  • Dichiarazione bancaria
  • Seleziona
  • Cedolino
  • Altro
Di seguito sono riportate le funzioni supportate.
  • Classifica documento
  • Punteggio affidabilità
  • Richiesta singola
  • Richiesta batch

Esempio di classificazione dei documenti

Esempio di classificazione dei documenti utilizzato in Document Understanding.

Documento di input
Richiesta API Ricevuta da un bar fittizio, tra cui due voci riga, imposta, totale parziale e importi totali. input classificazione documento:
{ 
            "processorConfig": {   
            "processorType": "GENERAL",  
            "features": [    
            {   
            "featureType": "DOCUMENT_CLASSIFICATION",    
            "maxResults": 5   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [  
            {    
            "source": "OBJECT_STORAGE",   
            "namespaceName": "",   
            "bucketName": "",    
            "objectName": ""  
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
output:
Risposta API:
{ "documentMetadata":
            { "pageCount": 1,
            "mimeType": "image/jpeg" },
            "pages":
            [ { "pageNumber": 1,
            "dimensions": 
            { "width": 361,
            "height": 600,
            "unit": "PIXEL" },
            "detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 },
            { "documentType": "TAX_FORM",
            "confidence": 6.465067e-9 },
            { "documentType": "CHECK",
            "confidence": 6.031838e-9 },
            { "documentType": "BANK_STATEMENT",
            "confidence": 5.413888e-9 },
            { "documentType": "PASSPORT",
            "confidence": 1.5554872e-9 } ],
            ...
            detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 } ], ...