Dokumentklassifikation

Die Dokumentklassifizierung kann zur Klassifizierung eines Dokuments verwendet werden.

Document Understanding enthält eine Liste möglicher Dokumenttypen für das analysierte Dokument. Jeder Dokumenttyp hat einen Konfidenzscore. Der Konfidenzscore ist eine Dezimalzahl. Punkte, die näher an 1 liegen, weisen auf eine höhere Sicherheit im extrahierten Text hin, während niedrigere Scores auf einen niedrigeren Konfidenzscore hinweisen. Der Bereich des Konfidenzscores für jedes Label liegt zwischen 0 und 1. Die Liste der möglichen Dokumenttypen lautet:
  • Rechnung
  • Zahlung
  • Lebenslauf
  • Steuerformular
  • Führerschein
  • Passport
  • Kontoauszug
  • Check
  • Verdienstnachweis
  • Weitere
Folgende Features werden unterstützt:
  • Dokument klassifizieren
  • Sicherheitsscore
  • Einzelne Anforderung
  • Batchanforderung

Beispiel für eine Dokumentklassifizierung

Ein Beispiel für die Verwendung der Dokumentklassifizierung in Document Understanding.

Eingabedokument
API-Anforderung für Dokumentklassifizierungseingabe Quittung aus einem fiktiven Café, einschließlich zwei Positionen, Steuer, Zwischensumme und Gesamtbeträge.:
{ 
            "processorConfig": {   
            "processorType": "GENERAL",  
            "features": [    
            {   
            "featureType": "DOCUMENT_CLASSIFICATION",    
            "maxResults": 5   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [  
            {    
            "source": "OBJECT_STORAGE",   
            "namespaceName": "",   
            "bucketName": "",    
            "objectName": ""  
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Ausgabe:
API-Antwort:
{ "documentMetadata":
            { "pageCount": 1,
            "mimeType": "image/jpeg" },
            "pages":
            [ { "pageNumber": 1,
            "dimensions": 
            { "width": 361,
            "height": 600,
            "unit": "PIXEL" },
            "detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 },
            { "documentType": "TAX_FORM",
            "confidence": 6.465067e-9 },
            { "documentType": "CHECK",
            "confidence": 6.031838e-9 },
            { "documentType": "BANK_STATEMENT",
            "confidence": 5.413888e-9 },
            { "documentType": "PASSPORT",
            "confidence": 1.5554872e-9 } ],
            ...
            detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 } ], ...