Dokumentklassifikation
Die Dokumentklassifizierung kann zur Klassifizierung eines Dokuments verwendet werden.
Document Understanding enthält eine Liste möglicher Dokumenttypen für das analysierte Dokument. Jeder Dokumenttyp hat einen Konfidenzscore. Der Konfidenzscore ist eine Dezimalzahl. Punkte, die näher an 1 liegen, weisen auf eine höhere Sicherheit im extrahierten Text hin, während niedrigere Scores auf einen niedrigeren Konfidenzscore hinweisen. Der Bereich des Konfidenzscores für jedes Label liegt zwischen 0 und 1. Die Liste der möglichen Dokumenttypen lautet:
- Rechnung
- Zahlung
- Lebenslauf
- Steuerformular
- Führerschein
- Passport
- Kontoauszug
- Check
- Verdienstnachweis
- Weitere
Folgende Features werden unterstützt:
- Dokument klassifizieren
- Sicherheitsscore
- Einzelne Anforderung
- Batchanforderung
Beispiel für eine Dokumentklassifizierung
Ein Beispiel für die Verwendung der Dokumentklassifizierung in Document Understanding.
- Eingabedokument
-
API-Anforderung für Dokumentklassifizierungseingabe
:
{ "processorConfig": { "processorType": "GENERAL", "features": [ { "featureType": "DOCUMENT_CLASSIFICATION", "maxResults": 5 } ] }, "inputLocation": { "sourceType": "OBJECT_STORAGE_LOCATIONS", "objectLocations": [ { "source": "OBJECT_STORAGE", "namespaceName": "", "bucketName": "", "objectName": "" } ] }, "compartmentId": "", "outputLocation": { "namespaceName": "", "bucketName": "", "prefix": "" } }
- Ausgabe:
- API-Antwort:
{ "documentMetadata": { "pageCount": 1, "mimeType": "image/jpeg" }, "pages": [ { "pageNumber": 1, "dimensions": { "width": 361, "height": 600, "unit": "PIXEL" }, "detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 }, { "documentType": "TAX_FORM", "confidence": 6.465067e-9 }, { "documentType": "CHECK", "confidence": 6.031838e-9 }, { "documentType": "BANK_STATEMENT", "confidence": 5.413888e-9 }, { "documentType": "PASSPORT", "confidence": 1.5554872e-9 } ], ... detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 } ], ...