ドキュメント分類
文書分類を使用して文書を分類できます。
Document Understandingは、分析されたドキュメントで可能なドキュメント・タイプのリストを提供します。各文書タイプには信頼度スコアがあります。信頼度スコアは10進数です。スコアが1に近いと、抽出されたテキストの信頼性が高いことを示しますが、スコアが小さいと信頼度スコアが低くなります。各ラベルの信頼度スコアの範囲は0から1です。使用可能な文書タイプのリストは、次のとおりです。
- 請求書
- 受入
- 採用情報
- 税金フォーム
- ライセンス
- パスポート
- 銀行取引明細書
- 小切手
- 給与明細
- その他
サポートされている機能は次のとおりです。
- 文書の分類
- 信頼度スコア
- 単一リクエスト
- バッチ要求
ドキュメント分類の例
ドキュメント理解でのドキュメント分類の使用例。
- 入力ドキュメント
-
ドキュメント分類入力
APIリクエスト:
{ "processorConfig": { "processorType": "GENERAL", "features": [ { "featureType": "DOCUMENT_CLASSIFICATION", "maxResults": 5 } ] }, "inputLocation": { "sourceType": "OBJECT_STORAGE_LOCATIONS", "objectLocations": [ { "source": "OBJECT_STORAGE", "namespaceName": "", "bucketName": "", "objectName": "" } ] }, "compartmentId": "", "outputLocation": { "namespaceName": "", "bucketName": "", "prefix": "" } }
- 出力:
- APIレスポンス:
{ "documentMetadata": { "pageCount": 1, "mimeType": "image/jpeg" }, "pages": [ { "pageNumber": 1, "dimensions": { "width": 361, "height": 600, "unit": "PIXEL" }, "detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 }, { "documentType": "TAX_FORM", "confidence": 6.465067e-9 }, { "documentType": "CHECK", "confidence": 6.031838e-9 }, { "documentType": "BANK_STATEMENT", "confidence": 5.413888e-9 }, { "documentType": "PASSPORT", "confidence": 1.5554872e-9 } ], ... detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 } ], ...