ドキュメント分類

文書分類を使用して文書を分類できます。

Document Understandingは、分析されたドキュメントで可能なドキュメント・タイプのリストを提供します。各文書タイプには信頼度スコアがあります。信頼度スコアは10進数です。スコアが1に近いと、抽出されたテキストの信頼性が高いことを示しますが、スコアが小さいと信頼度スコアが低くなります。各ラベルの信頼度スコアの範囲は0から1です。使用可能な文書タイプのリストは、次のとおりです。
  • 請求書
  • 受入
  • 採用情報
  • 税金フォーム
  • ライセンス
  • パスポート
  • 銀行取引明細書
  • 小切手
  • 給与明細
  • その他
サポートされている機能は次のとおりです。
  • 文書の分類
  • 信頼度スコア
  • 単一リクエスト
  • バッチ要求

ドキュメント分類の例

ドキュメント理解でのドキュメント分類の使用例。

入力ドキュメント
ドキュメント分類入力税金、小計および合計金額の2つの明細品目を含む架空カフェからの受入。 APIリクエスト:
{ 
            "processorConfig": {   
            "processorType": "GENERAL",  
            "features": [    
            {   
            "featureType": "DOCUMENT_CLASSIFICATION",    
            "maxResults": 5   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [  
            {    
            "source": "OBJECT_STORAGE",   
            "namespaceName": "",   
            "bucketName": "",    
            "objectName": ""  
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
出力:
APIレスポンス:
{ "documentMetadata":
            { "pageCount": 1,
            "mimeType": "image/jpeg" },
            "pages":
            [ { "pageNumber": 1,
            "dimensions": 
            { "width": 361,
            "height": 600,
            "unit": "PIXEL" },
            "detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 },
            { "documentType": "TAX_FORM",
            "confidence": 6.465067e-9 },
            { "documentType": "CHECK",
            "confidence": 6.031838e-9 },
            { "documentType": "BANK_STATEMENT",
            "confidence": 5.413888e-9 },
            { "documentType": "PASSPORT",
            "confidence": 1.5554872e-9 } ],
            ...
            detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 } ], ...