機械翻訳について

文書理解処理による請求書PDF文書からのコンテンツの抽出

AIを使用して、ドキュメント理解アクションで請求書、領収書、パスポートおよび運転免許から情報を抽出できます。 この項では、請求書の情報をPDF形式で正確に把握し、それをOracle IntegrationのJSON形式に変換する方法について、高度なユースケースを示します。

ドキュメント理解アクションを使用するためのすべての前提条件が完了していることを確認します。 「文書理解処理を使用した文書情報の抽出」を参照してください。

  1. アプリケーション統合を作成します。
  2. 「RESTアダプタ」を統合キャンバスにドラッグします。
  3. 「RESTアダプタ」を構成します。
    1. 「基本情報」ページで名前を入力します。
    2. 「リソース構成」ページで、必要な情報を指定します。 たとえば:
      • 相対リソースURLを入力: /process
      • 「POST」アクションを選択します。
      • 「このエンドポイントのリクエスト・ペイロードの構成」を選択します。
    3. 「リクエスト」の構成ページで、リクエスト・ペイロード形式として「バイナリ」を選択します。
    4. ウィザードを完了します。
  4. 「アクション」 統合アクション・アイコンをクリックし、「OCI Document Understanding」アクションを統合キャンバスにドラッグします。
  5. ウィザードに次の情報を入力します。
    1. 名前とオプションの説明を入力します。
    2. 「カテゴリの選択」リストから、「事前トレーニング済モデル」を選択します。
    3. 「アクション」リストから「ドキュメントの分析」を選択し、「続行」をクリックします。
    4. 「コンパートメント名」リストから、インスタンスが実行されているコンパートメントを選択します。
    5. 「文書タイプ」リストから、「請求書」を選択します。
  6. マッパーを開きます。 請求書PDF文書は、base-64形式で送信する必要があります。
  7. ターゲットの「ドキュメント」要素を展開します。
  8. 「データ」を右クリックし、「ターゲット・ノードの作成」を選択します。
  9. ターゲット・セクションで、「関数」 マッパー関数アイコンをクリックします。
  10. 式ビルダーで、「設計ビュー」 ビューのスイッチアイコンをクリックします。
  11. 「関数」セクションで、「上級」を展開し、encodeReferenceToBase64を式ビルダーにドラッグします。 このステップは、サポートされているすべての文書タイプ(請求書、領収書、運転免許およびパスポート)からデータを抽出するために必要です。
  12. 「ストリーム参照」「ソース」セクションから式ビルダーのencodeReferenceToBase64 ()関数にマップします。


    マッパーには、「ソース」、「マッピング」キャンバスおよび「ターゲット」セクションが表示されます。 ターゲットの「関数」リストが表示されます。 encodeReferenceToBase64関数が選択されています。 encodeReferenceToBase64関数は、下部にある式ビルダーに表示されます。 ソース・ストリーム参照が関数にドラッグされました。

  13. 統合キャンバスに戻ります。 このアクションは式を検証します。
  14. ビジネス識別子を割り当てます。


    「ビジネス識別子」セクションが表示されます。 左側では、入力ソース・ツリーが展開され、http.request.methodが選択されています。 そのパラメータは「プライマリ・ビジネス識別子」フィールドにドラッグされています。

  15. 統合を保存してアクティブ化します。
  16. 「アクション」 「アクション」アイコンメニューから、「実行」を選択します。
  17. 「リクエスト」セクションの「本文」タブで、「ファイル」「ブラウズ」の順にクリックします。
  18. 請求書のPDFファイルをアップロードします。
  19. 「実行」をクリックします。
  20. 処理が完了したら、アクティビティ・ストリームの呼出し接続を展開します。
  21. ペイロードをスクロールして、請求書PDF文書のフィールドがJSON形式に変換されたことを確認します。


    アクティビティ・ストリームが表示されます。 ProcessDocumentの起動が展開され、PDFのフィールドがJSON形式で表示されます。 この例では、amountDue、billingAddress、billingAddressRecipient、customerAddress、customerAddressRecipient、customerId、customerName、customerTaxId、dueDateおよびinvoiceDateが表示されています。

    ログ・アクションはこの統合に追加されませんでした。 ただし、インテグレーションの最後に1つ追加すると、ドキュメント理解APIによって出力として返されるフィールドも確認できます。 請求書は、次の特定のフィールドを返します。 返されるフィールドは異なり、ウィザードで選択したドキュメント・タイプ(受領書、運転免許証またはパスポート)ごとにログ・アクションに表示されます。 「APIを使用した分析」を参照してください。


    「ログ出力の構成」パネルが表示されます。 「ログ」リストで、「常に」が選択されています。 左側に「入力ソース」タブが表示されます。 AnalyzeDocumentActionResponseが展開され、amountDue、billingAddress、billingAddressRecipient、customerAddress、customerAddressRecipient、customerId、customerNameおよびcustomerTaxIdという名前のフィールドが表示されます。