OCI VisionとOCI Generative AIによる請求書画像の自動化

はじめに

企業は、多くの場合、サプライヤやサービス・プロバイダに由来するスキャンされた画像やPDFとして、数千もの請求書を非構造化形式で受け取ります。請求書番号、顧客名、購入アイテム、合計金額など、これらの請求書からデータを手動で抽出することは、時間がかかり、エラーが発生しやすいプロセスです。

これらの処理の遅延は、買掛金のサイクルやキャッシュ・フローの可視性に影響するだけでなく、コンプライアンス、監査、レポート作成のボトルネックにもなります。

このチュートリアルでは、Oracle Cloud Infrastructure (OCI)のバケットで受信請求書イメージを監視し、OCI Visionを使用してテキスト・コンテンツを抽出し、OCI Generative AI (LLM)を適用して請求書番号、顧客、アイテム・リストなどの構造化された会計データを抽出する自動パイプラインを実装する方法を示します。

このチュートリアルで使用するOCIサービスは次のとおりです。

サービス 目 的
OCI Vision アップロードされた請求書イメージに対してOCRを実行します。
OCI生成AI 少数のショット・プロンプトを使用して、RAW OCRテキストから構造化JSONデータを抽出します。
OCIオブジェクト・ストレージ 入力請求書イメージおよび出力JSON結果を格納します。

目的

前提条件

タスク1: Pythonパッケージの構成

  1. 次のコマンドを使用して、requirements.txtファイルを実行します。

    pip install -r requirements.txt
    
  2. Pythonスクリプト(main.py)を実行します。

  3. 請求書イメージ(.png.jpgなど)を入力バケットにアップロードします。

  4. イメージが処理され、抽出されたJSONが出力バケットに保存されるまで待ちます。

タスク2: コードの理解

タスク3: コードの実行

次のコマンドを使用してコードを実行します。

python main.py

タスク4: テストの提案

  1. 法的製品ラインおよび顧客名を含む実際の請求書またはダミー請求書を使用します。

  2. 入力バケットに複数の画像を順番にアップロードして、自動処理を確認します。

  3. OCIコンソールにログインし、オブジェクト・ストレージに移動して両方のバケットの結果を確認します。

ノート:このチュートリアルでは、ブラジルの請求書を使用して、属性と処理の複雑さ、およびこのケースを解決するためのプロンプトの作成方法を示します。

インボイス

タスク5: 予想される出力の表示

アップロードされた請求書イメージごとに、処理された出力バケット・ファイルを確認します。次の図に示すように、対応する.jsonファイルが構造化コンテンツとともに生成されます。

img.png

ノート:

確認

その他の学習リソース

docs.oracle.com/learnで他のラボを確認するか、Oracle Learning YouTubeチャネルで無料のラーニング・コンテンツにアクセスしてください。また、education.oracle.com/learning-explorerにアクセスして、Oracle Learning Explorerになります。

製品ドキュメントについては、Oracle Help Centerを参照してください。