ノート:

OCI生成AIを使用したLlama光学式文字認識Webアプリケーションの構築

はじめに

Llama Optical Character Recognition(OCR)が好きな開発者、クラウド・アーキテクト、またはAI愛好家であれば、このチュートリアルはあなたのためのものです。このチュートリアルでは、次のような単純なLlama OCR Webアプリケーションを作成します。

目的

次のことを可能にするWebユーザー・インタフェース(UI)を構築します。

前提条件

タスク1: Pythonコードのダウンロードと構成ファイルの設定

  1. llama-ocr-oci.pyからコードをダウンロードします

  2. ファイル~/.oci/configに、その名前を使用して正しい構成プロファイルが構成されていることを確認します。たとえば、OCI_PROFILEです。

タスク2: 仮想環境の設定

仮想環境を作成すると、依存関係が分離され、Streamlit OCRアプリがシステム上の他のPythonプロジェクトに干渉しないことが保証されます。

タスク3: アプリケーションの起動

アプリケーションを起動するには、次のコマンドを実行します。

streamlit run ocr_vision_app.py

アプリケーションの起動がブラウザに表示されます。

アプリケーション

タスク4: イメージのアップロードおよびテキストの抽出

  1. 「OCI構成プロファイルの選択」で、ドロップダウン・メニューから構成プロファイルを選択します。

  2. 「コンパートメントOCIDの入力」に、OCI生成AIサービスへのアクセス権があるコンパートメントOracle Cloud Identifier (OCID)を入力します。

  3. 「ビジョン・モデルの選択」で、モデルを選択します。

  4. 「アップロード」をクリックし、イメージ(受領書、請求書、スクリーンショット)を選択します。

    アプリケーションはイメージを処理し、抽出されたテキストを表示します。

    解析中

確認

その他の学習リソース

docs.oracle.com/learnで他のラボを確認するか、Oracle Learning YouTubeチャネルで無料のラーニング・コンテンツにアクセスしてください。また、education.oracle.com/learning-explorerにアクセスして、Oracle Learning Explorerになります。

製品ドキュメントについては、Oracle Help Centerを参照してください。