附註:
- 此教學課程需要存取 Oracle Cloud。若要註冊免費帳戶,請參閱開始使用 Oracle Cloud Infrastructure Free Tier 。
- 其使用 Oracle Cloud Infrastructure 證明資料、租用戶以及區間的範例值。完成實驗室時,請將這些值替代為雲端環境特定的值。
使用 OCI Generative AI 建置 Llama 光學文字辨識 Web 應用程式
簡介
如果您是喜歡 Llama 光學文字辨識 (OCR) 的開發人員、雲端架構師或 AI 愛好者,則此教學課程為您服務。在本教學課程中,您將建置簡單的 Llama OCR Web 應用程式,包括:
-
使用 Oracle Cloud Infrastructure (OCI) Generative AI 的願景,即 Meta 的大型語言模型 (LLM)。
-
從影像擷取結構化文字 (例如收據、掃描表單)。
-
使用 Streamlit 在您的機器本機執行。
-
不需要任何前端編碼。
目標
我們將建立 Web 使用者介面 (UI),讓您可以:
-
在應用程式中上傳影像 (收據、發票、螢幕擷取畫面)。
-
使用 LLM 從影像取得擷取的 Markdown 輸出。
-
檢視並複製結構化文字。
必備條件
-
設定 Oracle Cloud Infrastructure 命令行介面 (OCI CLI) (
~/.oci/config
)。 -
存取區域中的 OCI Generative AI 服務。
使用 OCI Generative AI 的區域
區域 名稱 位置 區域 ID 區域索引鍵 巴西東部 (聖保羅) 聖保羅 sa-saopaulo-1 GRU 德國中部 (法蘭克福) 法蘭克福 eu-frankfurt-1 FRA 日本中部 (大阪) 大阪 ap-osaka-1 KIX 阿拉伯聯合大公國東部 (杜拜) 杜拜 me-dubai-1 DXB 英國南部 (倫敦) London uk-london-1 LHR 美國中西部 (芝加哥) Chicago us- 芝加哥 -1 訂單 -
部署具備視覺功能的模型 (例如
meta.llama-3.2-90b-vision-instruct
、llama 4
)。 -
安裝 Python
version 3.8
或更新版本且需要 Python 套裝軟體。
工作 1:下載 Python 程式碼並設定組態檔
-
請從此處下載程式碼:
llama-ocr-oci.py
-
請確定檔案
~/.oci/config
中設定的組態設定檔名稱正確。例如,OCI_PROFILE
。
工作 2:設定虛擬環境
建立虛擬環境有助於隔離相依性,並確保您的 Streamlit OCR 應用程式不會干擾您系統上的其他 Python 專案。
-
Windows:執行下列命令。
-
開啟命令提示字元 (
cmd
) 或 PowerShell,然後瀏覽至您的專案資料夾。cd path\\to\\your\\project
-
建立虛擬環境。
python -m venv venv
-
啟用虛擬環境。
venv\\Scripts\\activate
-
安裝相依性。
pip install streamlit oci
-
-
macOS/Linux :執行下列命令。
-
開啟 [Terminal] (終端機),瀏覽至您的專案目錄。
cd ~/path/to/your/project
-
建立虛擬環境。
python3 -m venv venv
-
啟用虛擬環境。
source venv/bin/activate
-
安裝相依性。
pip install streamlit oci
-
作業 3:啟動應用程式
執行下列命令以啟動應用程式。
streamlit run ocr_vision_app.py
您應該會在瀏覽器中看到應用程式啟動。
任務 4:上傳影像並擷取文字
-
在選取 OCI 組態設定檔中,從下拉式功能表中選取您的組態設定檔。
-
在輸入區間 OCID 中,輸入您可以存取 OCI Generative AI 服務的 Oracle Cloud Identifier (OCID) 區間。
-
在選取視覺模型中,選取模型。
-
按一下上傳並選取影像 (收據、發票、螢幕擷取畫面)。
應用程式將處理影像並顯示擷取的文字。
相關連結
確認
- Authors - Mukund Murali (主要雲端架構師)
其他學習資源
在 docs.oracle.com/learn 上探索其他實驗室,或在 Oracle Learning YouTube 頻道上存取更多免費學習內容。此外,請造訪 education.oracle.com/learning-explorer 以成為 Oracle Learning Explorer。
如需產品文件,請造訪 Oracle Help Center 。
Build Llama Optical Character Recognition Web Application using OCI Generative AI
G36167-01
Copyright ©2025, Oracle and/or its affiliates.