附註:

使用 OCI Generative AI 建置 Llama 光學文字辨識 Web 應用程式

簡介

如果您是喜歡 Llama 光學文字辨識 (OCR) 的開發人員、雲端架構師或 AI 愛好者,則此教學課程為您服務。在本教學課程中,您將建置簡單的 Llama OCR Web 應用程式,包括:

目標

我們將建立 Web 使用者介面 (UI),讓您可以:

必備條件

工作 1:下載 Python 程式碼並設定組態檔

  1. 請從此處下載程式碼:llama-ocr-oci.py

  2. 請確定檔案 ~/.oci/config 中設定的組態設定檔名稱正確。例如,OCI_PROFILE

工作 2:設定虛擬環境

建立虛擬環境有助於隔離相依性,並確保您的 Streamlit OCR 應用程式不會干擾您系統上的其他 Python 專案。

作業 3:啟動應用程式

執行下列命令以啟動應用程式。

streamlit run ocr_vision_app.py

您應該會在瀏覽器中看到應用程式啟動。

app - 應用程式

任務 4:上傳影像並擷取文字

  1. 選取 OCI 組態設定檔中,從下拉式功能表中選取您的組態設定檔。

  2. 輸入區間 OCID 中,輸入您可以存取 OCI Generative AI 服務的 Oracle Cloud Identifier (OCID) 區間。

  3. 選取視覺模型中,選取模型。

  4. 按一下上傳並選取影像 (收據、發票、螢幕擷取畫面)。

    應用程式將處理影像並顯示擷取的文字。

    parsing

確認

其他學習資源

docs.oracle.com/learn 上探索其他實驗室,或在 Oracle Learning YouTube 頻道上存取更多免費學習內容。此外,請造訪 education.oracle.com/learning-explorer 以成為 Oracle Learning Explorer。

如需產品文件,請造訪 Oracle Help Center