注意:

使用 OCI Generative AI 构建 Llama 光学字符识别 Web 应用

简介

如果您是喜欢 Llama 光学字符识别 (OCR) 的开发人员,云架构师或 AI 爱好者,本教程适合您。在本教程中,您将构建一个简单的 Llama OCR Web 应用程序,该应用程序:

目标

我们将构建一个 Web 用户界面 (UI),允许您:

Prerequisites

任务 1:下载 Python 代码并设置配置文件

  1. 请从此处下载代码:llama-ocr-oci.py

  2. 请确保在文件 ~/.oci/config 中配置了正确的配置配置文件,并为其命名。例如,OCI_PROFILE

任务 2:设置虚拟环境

创建虚拟环境有助于隔离依赖关系,并确保 Streamlit OCR 应用程序不会干扰系统上的其他 Python 项目。

任务 3:启动应用程序

运行以下命令以启动应用程序。

streamlit run ocr_vision_app.py

您应该会在浏览器中看到应用程序的启动。

app

任务 4:上载图像并提取文本

  1. 选择 OCI 配置概要信息中,从下拉菜单中选择您的配置概要信息。

  2. Enter Compartment OCID 中,输入您有权访问 OCI Generative AI 服务的区间 Oracle Cloud Identifier (OCID)。

  3. 选择视觉模型中,选择一个模型。

  4. 单击上载并选择图像(收据、发票、屏幕截图)。

    应用程序将处理图像并显示提取的文本。

    语法分析

确认

更多学习资源

通过 docs.oracle.com/learn 浏览其他实验室,或者通过 Oracle Learning YouTube 频道访问更多免费学习内容。此外,请访问 education.oracle.com/learning-explorer 以成为 Oracle Learning Explorer。

有关产品文档,请访问 Oracle 帮助中心