使用 OCI Generative AI 构建 Llama 光学字符识别 Web 应用

简介

如果您是喜欢 Llama 光学字符识别 (OCR) 的开发人员，云架构师或 AI 爱好者，本教程适合您。在本教程中，您将构建一个简单的 Llama OCR Web 应用程序，该应用程序：

我们将构建一个 Web 用户界面 (UI)，允许您：

访问区域中的 OCI Generative AI 服务。

使用 OCI Generative AI 的区域

区域名	位置	区域标识	区域关键字
巴西东部（圣保罗）	圣保罗	sa-saopaulo-1	GRU
德国中部（法兰克福）	法兰克福	eu-frankfurt-1 FRA
日本中部（大阪）	大阪	ap-osaka-1	KIX
阿拉伯联合酋长国东部（迪拜）	迪拜	me-dubai-1	DXB
英国南部（伦敦）	London	uk-london-1	LHR
美国中西部（芝加哥）	芝加哥市	美国芝加哥 -1	订单

创建虚拟环境有助于隔离依赖关系，并确保 Streamlit OCR 应用程序不会干扰系统上的其他 Python 项目。

Windows：运行以下命令。
1. 打开命令提示符 (cmd) 或 PowerShell 并导航到项目文件夹。
```
cd path\\to\\your\\project
```
2. 创建虚拟环境。
```
python -m venv venv
```
3. 激活虚拟环境。
```
venv\\Scripts\\activate
```
4. 安装依赖项。
```
pip install streamlit oci
```
macOS/Linux：运行以下命令。
1. 打开终端并导航到项目目录。
```
cd ~/path/to/your/project
```
2. 创建虚拟环境。
```
python3 -m venv venv
```
3. 激活虚拟环境。
```
source venv/bin/activate
```
4. 安装依赖项。
```
pip install streamlit oci
```

运行以下命令以启动应用程序。

streamlit run ocr_vision_app.py

您应该会在浏览器中看到应用程序的启动。

app

在选择 OCI 配置概要信息中，从下拉菜单中选择您的配置概要信息。
在 Enter Compartment OCID 中，输入您有权访问 OCI Generative AI 服务的区间 Oracle Cloud Identifier (OCID)。
在选择视觉模型中，选择一个模型。
单击上载并选择图像（收据、发票、屏幕截图）。

应用程序将处理图像并显示提取的文本。