Observação:

Este tutorial requer acesso ao Oracle Cloud. Para se inscrever em uma conta gratuita, consulte Conceitos básicos do Oracle Cloud Infrastructure Free Tier.
Ele usa valores de exemplo para credenciais, tenancy e compartimentos do Oracle Cloud Infrastructure. Ao concluir seu laboratório, substitua esses valores por valores específicos do seu ambiente de nuvem.

Crie o Aplicativo Web de Reconhecimento Ótico de Caracteres Llama usando a OCI Generative AI

Introdução

Se você é um desenvolvedor, arquiteto de nuvem ou entusiasta de IA que gostou do Llama Optical Character Recognition (OCR), este tutorial é para você. Neste tutorial, você vai construir um aplicativo web simples, Llama OCR que:

Usa os Grandes Modelos de Linguagem (LLMs) da visão da IA Generativa da Oracle Cloud Infrastructure (OCI) para Meta.
Extrai texto estruturado de imagens (como recibos, formulários digitalizados).
Funciona localmente na sua máquina com Streamlit.
Não requer codificação frontend.

Objetivos

Construiremos uma interface de usuário web (UI) que permite:

Carregue uma imagem (recibo, fatura, captura de tela) no aplicativo.
Obtenha a saída de Markdown extraída da imagem usando LLM.
Exiba e copie o texto estruturado.

Pré-requisitos

Configurar a CLI do OCI (Interface de Linha de Comando) do Oracle Cloud Infrastructure (~/.oci/config).

Acesso a um serviço OCI Generative AI nas regiões.

Regiões com OCI Generative AI

Nome da Região	Geográfica	Identificador da Região	Chave da Região
Leste do Brasil (São Paulo)	São Paulo	sa-saopaulo-1	GRU
Região Central da Alemanha (Frankfurt)	Frankfurt	eu-frankfurt-1 FRA
Região Central do Japão (Osaka)	Osaka	ap-osaka-1	KIX
Leste dos EAU (Dubai)	Dubai	me-dubai-1	DXB
Sul do Reino Unido (Londres)	Londres	uk-london-1	LHR
Centro-Oeste dos EUA (Chicago)	Chicago	us-chicago-1	ORD

Implante um modelo capaz de visão (como meta.llama-3.2-90b-vision-instruct, llama 4).
Instale o Python version 3.8 ou mais recente e os pacotes Python necessários.

Tarefa 1: Fazer Download do Código Python e Configurar Arquivo de Configuração

Faça download do código aqui: llama-ocr-oci.py
Certifique-se de ter o perfil de configuração correto configurado no arquivo ~/.oci/config com um nome para ele. Por exemplo, OCI_PROFILE.

Tarefa 2: Configurar um Ambiente Virtual

A criação de um ambiente virtual ajuda a isolar dependências e garante que seu aplicativo OCR Streamlit não interfira em outros projetos Python no seu sistema.

Windows: Execute os seguintes comandos.
1. Abra o Prompt de Comando (cmd) ou PowerShell e navegue até a pasta do seu projeto.
```
cd path\\to\\your\\project
```
2. Criar um ambiente virtual.
```
python -m venv venv
```
3. Ative o ambiente virtual.
```
venv\\Scripts\\activate
```
4. Instalar dependências.
```
pip install streamlit oci
```
macOS/Linux: Execute o seguinte comando.
1. Abra Terminal e navegue até o diretório do seu projeto.
```
cd ~/path/to/your/project
```
2. Criar um ambiente virtual.
```
python3 -m venv venv
```
3. Ative o ambiente virtual.
```
source venv/bin/activate
```
4. Instalar dependências.
```
pip install streamlit oci
```

Tarefa 3: Iniciar o Aplicativo

Execute o comando a seguir para iniciar o aplicativo.

streamlit run ocr_vision_app.py

Você deverá ver a inicialização do aplicativo no navegador.

app

Tarefa 4: Fazer Upload de uma Imagem e Extrair o Texto

Em Selecionar Perfil de Configuração do OCI, selecione seu perfil de configuração no menu drop-down.
Em Informar OCID do Compartimento, digite o OCID (Oracle Cloud Identifier) do compartimento no qual você tem acesso ao serviço OCI Generative AI.
Em Selecionar Modelo de Visão, selecione um modelo.
Clique em Fazer Upload e selecione uma imagem (recebimento, fatura, captura de tela).

O aplicativo processará a imagem e exibirá o texto extraído.

Meta Llama 4 agora está disponível no OCI Generative AI

Confirmações

Autores - Mukund Murali (Arquiteto de Nuvem Principal)

Mais Recursos de Aprendizado

Explore outros laboratórios em docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal do Oracle Learning YouTube. Além disso, acesse education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.

Para obter a documentação do produto, visite o Oracle Help Center.

Título e Informações de Copyright

Build Llama Optical Character Recognition Web Application using OCI Generative AI

G36165-01