Observação:
- Este tutorial requer acesso ao Oracle Cloud. Para se inscrever em uma conta gratuita, consulte Conceitos básicos do Oracle Cloud Infrastructure Free Tier.
- Ele usa valores de exemplo para credenciais, tenancy e compartimentos do Oracle Cloud Infrastructure. Ao concluir seu laboratório, substitua esses valores por valores específicos do seu ambiente de nuvem.
Crie o Aplicativo Web de Reconhecimento Ótico de Caracteres Llama usando a OCI Generative AI
Introdução
Se você é um desenvolvedor, arquiteto de nuvem ou entusiasta de IA que gostou do Llama Optical Character Recognition (OCR), este tutorial é para você. Neste tutorial, você vai construir um aplicativo web simples, Llama OCR que:
-
Usa os Grandes Modelos de Linguagem (LLMs) da visão da IA Generativa da Oracle Cloud Infrastructure (OCI) para Meta.
-
Extrai texto estruturado de imagens (como recibos, formulários digitalizados).
-
Funciona localmente na sua máquina com Streamlit.
-
Não requer codificação frontend.
Objetivos
Construiremos uma interface de usuário web (UI) que permite:
-
Carregue uma imagem (recibo, fatura, captura de tela) no aplicativo.
-
Obtenha a saída de Markdown extraída da imagem usando LLM.
-
Exiba e copie o texto estruturado.
Pré-requisitos
-
Configurar a CLI do OCI (Interface de Linha de Comando) do Oracle Cloud Infrastructure (
~/.oci/config
). -
Acesso a um serviço OCI Generative AI nas regiões.
Regiões com OCI Generative AI
Nome da Região Geográfica Identificador da Região Chave da Região Leste do Brasil (São Paulo) São Paulo sa-saopaulo-1 GRU Região Central da Alemanha (Frankfurt) Frankfurt eu-frankfurt-1 FRA Região Central do Japão (Osaka) Osaka ap-osaka-1 KIX Leste dos EAU (Dubai) Dubai me-dubai-1 DXB Sul do Reino Unido (Londres) Londres uk-london-1 LHR Centro-Oeste dos EUA (Chicago) Chicago us-chicago-1 ORD -
Implante um modelo capaz de visão (como
meta.llama-3.2-90b-vision-instruct
,llama 4
). -
Instale o Python
version 3.8
ou mais recente e os pacotes Python necessários.
Tarefa 1: Fazer Download do Código Python e Configurar Arquivo de Configuração
-
Faça download do código aqui:
llama-ocr-oci.py
-
Certifique-se de ter o perfil de configuração correto configurado no arquivo
~/.oci/config
com um nome para ele. Por exemplo,OCI_PROFILE
.
Tarefa 2: Configurar um Ambiente Virtual
A criação de um ambiente virtual ajuda a isolar dependências e garante que seu aplicativo OCR Streamlit não interfira em outros projetos Python no seu sistema.
-
Windows: Execute os seguintes comandos.
-
Abra o Prompt de Comando (
cmd
) ou PowerShell e navegue até a pasta do seu projeto.cd path\\to\\your\\project
-
Criar um ambiente virtual.
python -m venv venv
-
Ative o ambiente virtual.
venv\\Scripts\\activate
-
Instalar dependências.
pip install streamlit oci
-
-
macOS/Linux: Execute o seguinte comando.
-
Abra Terminal e navegue até o diretório do seu projeto.
cd ~/path/to/your/project
-
Criar um ambiente virtual.
python3 -m venv venv
-
Ative o ambiente virtual.
source venv/bin/activate
-
Instalar dependências.
pip install streamlit oci
-
Tarefa 3: Iniciar o Aplicativo
Execute o comando a seguir para iniciar o aplicativo.
streamlit run ocr_vision_app.py
Você deverá ver a inicialização do aplicativo no navegador.
Tarefa 4: Fazer Upload de uma Imagem e Extrair o Texto
-
Em Selecionar Perfil de Configuração do OCI, selecione seu perfil de configuração no menu drop-down.
-
Em Informar OCID do Compartimento, digite o OCID (Oracle Cloud Identifier) do compartimento no qual você tem acesso ao serviço OCI Generative AI.
-
Em Selecionar Modelo de Visão, selecione um modelo.
-
Clique em Fazer Upload e selecione uma imagem (recebimento, fatura, captura de tela).
O aplicativo processará a imagem e exibirá o texto extraído.
Links Relacionados
Confirmações
- Autores - Mukund Murali (Arquiteto de Nuvem Principal)
Mais Recursos de Aprendizado
Explore outros laboratórios em docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal do Oracle Learning YouTube. Além disso, acesse education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.
Para obter a documentação do produto, visite o Oracle Help Center.
Build Llama Optical Character Recognition Web Application using OCI Generative AI
G36165-01
Copyright ©2025, Oracle and/or its affiliates.