Nota
- Questa esercitazione richiede l'accesso a Oracle Cloud. Per iscriversi a un account gratuito, consulta Inizia a utilizzare Oracle Cloud Infrastructure Free Tier.
- Utilizza valori di esempio per le credenziali, la tenancy e i compartimenti di Oracle Cloud Infrastructure. Quando completi il tuo laboratorio, sostituisci questi valori con quelli specifici del tuo ambiente cloud.
Crea un'applicazione Web di riconoscimento ottico dei caratteri Llama utilizzando l'AI generativa OCI
Introduzione
Se sei uno sviluppatore, un architetto cloud o un appassionato di intelligenza artificiale a cui è piaciuto Llama Optical Character Recognition (OCR), questo tutorial è quello che fa per te. In questo tutorial creerai una semplice applicazione web Llama OCR che:
-
Utilizza la visione di Oracle Cloud Infrastructure (OCI) Generative AI Large Language Models (LLM) per Meta.
-
Estrae il testo strutturato da immagini (come ricevute, moduli scansionati).
-
Funziona localmente sulla tua macchina con Streamlit.
-
Non richiede alcuna codifica frontend.
Obiettivi
Costruiremo un'interfaccia utente web (UI) che consente di:
-
Caricare un'immagine (incasso, fattura, screenshot) nell'applicazione.
-
Ottieni l'output Markdown estratto dall'immagine utilizzando LLM.
-
Visualizzare e copiare il testo strutturato.
Prerequisiti
-
Configurare l'interfaccia a riga di comando (OCI CLI) di Oracle Cloud Infrastructure (
~/.oci/config
). -
Accesso a un servizio OCI Generative AI nelle aree.
Aree con OCI Generative AI
Nome dell'area geografica Identificativo dell'area Chiave area Brasile (Est) - San Paolo San Paolo sa-saopaulo-1 GRU Germania (Centro) - Francoforte Francoforte FRA di eu-frankfurt-1 Giappone centrale (Osaka) Osaka ap-osaka-1 KIX Emirati Arabi Uniti (Est) - Dubai Dubai me-dubai-1 DXB Regno Unito (Sud) - Londra London uk-london-1 LHR Stati Uniti (Midwest) - Chicago Chicago us-chicago-1 ORD -
Distribuire un modello con capacità di visione (ad esempio
meta.llama-3.2-90b-vision-instruct
,llama 4
). -
Installare
version 3.8
Python o versioni successive e i pacchetti Python necessari.
Task 1: Scaricare il codice Python e configurare il file di configurazione
-
Scarica il codice da qui:
llama-ocr-oci.py
-
Assicurarsi di avere configurato il profilo di configurazione corretto nel file
~/.oci/config
con un nome. Ad esempio,OCI_PROFILE
.
Task 2: Impostazione di un ambiente virtuale
La creazione di un ambiente virtuale consente di isolare le dipendenze e garantisce che l'applicazione OCR Streamlit non interferisca con altri progetti Python nel sistema.
-
Windows: eseguire i comandi seguenti.
-
Aprire il prompt dei comandi (
cmd
) o PowerShell e passare alla cartella del progetto.cd path\\to\\your\\project
-
Creare un ambiente virtuale.
python -m venv venv
-
Attivare l'ambiente virtuale.
venv\\Scripts\\activate
-
Installa dipendenze.
pip install streamlit oci
-
-
macOS/Linux: eseguire il comando riportato di seguito.
-
Aprire Terminale e passare alla directory del progetto.
cd ~/path/to/your/project
-
Creare un ambiente virtuale.
python3 -m venv venv
-
Attivare l'ambiente virtuale.
source venv/bin/activate
-
Installa dipendenze.
pip install streamlit oci
-
Task 3: Avvio dell'applicazione
Eseguire il comando seguente per avviare l'applicazione.
streamlit run ocr_vision_app.py
Dovresti vedere l'avvio dell'applicazione nel tuo browser.
Task 4: Caricare un'immagine ed estrarre il testo
-
In Seleziona profilo di configurazione OCI, selezionare il profilo di configurazione dal menu a discesa.
-
In Immettere l'OCID compartimento, immettere l'OCID (Oracle Cloud Identifier) del compartimento in cui si dispone dell'accesso al servizio OCI Generative AI.
-
Selezionare un modello in Seleziona modello Vision.
-
Fare clic su Carica e selezionare un'immagine (ricevuta, fattura, screenshot).
L'applicazione elaborerà l'immagine e visualizzerà il testo estratto.
Collegamenti correlati
Conferme
- Autori - Mukund Murali (Principal Cloud Architect)
Altre risorse di apprendimento
Esplora altri laboratori su docs.oracle.com/learn o accedi a più contenuti di formazione gratuiti sul canale YouTube di Oracle Learning. Inoltre, visitare education.oracle.com/learning-explorer per diventare Oracle Learning Explorer.
Per la documentazione del prodotto, visitare Oracle Help Center.
Build Llama Optical Character Recognition Web Application using OCI Generative AI
G36162-01
Copyright ©2025, Oracle and/or its affiliates.