Remarques :
- Ce tutoriel nécessite l'accès à Oracle Cloud. Pour vous inscrire à un compte gratuit, reportez-vous à Introduction à Oracle Cloud Infrastructure Free Tier.
- Il utilise des exemples de valeur pour les informations d'identification, la location et les compartiments Oracle Cloud Infrastructure. Lorsque vous terminez votre atelier, remplacez ces valeurs par celles propres à votre environnement cloud.
Créez une application Web de reconnaissance optique de caractères Llama à l'aide d'OCI Generative AI
Introduction
Si vous êtes un développeur, un architecte cloud ou un passionné d'IA qui a aimé la reconnaissance optique de caractères (OCR) Llama, ce tutoriel est fait pour vous. Dans ce tutoriel, vous allez créer une application Web OCR Llama simple qui :
-
Utilise la vision d'Oracle Cloud Infrastructure (OCI) Generative AI Grands modèles de langage (LLM) pour Meta.
-
Extrait du texte structuré à partir d'images (comme des reçus, des formulaires numérisés).
-
Fonctionne localement sur votre machine avec Streamlit.
-
Ne nécessite aucun codage front-end.
Objectifs
Nous allons créer une interface utilisateur Web qui vous permet de :
-
Téléchargez une image (réception, facture, capture d'écran) dans l'application.
-
Obtenir la sortie de démarque extraite de l'image à l'aide du LLM.
-
Consulter et copier le texte structuré.
Prérequis
-
Configurez l'interface de ligne de commande Oracle Cloud Infrastructure (interface de ligne de commande OCI) (
~/.oci/config
). -
Accès à un service OCI Generative AI dans les régions.
Régions avec OCI Generative AI
Nom de région géographique Identificateur de la région Clé de la région Est du Brésil (São Paulo) São Paulo sa-saopaulo-1 GRU Allemagne centrale (Francfort) Francfort eu-frankfurt-1 - FRA Centre du Japon (Osaka) Osaka ap-osaka-1 KIX Est des Emirats arabes unis (Dubaï) Dubaï me-dubai-1 DXB Sud du Royaume-Uni (Londres) London uk-london-1 LHR Midwest des Etats-Unis (Chicago) Chicago us-chicago-1 ORD -
Déployez un modèle compatible avec la vision (comme
meta.llama-3.2-90b-vision-instruct
,llama 4
). -
Installez Python
version 3.8
ou une version ultérieure et les packages Python requis.
Tâche 1 : télécharger le code Python et configurer le fichier de configuration
-
Téléchargez le code à partir d'ici :
llama-ocr-oci.py
-
Assurez-vous que le profil de configuration correct est configuré dans le fichier
~/.oci/config
avec un nom. Par exemple,OCI_PROFILE
.
Tâche 2 : configuration d'un environnement virtuel
La création d'un environnement virtuel permet d'isoler les dépendances et garantit que votre application OCR Streamlit n'interfère pas avec d'autres projets Python sur votre système.
-
Windows : exécutez les commandes suivantes.
-
Ouvrez l'invite de commande (
cmd
) ou PowerShell et accédez au dossier de votre projet.cd path\\to\\your\\project
-
Créez un environnement virtuel.
python -m venv venv
-
Activez l'environnement virtuel.
venv\\Scripts\\activate
-
Installez les dépendances.
pip install streamlit oci
-
-
macOS/Linux : exécutez la commande suivante.
-
Ouvrez Terminal et accédez au répertoire de votre projet.
cd ~/path/to/your/project
-
Créez un environnement virtuel.
python3 -m venv venv
-
Activez l'environnement virtuel.
source venv/bin/activate
-
Installez les dépendances.
pip install streamlit oci
-
Tâche 3 : lancement de l'application
Exécutez la commande suivante pour lancer l'application.
streamlit run ocr_vision_app.py
Vous devez voir le lancement de l'application dans votre navigateur.
Tâche 4 : télécharger une image et extraire le texte
-
Dans Sélectionner un profil de configuration OCI, sélectionnez votre profil de configuration dans le menu déroulant.
-
Dans Entrer l'OCID de compartiment, entrez l'OCID (identificateur Oracle Cloud) de compartiment dans lequel vous avez accès au service OCI Generative AI.
-
Dans Sélectionner un modèle Vision, sélectionnez un modèle.
-
Cliquez sur Charger et sélectionnez une image (réception, facture, capture d'écran).
L'application traite l'image et affiche le texte extrait.
Liens connexes
Accusés de réception
- Auteurs - Mukund Murali (architecte cloud principal)
Ressources de formation supplémentaires
Explorez d'autres ateliers sur le site docs.oracle.com/learn ou accédez à d'autres contenus d'apprentissage gratuits sur le canal Oracle Learning YouTube. En outre, visitez le site education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.
Pour obtenir de la documentation sur le produit, consultez Oracle Help Center.
Build Llama Optical Character Recognition Web Application using OCI Generative AI
G36161-01
Copyright ©2025, Oracle and/or its affiliates.