주:
- 이 사용지침서에서는 Oracle Cloud에 액세스해야 합니다. 무료 계정에 등록하려면 Oracle Cloud Infrastructure Free Tier 시작하기를 참조하십시오.
- Oracle Cloud Infrastructure 인증서, 테넌시 및 구획에 예제 값을 사용합니다. 실습을 완료할 때 이러한 값을 클라우드 환경과 관련된 값으로 대체하십시오.
OCI Generative AI를 사용하여 Llama Optical Character Recognition 웹 애플리케이션 구축
소개
Llama Optical Character Recognition(OCR)을 좋아하는 개발자, 클라우드 설계자 또는 AI 애호가라면 이 자습서를 참조하십시오. 이 자습서에서는 다음과 같은 간단한 Llama OCR 웹 응용 프로그램을 작성합니다.
-
Oracle Cloud Infrastructure(OCI) Generative AI의 비전인 대규모 언어 모델(LLM)을 Meta에 사용합니다.
-
이미지(예: 영수증, 스캔된 양식)에서 구조화된 텍스트를 추출합니다.
-
Streamlit을 사용하여 컴퓨터에서 로컬로 실행됩니다.
-
프론트엔드 코딩이 필요하지 않습니다.
목표
우리는 당신이 할 수있는 웹 사용자 인터페이스 (UI)를 구축 할 것입니다 :
-
애플리케이션에서 이미지(영수증, 송장, 스크린샷)를 업로드합니다.
-
LLM을 사용하여 이미지에서 추출된 매가인하 출력을 가져옵니다.
-
구조화된 텍스트를 보고 복사합니다.
필수 조건
-
OCI CLI(Oracle Cloud Infrastructure Command Line Interface)(
~/.oci/config
)를 구성합니다. -
리전의 OCI Generative AI 서비스에 액세스할 수 있습니다.
OCI Generative AI를 사용하는 리전
지역 이름 위치 지역 식별자 지역 키 브라질 동부(상파울로) 상파울로 sa-saopaulo-1 GRU 독일 중부(프랑크푸르트) 프랑크푸르트 eu-frankfurt-1 FRA 일본 중부(오사카) 오사카 ap-osaka-1 KIX 아랍에미리트 동부(두바이) Dubai 나두바이-1 DXB 영국 남부(런던) London uk-london-1 LHR 미국 중서부(시카고) 시카고 미국 시카고-1 주문 -
비전 지원 모델(예:
meta.llama-3.2-90b-vision-instruct
,llama 4
)을 배포합니다. -
Python
version 3.8
이상 및 필수 Python 패키지를 설치합니다.
작업 1: Python 코드 다운로드 및 구성 파일 설정
-
llama-ocr-oci.py
에서 코드를 다운로드합니다. -
~/.oci/config
파일에 해당 이름으로 구성된 올바른 구성 프로파일이 있는지 확인합니다. 예:OCI_PROFILE
.
작업 2: 가상 환경 설정
가상 환경을 생성하면 종속성을 격리하는 데 도움이 되며 Streamlit OCR 앱이 시스템의 다른 Python 프로젝트와 충돌하지 않도록 합니다.
-
Windows: 다음 명령을 실행합니다.
-
명령 프롬프트(
cmd
) 또는 PowerShell를 열고 프로젝트 폴더로 이동합니다.cd path\\to\\your\\project
-
가상 환경을 만듭니다.
python -m venv venv
-
가상 환경을 활성화합니다.
venv\\Scripts\\activate
-
종속성을 설치합니다.
pip install streamlit oci
-
-
macOS/Linux: 다음 명령을 실행합니다.
-
터미널을 열고 프로젝트 디렉토리로 이동합니다.
cd ~/path/to/your/project
-
가상 환경을 만듭니다.
python3 -m venv venv
-
가상 환경을 활성화합니다.
source venv/bin/activate
-
종속성을 설치합니다.
pip install streamlit oci
-
작업 3: 응용 프로그램 실행
다음 명령을 실행하여 응용 프로그램을 실행합니다.
streamlit run ocr_vision_app.py
브라우저에서 응용 프로그램 실행이 표시됩니다.
작업 4: 이미지 업로드 및 텍스트 추출
-
OCI 구성 프로파일 선택의 드롭다운 메뉴에서 구성 프로파일을 선택합니다.
-
컴파트먼트 OCID 입력에서 OCI 생성형 AI 서비스에 대한 액세스 권한이 있는 OCID(Oracle Cloud Identifier) 컴파트먼트를 입력합니다.
-
비전 모델 선택에서 모델을 선택합니다.
-
업로드를 누르고 이미지(수금, 송장, 스크린샷)를 선택합니다.
응용 프로그램이 이미지를 처리하고 추출된 텍스트를 표시합니다.
관련 링크
승인
- Authors - Mukund Murali(Principal Cloud Architect)
추가 학습 자원
docs.oracle.com/learn에서 다른 랩을 탐색하거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하세요. 또한 education.oracle.com/learning-explorer를 방문하여 Oracle Learning Explorer가 되십시오.
제품 설명서는 Oracle Help Center를 참조하십시오.
Build Llama Optical Character Recognition Web Application using OCI Generative AI
G36164-01
Copyright ©2025, Oracle and/or its affiliates.