OCI Generative AI를 사용하여 Llama Optical Character Recognition 웹 애플리케이션 구축

소개

Llama Optical Character Recognition(OCR)을 좋아하는 개발자, 클라우드 설계자 또는 AI 애호가라면 이 자습서를 참조하십시오. 이 자습서에서는 다음과 같은 간단한 Llama OCR 웹 응용 프로그램을 작성합니다.

Oracle Cloud Infrastructure(OCI) Generative AI의 비전인 대규모 언어 모델(LLM)을 Meta에 사용합니다.
이미지(예: 영수증, 스캔된 양식)에서 구조화된 텍스트를 추출합니다.
Streamlit을 사용하여 컴퓨터에서 로컬로 실행됩니다.
프론트엔드 코딩이 필요하지 않습니다.

우리는 당신이 할 수있는 웹 사용자 인터페이스 (UI)를 구축 할 것입니다 :

OCI CLI(Oracle Cloud Infrastructure Command Line Interface)(~/.oci/config)를 구성합니다.

리전의 OCI Generative AI 서비스에 액세스할 수 있습니다.

OCI Generative AI를 사용하는 리전

지역 이름	위치	지역 식별자	지역 키
브라질 동부(상파울로)	상파울로	sa-saopaulo-1	GRU
독일 중부(프랑크푸르트)	프랑크푸르트	eu-frankfurt-1 FRA
일본 중부(오사카)	오사카	ap-osaka-1	KIX
아랍에미리트 동부(두바이)	Dubai	나두바이-1	DXB
영국 남부(런던)	London	uk-london-1	LHR
미국 중서부(시카고)	시카고	미국 시카고-1	주문

가상 환경을 생성하면 종속성을 격리하는 데 도움이 되며 Streamlit OCR 앱이 시스템의 다른 Python 프로젝트와 충돌하지 않도록 합니다.

Windows: 다음 명령을 실행합니다.
1. 명령 프롬프트(cmd) 또는 PowerShell를 열고 프로젝트 폴더로 이동합니다.
```
cd path\\to\\your\\project
```
2. 가상 환경을 만듭니다.
```
python -m venv venv
```
3. 가상 환경을 활성화합니다.
```
venv\\Scripts\\activate
```
4. 종속성을 설치합니다.
```
pip install streamlit oci
```
macOS/Linux: 다음 명령을 실행합니다.
1. 터미널을 열고 프로젝트 디렉토리로 이동합니다.
```
cd ~/path/to/your/project
```
2. 가상 환경을 만듭니다.
```
python3 -m venv venv
```
3. 가상 환경을 활성화합니다.
```
source venv/bin/activate
```
4. 종속성을 설치합니다.
```
pip install streamlit oci
```

다음 명령을 실행하여 응용 프로그램을 실행합니다.

streamlit run ocr_vision_app.py

브라우저에서 응용 프로그램 실행이 표시됩니다.

app

OCI 구성 프로파일 선택의 드롭다운 메뉴에서 구성 프로파일을 선택합니다.
컴파트먼트 OCID 입력에서 OCI 생성형 AI 서비스에 대한 액세스 권한이 있는 OCID(Oracle Cloud Identifier) 컴파트먼트를 입력합니다.
비전 모델 선택에서 모델을 선택합니다.
업로드를 누르고 이미지(수금, 송장, 스크린샷)를 선택합니다.

응용 프로그램이 이미지를 처리하고 추출된 텍스트를 표시합니다.

docs.oracle.com/learn에서 다른 랩을 탐색하거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하세요. 또한 education.oracle.com/learning-explorer를 방문하여 Oracle Learning Explorer가 되십시오.

제품 설명서는 Oracle Help Center를 참조하십시오.

Build Llama Optical Character Recognition Web Application using OCI Generative AI

G36164-01