주:

OCI Generative AI를 사용하여 Llama Optical Character Recognition 웹 애플리케이션 구축

소개

Llama Optical Character Recognition(OCR)을 좋아하는 개발자, 클라우드 설계자 또는 AI 애호가라면 이 자습서를 참조하십시오. 이 자습서에서는 다음과 같은 간단한 Llama OCR 웹 응용 프로그램을 작성합니다.

목표

우리는 당신이 할 수있는 웹 사용자 인터페이스 (UI)를 구축 할 것입니다 :

필수 조건

작업 1: Python 코드 다운로드 및 구성 파일 설정

  1. llama-ocr-oci.py에서 코드를 다운로드합니다.

  2. ~/.oci/config 파일에 해당 이름으로 구성된 올바른 구성 프로파일이 있는지 확인합니다. 예: OCI_PROFILE.

작업 2: 가상 환경 설정

가상 환경을 생성하면 종속성을 격리하는 데 도움이 되며 Streamlit OCR 앱이 시스템의 다른 Python 프로젝트와 충돌하지 않도록 합니다.

작업 3: 응용 프로그램 실행

다음 명령을 실행하여 응용 프로그램을 실행합니다.

streamlit run ocr_vision_app.py

브라우저에서 응용 프로그램 실행이 표시됩니다.

app

작업 4: 이미지 업로드 및 텍스트 추출

  1. OCI 구성 프로파일 선택의 드롭다운 메뉴에서 구성 프로파일을 선택합니다.

  2. 컴파트먼트 OCID 입력에서 OCI 생성형 AI 서비스에 대한 액세스 권한이 있는 OCID(Oracle Cloud Identifier) 컴파트먼트를 입력합니다.

  3. 비전 모델 선택에서 모델을 선택합니다.

  4. 업로드를 누르고 이미지(수금, 송장, 스크린샷)를 선택합니다.

    응용 프로그램이 이미지를 처리하고 추출된 텍스트를 표시합니다.

    구문 분석

승인

추가 학습 자원

docs.oracle.com/learn에서 다른 랩을 탐색하거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하세요. 또한 education.oracle.com/learning-explorer를 방문하여 Oracle Learning Explorer가 되십시오.

제품 설명서는 Oracle Help Center를 참조하십시오.