문서 수명 주기 자동화
AI는 다음을 통해 수명 주기를 개선합니다.
- 사후 아카이브 인텔리전스
- 디지털화
- 거래 분석
가능한 파이프라인의 다양성은 다음과 같습니다.
- 확장 가능한 OCR 및 추론을 위한 DU(문서 이해) 및 텍스트 LLM
- 시각적/복잡한 레이아웃을 위한 다중 모달 LLM
- 더 높은 보증을 위한 비교/합의 모드
이 설계는 의료 및 금융 서비스의 주요 특징과 함께 여러 산업 전반에서 일반적입니다.
구조
이 아키텍처는 수집 및 스토리지에서 추출 및 다운스트림 통합에 이르기까지 문서 처리의 논리적 흐름을 보여줍니다. OCI Document Understanding 및 OCI Generative AI 서비스(텍스트 및 비전 LLM)를 비롯한 여러 Oracle Cloud Infrastructure(OCI) 구성 요소가 통합관리에서 함께 작동하는 방식을 보여줍니다.
다음 다이어그램은 논리적 흐름을 보여줍니다.
논리적 흐름에 표시된 개념적 구성 요소는 다음과 같습니다.
- 원격 데이터 스토리지
- 외부 저장소, 엔터프라이즈 파일 시스템 또는 네트워크 드라이브, DMS 또는 클라우드 버킷과 같은 공유 저장소일 수 있는 문서의 원래 소스를 나타냅니다.
- 문서를 주기적으로 또는 처리를 위해 트리거할 때 인출할 수 있습니다.
- 입력 UI
- 문서 업로드 또는 제출을 위한 간단한 사용자 관련 시작점입니다.
- Oracle Digital Assistant 또는 이와 유사한 도구로 구축된 웹 양식, 내부 포털 또는 애플리케이션 프론트엔드일 수 있습니다.
- 챗봇(선택 사항)
- 파이프라인에 대한 대화형 액세스를 제공합니다.
- 사용자가 자연어를 통해 문서를 업로드하거나 질의할 수 있도록 허용합니다(예: "$50K를 초과하는 모든 송장 표시").
- 내부적으로 입력 UI와 동일한 수집 계층으로 경로 지정됩니다.
- 통합
- 통합관리 및 경로 지정 계층 역할을 합니다.
- 문서 유형 또는 비즈니스 논리에 따라 올바른 파이프라인을 트리거합니다. 예를 들어, OCI Document Understanding 및 구조화된 문서용 LLM, 이미지가 많은 입력용 비전 LLM 등이 있습니다.
- ERP, CRM 또는 데이터 플랫폼에 대한 오류 복구, 재시도, 메타데이터 관리 및 다운스트림 API 호출을 처리합니다.
- 데이터 저장 영역
- 원시 데이터와 처리된 데이터를 모두 저장합니다.
- 일반적으로 바이너리의 경우 OCI Object Storage를 사용하고 구조화된 JSON 출력 및 감사 로그의 경우 Oracle Autonomous AI Database를 사용하여 구현됩니다.
- 전체 문서 수명 주기에 걸쳐 추적, 재처리 및 분석을 수행할 수 있습니다.
- OCR(광 문자 인식)
- 광학 문자 인식, 레이아웃 감지 및 키-값 쌍, 테이블 및 자유 텍스트 추출을 수행합니다.
- 텍스트 기반 LLM 추론에 대한 입력 역할을 하는 클린 텍스트를 생성합니다.
- OCI Document Understanding는 결정적 및 스키마 기반 기능으로, 예측 가능한 추출 품질을 보장합니다.
- 텍스트 LLM(Cohere Command-A)
- OCI Document Understanding 출력을 소비하고 추론, 정규화 및 형식을 적용합니다.
- OCI Document Understanding의 고정 스키마를 뛰어넘는 요약, 분류 및 상황별 추출을 처리합니다.
- 시끄러운 OCR 출력을 정리하고, 필드 이름 지정을 통합하고, 컨텍스트를 기반으로 누락된 값을 추론할 수 있습니다.
- 멀티모달 LLM (Llama 4 Maverick)
- OCI Document Understanding 및 텍스트 전용 모델이 완전히 해석할 수 없는 시각적 콘텐츠 및 복잡한 레이아웃을 처리합니다.
- 차트, 필기, 스탬프, 이미지로 포함된 테이블 및 다중 페이지 연속성을 처리합니다.
- 결합된 플로우에서 출력은 OCI Document Understanding 및 텍스트 LLM 결과와 조정되어 완전성과 정확성을 향상시킵니다.
- 임베딩 및 데이터 로딩 논리
- 의미 검색 및 문서 검색을 위해 추출된 텍스트와 이미지를 벡터 임베딩으로 변환합니다.
- 다운스트림 RAG 워크플로를 지원하여 LLM이 사실적인 문서별 데이터로 응답할 수 있도록 합니다.
- OCI 함수 또는 사용자정의 ETL 파이프라인을 사용하여 구현할 수 있습니다.
- 벡터 스토어
- 텍스트 및 이미지에 대한 임베딩을 저장합니다.
- 상황별로 유사한 콘텐츠를 빠르게 검색할 수 있으며 엔터프라이즈 문서 세트에 대한 생성형 Q&A를 지원합니다.
- 일반적인 구현에는 자율운영 AI 데이터베이스의 Qdrant, AI Vector Search 또는 기타 OCI 호환 매장이 포함됩니다.
논리적 흐름 다이어그램에 표시된 종단간 흐름입니다.
- 문서 수집
- 문서는 입력 UI를 통해 업로드되거나 원격 데이터 저장소에서 검색됩니다.
- 통합 계층은 메타데이터를 기록하고, 파일 형식을 검증하고, 해당하는 처리 파이프라인을 트리거합니다.
- 챗봇 제출은 수동 업로드와 동일한 API 경로를 사용합니다.
- 저장 및 준비
- 파일은 OCI Object Storage에서 지속됩니다.
- 메타데이터 및 상태 항목은 감사 및 제어를 위해 Oracle Autonomous AI Database에 기록됩니다.
- 워크플로우 트리거(OCI 함수 또는 Oracle Integration 사용)는 OCR/LLM 시퀀스를 시작합니다.
- 데이터 추출 및 보강
- OCI Document Understanding는 OCR 및 레이아웃 분석을 수행하여 구조화된 텍스트를 반환합니다.
- 텍스트 LLM(예: Command-A)은 이 텍스트를 해석하여 정리하고 정규화된 출력(JSON 또는 마크다운)을 생성합니다.
- 문서에 복잡한 시각적 요소가 포함되어 있는 경우 Llama 4 Maverick과 같은 AI를 이해하는 텍스트 및 이미지가 이미지를 분석하여 추출 결과를 강화하거나 검증합니다.
- 두 출력 모두 통합관리 논리(신뢰도 기반 조정)를 통해 비교하거나 병합할 수 있습니다.
- 통합 및 지식 로딩
- 최종 구조화되고 컨텍스트화된 데이터는 임베딩 단계를 거쳐 텍스트 또는 시각적 인사이트를 벡터로 변환합니다.
- 임베딩 및 데이터 로딩 로직 구성요소는 이러한 벡터를 벡터 저장소에 저장하여 RAG 통합 단계를 완료합니다.
- 분석 대시보드, 검색 포털 또는 GenAI 챗봇과 같은 다운스트림 애플리케이션은 이제 의미 검색 및 질문 응답을 위해 처리된 데이터에 액세스할 수 있습니다.
선택적으로 3단계와 4단계 사이에 HITL(Human-in-the-loop) 단계를 추가할 수 있습니다.
- 이 단계에서 HITL은 답변에 대한 신뢰도, 데이터 유형, 형식 등에 대한 추가 검사 등 다양한 기준에 따라 흐름에 통합될 수 있습니다. 그러면 사용자에게 필요에 따라 결과를 승인하거나 편집하라는 메시지가 표시될 수 있습니다.
- 선택한 경로 내에서 HITL을 추가하여 지속적인 학습 계층을 추가하여 솔루션이 사용량에 따라 적응하고 성장하며 효율성을 향상시킬 수 있도록 할 수 있습니다.
- 신뢰도 낮음, 스키마 위반, 조정 실패, 공급업체/레이아웃 보이지 않음 또는 규제 기관에서 중요한 필드 등에 대해 HITL을 트리거합니다.
- "graduation rule"을 사용하는 것이 좋습니다. 즉, 지정된 공급업체/레이아웃에 대해 연속적으로 N번의 클린 패스 후 HITL을 제거합니다.
- 수정을 지속하고, 프롬프트 세분화기 및 검증기를 공급하고, 공급업체/레이아웃 지문을 추적합니다.
다음 다이어그램은 구현 예를 보여줍니다.
아키텍처의 구성 요소는 다음과 같습니다.
- OCI 리전
OCI 리전은 가용성 도메인을 호스팅하는 데이터 센터가 하나 이상 포함된 지역화된 지리적 영역입니다. 지역은 다른 지역과 독립적이며, 광대한 거리는 (국가 또는 대륙에 걸쳐) 그들을 분리 할 수 있습니다.
- 구획
구획은 OCI 테넌시 내의 영역 간 논리적 분할 영역입니다. 구획을 사용하여 Oracle Cloud 리소스에 대한 사용 할당량을 구성, 제어 및 설정합니다. 지정된 컴파트먼트에서 액세스를 제어하고 리소스에 대한 권한을 설정하는 정책을 정의합니다.
- 가용성 도메인
가용성 도메인은 한 지역 내의 독립형 독립형 데이터 센터입니다. 각 가용성 도메인의 물리적 리소스는 내결함성을 제공하는 다른 가용성 도메인의 리소스와 격리됩니다. 가용성 도메인은 전원 또는 냉각과 같은 인프라나 내부 가용성 도메인 네트워크를 공유하지 않습니다. 따라서 한 가용성 도메인의 장애가 해당 지역의 다른 가용성 도메인에 영향을 미치지 않아야 합니다.
- 결함 도메인
장애 도메인은 가용성 도메인 내의 하드웨어 및 인프라 그룹을 의미합니다. 각 가용성 도메인에는 3개의 장애 도메인과 독립적인 전원 및 하드웨어가 있습니다. 여러 결함 도메인에 리소스를 분산할 때 응용 프로그램은 결함 도메인 내에서 물리적 서버 실패, 시스템 유지 관리 및 정전이 발생할 수 있습니다.
- OCI 가상 클라우드 네트워크 및 서브넷
VCN(가상 클라우드 네트워크)은 OCI 리전에 설정하는 커스터마이징 가능한 소프트웨어 정의 네트워크입니다. 기존 데이터 센터 네트워크와 마찬가지로 VCN을 사용하면 네트워크 환경을 제어할 수 있습니다. VCN에는 VCN을 생성한 후 변경할 수 있는 겹치지 않는 CIDR(클래스리스 도메인 간 경로 지정) 블록이 여러 개 있을 수 있습니다. VCN을 서브넷으로 분할할 수 있으며, 이 서브넷은 지역 또는 가용성 도메인으로 범위가 지정될 수 있습니다. 각 서브넷은 VCN의 다른 서브넷과 겹치지 않는 연속적인 주소 범위로 구성됩니다. 썸네일의 크기는 생성 이후 변경할 수 있습니다. 서브넷은 공용 또는 전용일 수 있습니다.
- DRG(동적 경로 지정 게이트웨이)
The DRG is a virtual router that provides a path for private network traffic between VCNs in the same region, between a VCN and a network outside the region, such as a VCN in another OCI region, an on-premises network, or a network in another cloud provider.
- 서비스 게이트웨이
서비스 게이트웨이는 VCN에서 Oracle Cloud Infrastructure Object Storage와 같은 다른 서비스로의 액세스를 제공합니다. VCN에서 Oracle 서비스로의 트래픽은 Oracle 네트워크 패브릭을 통해 이동하며 인터넷을 순회하지 않습니다.
- Oracle Services Network
OSN(Oracle Services Network)은 Oracle 서비스용으로 예약된 OCI의 개념적 네트워크입니다. 이러한 서비스에는 인터넷을 통해 연결할 수 있는 공용 IP 주소가 있습니다. Oracle Cloud 외부의 호스트는 Oracle Cloud Infrastructure FastConnect 또는 VPN Connect를 사용하여 전용으로 OSN에 액세스할 수 있습니다. VCN의 호스트는 서비스 게이트웨이를 통해 전용으로 OSN에 액세스할 수 있습니다.
- Oracle 자율운영 AI 데이터베이스
Oracle Autonomous AI Database는 탄력적으로 스케일링되고 빠른 쿼리 성능을 제공하는 사용하기 쉬운 완전한 자율운영(자체 관리) 데이터베이스를 제공합니다. 서비스로서 데이터베이스 관리가 필요하지 않습니다. 하드웨어를 구성 또는 관리하거나 소프트웨어를 설치할 필요가 없습니다. 또한 데이터베이스 프로비저닝, 백업, 패치 적용 및 업그레이드, 확장 또는 축소 작업을 자동으로 처리하며 탄력적인 서비스입니다. 내장된 AI 기능을 사용하여 모든 데이터로 확장 가능한 AI 기반 앱을 개발할 수 있습니다. 원하는 대규모 언어 모델(LLM)을 사용하여 클라우드 또는 데이터 센터에 배포할 수 있습니다.
- Oracle AI Database 26ai
AI Vector Search가 탑재된 Oracle AI Database 26ai를 사용하면 키워드가 아닌 의미로 데이터를 쿼리할 수 있습니다. 벡터 표현(임베딩)은 유사한 콘텐츠를 효율적으로 찾을 수 있도록 텍스트, 이미지, 오디오 등의 의미를 캡처합니다. 내장된 SQL 거리 함수는 벡터를 사용한 유사성 검색을 허용합니다. 의미상 유사성 및 기타 검색 기준을 RAG(대형 언어 모델)와 결합하여 보다 정확하고 관련성 높은 답변을 얻을 수 있습니다.
- OCI Document Understanding
Oracle Cloud Infrastructure Document Understanding은 딥 러닝 문서 분석을 대규모로 수행하기 위한 AI 서비스입니다. 사전 구축된 모델을 통해 개발자는 머신 러닝 전문 지식 없이도 애플리케이션에 지능형 문서 처리를 쉽게 구축할 수 있습니다.
- Oracle Digital Assistant
Oracle Digital Assistant는 사용자를 위해 디지털 어시스턴트를 생성하고 배치할 수 있는 플랫폼입니다. Oracle Digital Assistant를 사용하면 텍스트, 채팅 및 음성 인터페이스를 통해 비즈니스 애플리케이션을 위한 AI 기반 인터페이스(또는 챗봇)를 생성할 수 있습니다. 각 디지털 어시스턴트에는 사용자가 자연어 대화에서 다양한 작업을 완료할 수 있도록 지원하는 하나 이상의 전문 기술 모음이 있습니다. 예를 들어 개별 디지털 어시스턴트에는 재고 추적, 근무 기록 카드 제출, 경비 보고서 생성과 같은 특정 유형의 태스크에 중점을 두는 기술이 있을 수 있습니다.
- Oracle AI Data Platform
Oracle AI Data Platform은 데이터 자산 전반의 데이터 카탈로그화, 준비, 분석을 간소화하는 통합 플랫폼입니다. 통합 사용자 경험 내에 데이터, AI, 분석 및 거버넌스를 결합하여 안전하고 확장 가능한 AI 기반 애플리케이션을 구축할 수 있습니다. Oracle AI Data Platform은 Autonomous AI Lakehouse, Oracle Analytics Cloud, OCI Object Storage, OCI Generative AI, Fusion Data Intelligence를 통합합니다.
이 플랫폼 내에서 Oracle AI Data Platform Workbench는 데이터 파이프라인 및 모델을 설계, 통합관리 및 배포하고, RBAC 정책을 설정하고, Spark와 같은 오픈 소스 기술을 사용하여 데이터를 준비, 분석 및 보강할 수 있는 전용 개발 환경을 제공합니다.
- OCI 생성형 AI
Oracle Cloud Infrastructure Generative AI는 텍스트 생성, 요약, 의미 검색 등에 대한 광범위한 사용 사례를 다루는 최첨단 맞춤형 대규모 언어 모델(LLM) 세트를 제공하는 완전 관리형 OCI 서비스입니다. 플레이그라운드를 사용하여 즉시 사용 가능한 사전 학습 모델을 시험해 보거나, 전용 AI 클러스터의 자체 데이터를 기반으로 자체 미세 조정된 커스텀 모델을 생성 및 호스팅할 수 있습니다.
- Oracle Integration
Oracle Integration은 클라우드 및 온프레미스 애플리케이션을 통합하고, 비즈니스 프로세스를 자동화하고, 시각적 애플리케이션을 개발할 수 있는 완전 관리형 사전 구성 환경입니다. SFTP 호환 파일 서버를 사용하여 파일을 저장 및 검색하고 수백 개의 어댑터 및 레시피 포트폴리오를 사용하여 Oracle 및 타사 애플리케이션과 연결하여 B2B 거래 파트너와 문서를 교환할 수 있습니다.
- OCI 오브젝트 스토리지
OCI Object Storage는 데이터베이스 백업, 분석 데이터, 이미지 및 비디오와 같은 리치 콘텐츠 등 모든 콘텐츠 유형의 대량의 정형 및 비정형 데이터에 대한 액세스를 제공합니다. 애플리케이션 또는 클라우드 플랫폼 내에서 직접 안전하고 안전하게 데이터를 저장할 수 있습니다. 성능 또는 서비스 안정성이 저하되지 않고 스토리지를 확장할 수 있습니다.
신속하고 즉각적이며 자주 액세스하는 데 필요한 "핫" 스토리지에 표준 스토리지를 사용합니다. 장기간 보관하며 거의 또는 거의 액세스하지 않는 "콜드" 스토리지에 아카이브 스토리지를 사용합니다.
권장사항
- VCN
VCN을 생성할 때 VCN의 서브넷에 연결하려는 리소스 수에 따라 필요한 CIDR 블록 수와 각 블록의 크기를 결정합니다. 표준 전용 IP 주소 공간 내에 있는 CIDR 블록을 사용합니다.
프라이빗 접속을 설정하려는 다른 네트워크(Oracle Cloud Infrastructure, 온프레미스 데이터 센터 또는 다른 클라우드 제공자)와 겹치지 않는 CIDR 블록을 선택합니다.
VCN을 생성한 후 해당 CIDR 블록을 변경, 추가 및 제거할 수 있습니다.
서브넷을 설계할 때 트래픽 흐름 및 보안 요구 사항을 고려하십시오. 특정 계층 또는 역할 내의 모든 리소스를 보안 경계로 사용될 수 있는 동일한 서브넷에 연결합니다.
- NSG(네트워크 보안 그룹)
NSG를 사용하여 특정 VNIC에 적용되는 수신 및 송신 규칙 세트를 정의할 수 있습니다. NSG를 사용하면 VCN의 서브넷 아키텍처를 애플리케이션의 보안 요구 사항과 분리할 수 있으므로 보안 목록 대신 NSG를 사용하는 것이 좋습니다.
- Cloud Guard
사용자정의 감지기 및 응답기 레시피를 생성하도록 Oracle에서 제공하는 기본 레시피를 복제하고 사용자정의합니다. 이러한 레시피를 사용하면 경고를 생성하는 보안 위반 유형과 경고에 대해 수행할 수 있는 작업을 지정할 수 있습니다. 예를 들어 가시성이 퍼블릭으로 설정된 OCI Object Storage 버킷을 감지할 수 있습니다.
테넌시 수준에서 Oracle Cloud Guard를 적용하여 가장 광범위한 범위를 포괄하고 여러 구성을 유지 관리하는 데 드는 관리 부담을 줄입니다.
관리 목록 기능을 사용하여 감지기에 특정 구성을 적용할 수도 있습니다.
- 보안 영역
최대 보안이 필요한 리소스의 경우 Oracle은 보안 영역을 사용할 것을 권장합니다. 보안 영역은 모범 사례를 기반으로 하는 Oracle 정의 보안 정책 레시피와 연관된 컴파트먼트입니다. 예를 들어, 보안 영역의 리소스는 공용 인터넷에서 액세스할 수 없어야 하며 고객 관리 키를 사용하여 암호화해야 합니다. 보안 영역에서 리소스를 생성 및 업데이트할 때 OCI는 레시피의 정책에 대해 작업을 검증하고 정책을 위반하는 작업을 방지합니다.
고려사항
문서 수명 주기의 여러 단계에 대해 다음과 같은 아키텍처 구현을 고려하십시오.
사후 아카이브 인텔리전스:
- 과거 PDF/이미지를 OCI Object Storage에 일괄적으로 수집합니다.
- OCI Document Understanding는 요약, 분류, 엔티티 추출을 위해 텍스트 LLM(기본값)으로 라우팅됩니다.
- 모델 신뢰도가 정의된 임계값(예: 낮은 추출/분류 신뢰도) 미만인 경우 출력을 HITL 검토로 경로 지정합니다.
- 차트 또는 시각적 신호에 대한 선택적 비전 LLM
- 분석 및 검색으로 라우팅된 구조화된 결과(자율운영 AI 데이터베이스/Parquet)를 저장합니다.
디지털화 가속화:
- OCI Document Understanding OCR 및 레이아웃으로 경로 지정된 스캔입니다.
- 텍스트 LLM은 필드를 정규화하고, 분류법을 적용하고, 메타데이터를 태그 지정합니다.
- 테이블 또는 필기에 대한 비전 LLM과의 선택적 비교입니다.
- 모델 신뢰도가 정의된 임계값(예: 낮은 추출/분류 신뢰도) 미만인 경우 출력을 HITL 검토로 경로 지정합니다.
- 지속 및 인덱스화, 검색 및 다운스트림 자동화 지원
트랜잭션 분석(실시간):
- API 또는 포털을 통해 OCI Object Storage의 새로운 제출 구역이 제공됩니다.
- 대기 시간 SLO 내에서 텍스트 LLM으로 라우팅된 OCI Document Understanding에는 사기/이상 및 완전성 검사가 포함됩니다.
- ERP/OTM에서 Oracle Integration을 사용하여 게이트 승인을 상호 확인합니다.
- 오직 예외에 대해서만 히틀; 나머지는 곧바로 흐른다.
이러한 문제를 해결할 때 취할 수 있는 접근 방식과 사용할 추가 파이프라인 전략에 대해 다음과 같은 다양한 기준을 고려하십시오.
- 기본값: 정리 및 추출을 위해 텍스트 LLM(예: Command-A)에 대한 OCI Document Understanding
- 비전 경로: 비주얼 헤비 또는 로우 OCI Document Understanding 신뢰도를 제공하는 Llama 4 Maverick.
- 비교/합의(선택 사항): OCI Document Understanding를 LLM 및 OCI Vision과 함께 실행하고, 충돌(우선 순위 규칙 및 비즈니스 검증기)을 조정합니다.
- 다중 페이지/다중 이미지 정책:
- 연속성을 유지하기 위해 매버릭 호출당 최대 10페이지/이미지
- 롤링 요약 프롬프트와 함께 슬라이딩 윈도우(1–10, 6–15, …)를 사용하여 토큰을 줄이고 컨텍스트를 유지합니다.
- 언어 처리: 언어 선점 및 OCI Document Understanding 지원을 기반으로 경로를 지정합니다. OCI Vision 경로 또는 텍스트 전용 폴백으로 경로 지정된 소수의 언어입니다.
자세히 살펴보기
GenAI, OCI를 통한 문서 프로세스 자동화와 Oracle과의 클라우드 여정 시작에 대해 자세히 알아보십시오.
다음 추가 리소스를 검토하십시오.
- Oracle은 GenAI 샘플 앱으로 다양한 문서 처리를 제공합니다. GitHub로 이동합니다.
- 개발자 코칭 - 복잡한 문서에 대한 다중 모달 모델 검색 Oracle Developers YouTube 채널에서
- Oracle Cloud Infrastructure 문서
- Oracle Cloud Infrastructure의 잘 설계된 프레임워크
- Oracle Cloud 비용 예측기
- 클라우드 도입 프레임워크

