Oracle Cloud Infrastructure Generative AI 에이전트와 상호 작용하기 위한 웹 기반 사용자 인터페이스 구현

Oracle Cloud Infrastructure Generative AI(OCI Generative AI) 에이전트를 사용하여 대화형 웹 인터페이스를 구현하면 사용자가 실시간 대화에 참여할 수 있습니다.

OCI Generative AI는 OCI 콘솔 외부의 사용자 인터페이스를 제공하지 않으며 사용자가 API를 사용하여 웹 프로젝트에 통합하고자 합니다. 이 참조 아키텍처는 OCI Generative AI 에이전트를 사용하는 웹 애플리케이션을 보여줍니다. 이 에이전트는 실시간 음성-텍스트 및 텍스트-음성에도 통합되어 클라이언트의 테넌트 데이터를 남기지 않고도 완전한 환경을 제공합니다. 이 솔루션에는 웹 애플리케이션을 연결하는 가상 머신과 웹 소켓을 통해 OCI Speech 서비스를 연결하는 가상 머신이 포함됩니다.

OCI Speech 실시간 전사를 사용하면 사용자가 말하는 모든 내용이 즉시 텍스트로 변환되어 AI 에이전트가 처리합니다. 그러면 AI 에이전트가 응답을 생성합니다. 이 응답은 화면에 표시될 뿐만 아니라 OCI Speech Text to Speech 기능을 통해 사용자에게 다시 음성으로 전달됩니다. 이로 인해 완전히 몰입감 있고 자연스럽고 역동적인 상호 작용이 만들어지며 고객 서비스, 가상 어시스턴트 및 대화형 AI 솔루션에 이상적입니다.

구조

이 참조 아키텍처는 Oracle Visual Builder를 프론트엔드 인터페이스로 기반으로 구축되었으며, OCI Generative AI 에이전트 및 OCI Speech와 원활하게 통합됩니다.

  1. Oracle Visual Builder는 VM Bridge with Python SDK를 통해 사용자 입력을 OCI Speech로 전송합니다.
  2. OCI Speech의 text-to-speech(텍스트 음성 변환) 기능을 사용하면 애플리케이션 전반에서 인간과 유사한 음성을 텍스트로 합성할 수 있습니다. 이 기능은 고객 대화, 다국어 음성 번역 및 향상된 접근성을 가능하게 합니다. 상호 작용을 향상시키기 위해 다양한 목소리 중에서 선택하십시오.
  3. Oracle Visual Builder는 사용자 상호작용을 처리하고, REST API를 통해 OCI Generative AI 에이전트에 사용자 입력을 전송하고, 에이전트의 응답을 실시간으로 표시합니다.

    OCI Generative AI 에이전트는 백그라운드에서 OCI Generative AI를 사용하여 Cohere 및 Meta에서 사전 학습된 기본 모델에 액세스할 수 있습니다. 전용 AI 클러스터를 전용 GPU와 함께 지원하여 호스팅 및 미세 조정을 포함한 안정적인 고성능 운영 워크로드를 지원합니다.

    Chat API 및 Playground는 OCI 콘솔 또는 API를 통해 Cohere 및 Meta 모델과의 대화형 채팅 경험을 제공합니다. LangChain 통합을 통해 OCI Generative AI 애플리케이션을 유연하게 개발할 수 있으며, LlamaIndex 통합을 통해 맞춤형 데이터 소스로 RAG 솔루션을 구축할 수 있습니다. 운영의 경우 OCI Generative AI는 콘텐츠 조정 제어를 포함하며 곧 작동 중지 시간 없이 모델 엔드포인트 스와핑과 활성화 및 비활성화 기능을 지원합니다. 또한 통화 통계, 처리된 토큰 및 오류 수를 포함한 모델 사용에 대한 분석을 제공합니다.

  4. 음성 출력의 경우 OCI Speech TTS(Text-to-Speech) 서비스는 에이전트의 응답을 음성 오디오로 변환하여 사용자 경험을 향상시킵니다.

다음 다이어그램은 이 참조 아키텍처를 보여 줍니다.



oci-genai-speech-arch-oracle.zip

구조에는 다음과 같은 구성 요소가 있습니다.

  • 계산

    Oracle Cloud Infrastructure Compute를 사용하면 클라우드에서 컴퓨트 호스트를 프로비저닝하고 관리할 수 있습니다. CPU, 메모리, 네트워크 대역폭 및 스토리지에 대한 리소스 요구사항을 충족하는 구성을 사용하여 컴퓨트 인스턴스를 실행할 수 있습니다. 컴퓨트 인스턴스를 생성한 후 안전하게 액세스하고, 다시 시작하고, 볼륨을 연결 및 분리하고, 더 이상 필요하지 않을 때 이를 종료할 수 있습니다.

  • OCI 음성

    OCI Speech는 여러 클라우드 네이티브 AI 서비스 중 하나입니다. OCI 음성 서비스를 사용하여 오디오 파일을 JSON 형식으로 저장된 읽기 가능한 텍스트로 변환할 수 있습니다.

    OCI Speech(OCI 음성)는 사람의 음성이 들어 있는 오디오 파일을 매우 정확한 텍스트 번역으로 쉽게 변환할 수 있도록 하여 음성 언어의 위력을 활용합니다. 이 서비스는 웹 애플리케이션, REST API, SDK, CLI 또는 콘솔을 사용하여 액세스할 수 있는 OCI 네이티브 애플리케이션입니다.

    OCI Speech는 자동 음성 인식(ASR) 기술을 사용해 문법적으로 올바른 비디오 및 오디오 파일 필사를 제공합니다. OCI Speech(OCI 음성)는 충실도가 낮은 오디오 녹음을 처리하고 회의나 콜센터 통화와 같은 까다로운 녹음을 녹음합니다. Speech를 사용하면 OCI Object Storage 또는 데이터 자산에 저장된 파일을 정확하고, 정규화되고, 타임스탬프가 적용되고, 신성하게 필터링된 텍스트로 전환할 수 있습니다. 이 기능은 다운스트림 서비스와 함께 제공됩니다. 예를 들어, 언어 및 예측과 같은 추가 서비스를 사용하여 통화 감성을 분석하고, 광고를 위한 콘텐츠를 타겟팅하고, 미디어 폴더를 인덱스화하고, Oracle Cloud Infrastructure Lakehouse를 사용하여 미디어 검색 엔진을 생성할 수 있습니다.

  • OCI Generative AI 에이전트

    OCI Generative AI 에이전트는 대규모 언어 모델(LLM)의 위력을 지식 기반을 검색하여 상황별 관련 답변을 생성하기 위한 지능형 검색 시스템과 결합하는 전담 관리 서비스입니다.

    OCI Generative AI 에이전트는 사용자와 고객이 채팅 인터페이스 또는 API를 사용하여 데이터와 상호 작용할 수 있는 여러 가지 데이터 온보딩 방법을 지원합니다.

    • 여러 데이터 온보딩 방법 및 상호 작용 채널(채팅 인터페이스 또는 API)을 지원합니다.
    • 지식 기반을 검색하여 상황별 관련 답변을 생성합니다.
    • 모든 답변에 대한 출처 속성을 제공합니다.
    • 하이브리드 검색 기능(유연한 의미와 의미)을 제공합니다. 입력 및 출력에 대한 콘텐츠 조정 옵션을 포함합니다.
    • 사용자가 후속 질문을 하고 이전 질문과 답변의 컨텍스트를 고려하는 답변을 수신할 수 있는 다중 전환 대화를 지원합니다.
    • 시각적 요소에 대한 명시적 설명 없이 2축 차트와 참조 테이블의 데이터를 PDF로 해석할 수 있습니다.
    • PDF 문서에 있는 모든 하이퍼링크가 추출되어 채팅 응답에 하이퍼링크로 표시됩니다.
  • Oracle Visual Builder

    Oracle Visual Builder는 개발 및 호스팅 플랫폼을 기반으로 하는 직관적인 개발 경험으로 매력적인 반응형 애플리케이션을 만들 수 있습니다. 사용 편의성 및 시각적 개발 접근 방식에 중점을 두어 Oracle의 안전하고 확장 가능한 클라우드 플랫폼에 호스팅되는 애플리케이션을 쉽게 생성할 수 있는 방법을 제공합니다.

    시각적 개발 경험

    Oracle Visual Builder는 추가 소프트웨어를 설치할 필요 없이 간단하지만 강력한 시각적 개발 툴을 제공하여 반응형 앱을 생성합니다. 이 풍부한 시각적 도구 세트는 UI 구성요소를 끌어 놓고 속성을 사용자정의하여 동작을 정의함으로써 신속하게 앱을 설계하는 데 도움이 됩니다. 이러한 도구는 로우 코드 개발자에게 제공되지만 숙련된 개발자는 기본 소스 코드에 쉽게 액세스 할 수 있으며 복잡한 요구 사항에 대해 표준 HTML5, JavaScript 및 CSS 기술을 사용하여 확장 할 수도 있습니다.

    간편한 데이터 접근

    Oracle Visual Builder를 사용하면 REST 기반 서비스를 통해 앱의 데이터에 쉽게 액세스할 수 있습니다. 따라서 재사용 가능한 비즈니스 객체를 생성하여 앱의 비즈니스 논리를 구현하고 데이터를 저장할 수 있습니다. 그런 다음 Oracle Visual Builder에서 자동으로 생성하는 REST 엔드포인트를 통해 관리하거나 REST 서비스의 통합 카탈로그에서 Oracle SaaS 또는 Oracle Integration 애플리케이션에서 노출된 데이터 객체를 선택할 수 있습니다. 몇 번의 클릭만으로 모든 외부 REST 서비스의 데이터에 접근할 수도 있습니다.

    개발 및 호스팅 플랫폼

    Oracle Visual Builder는 완벽한 개발 툴이자 호스팅 플랫폼으로, 개발에서 테스트 및 최종 게시에 이르기까지 애플리케이션의 라이프사이클을 바로 관리할 수 있습니다. 버전 관리 및 데이터 마이그레이션은 앱의 라이프사이클에 내장되어 있어 앱의 스테이지 및 게시, 모든 단계에서 데이터를 손쉽게 관리할 수 있습니다.

확인

  • 작성자: Jesus Brasero Jimenez
  • 제공자: Anupama Pundpal