이미지는 다중 모델 AI 모델을 보여줍니다. 이 모델에는 다음 구성 요소가 포함됩니다.

사용자가 오디오/비디오를 음성으로 모델의 텍스트로 보냅니다. 텍스트는 음성에서 텍스트로, OCI의 LLM으로 흐릅니다.

텍스트는 OCI의 LLM에서 Text to Speech로 흐르고, 오디오/비디오는 사용자에게 전달됩니다.