此圖像顯示多模式 AI 模型。模型包含下列元件:
使用者將音訊 / 視訊傳送至模型中的「語音」至「文字」。文字從語音轉移至 OCI 上的 LLM。
文字會從 OCI 上的 LLM 流向文字轉語音,然後音訊 / 視訊會流向使用者。