47 概要
検索拡張生成(RAG)は、LLMの制限に対処するために開発されたアプローチです。RAGは、事前トレーニング済言語モデルの長所と、応答の生成中にデータセットまたはデータベースから最新かつ正確な情報をリアルタイムで取得する機能を組み合せます。
Coherence RAG (Retrieval-Augmented Generation)は、CPUおよびGPUベースのハードウェアの両方で、きわめてスケーラブルなドキュメント取込みおよびベクトル埋込み作成用に設計されています。ローカルとリモートの両方の埋込みモデルを使用して、任意のソースからドキュメントを取り込むことで、効率的で正確な検索拡張レスポンスが可能になります。
さらに、Coherence RAGは、外部ベクトル・ストアとのオプションの統合を実現し、格納および取得ソリューションの柔軟性をユーザーに提供します。この組合せにより、大規模なAIアプリケーションの高パフォーマンスのドキュメント処理、取得および拡張が保証されます。