埋込みモデル

埋込みモデルは、効率的な取得のためにドキュメントをベクトル表現に変換し、ドキュメント・ストア内のすべての操作の中心になります。ユーザーは、パフォーマンス、コストおよびプライバシ要件に応じて、ローカルとリモート・モデルのどちらかを選択できます。

Hugging Faceで使用可能なすべてのONNX互換モデルを指定でき、各Coherence RAGクラスタ・メンバーに自動的にダウンロードされ、ONNX Runtimeを使用してローカルで実行されます。

モデルの指定に使用される構文は、`<provider>/<modelName>`です。前述の構成例では、`sentence-transformers`はプロバイダですが、`all-mpnet-base-v2`はモデル名です。偶然ではなく、これは、Hugging Faceのモデル名の横にある、'モデル名をクリップボードにコピー'リンクをクリックした場合に取得するものと完全に一致します。

リモート・モデルは同じ構文を使用しますが、この場合、プロバイダはモデルをホストするクラウド・プロバイダの名前(`OCI`や`OpenAI`など)ですが、モデル名はプロバイダによって定義されたモデルの実際の名前(OCIの場合は`cohere.embed-multilingual-v3.0`、OpenAIの場合は`text-embedding-3-small`など)です。

Coherence RAGはOllamaもサポートしており、自己ホスト型リモート・モデルというハイブリッド・アプローチを提供します。Ollamaでホストされているモデルを使用するには、プロバイダ名として`ollama`を使用し、モデル名としてOllamaでホストされているモデルの実際の名前を使用します。