Cohere Rerank 3.5
cohere.rerank.v3-5モデルは、問合せとテキストのリストを取得し、各テキストに関連性スコアが割り当てられた順序付き配列を生成します。関連性スコアは、モデルが文書をどのようにランク付けするか、つまり各テキストが問合せにどの程度一致するかです。
このモデルのリージョン
このモデルへのアクセス
主な機能
モデルの専用AIクラスタ
- モデルは専用モードでのみ使用できます。(オンデマンドでは利用できません。)
- 専用モードの場合は、ホスティング専用AIクラスタにエンドポイントを作成し、クラスタでモデルをホストしてから、RerankText APIまたはその関連SDKを実行します。
このモデルに一致するクラスタユニットサイズについては、次の表を参照してください。
| ベース・モデル | クラスタのファインチューニング | ホスト・クラスタ | 価格設定ページ情報 | クラスタ制限の引上げのリクエスト |
|---|---|---|---|---|
|
ファインチューニングに使用できません |
|
|
|
ヒント
専用AIクラスタでCohere Rerank 3.5モデルをホストするための十分なクラスタ制限がテナンシにない場合は、dedicated-unit-rerank-cohere-count制限をリクエストして1増やします。
クラスタのエンドポイント・ルール
- 専用AIクラスタには、最大50のエンドポイントを保持できます。
- これらのエンドポイントを使用して、同じベース・モデルまたは同じバージョンのカスタム・モデルのいずれかを指し示すが、両方の型を指さない別名を作成します。
- 同じモデルの複数のエンドポイントにより、それらを異なるユーザーまたは目的に簡単に割り当てることができます。
| ホスト・クラスタ・ユニット・サイズ | エンドポイント・ルール |
|---|---|
| RERANK_COHERE |
|
ヒント
-
ホスティング・クラスタでサポートされているコール・ボリュームを増やすには、専用AIクラスタを編集してインスタンス数を増やします。専用AIクラスタの更新を参照してください。
-
クラスタ当たり50を超えるエンドポイントの場合は、制限
endpoint-per-dedicated-unit-countの引上げをリクエストします。「制限引上げリクエストの作成」および生成AIのサービス制限を参照してください。
クラスタ・パフォーマンス・ベンチマーク
様々なシナリオのCohere Rerank 3.5クラスタ・パフォーマンス・ベンチマークを確認します。
OCIのリリース日および除・売却日
リリース日およびリタイア日および置換モデル・オプションについては、モード(オンデマンドまたは専用)に基づいて次のページを参照してください。
リリースおよび除・売却日
リリース日および除・売却日および置換モデル・オプションについては、次のページを参照してください。
モデル・パラメータの再ランク付け
Rerankモデル・パラメータについては、RerankText APIドキュメントを参照してください。