Cohere Rerank 3.5 (New)
cohere.rerank.3-5
モデルは、問合せおよびテキストのリストを取得し、各テキストに関連スコアが割り当てられた順序付き配列を生成します。関連性スコアは、モデルが文書をランク付けする方法、つまり、各テキストが問合せにどの程度一致するかです。
これらのリージョンで使用可能
- ブラジル東部(サンパウロ)(専用AIクラスタのみ)
- ドイツ中央部(フランクフルト)(専用AIクラスタのみ)
- 日本中央部(大阪)(専用AIクラスタのみ)
- サウジアラビア中央部(リヤド)(専用AIクラスタのみ)
- 英国南部(ロンドン)(専用AIクラスタのみ)
- 米国東部(アッシュバーン)(専用AIクラスタのみ)
- 米国中西部(シカゴ)(専用AIクラスタのみ)
このモデルへのアクセス
主な機能
- 専用モードのみ。
- オンデマンドまたはプレイグラウンドでは使用できません。
- APIおよびSDKを介して、クラスタでホストされているモデルにアクセスします。
- 専用モードの場合は、ホスティング専用AIクラスタにエンドポイントを作成し、クラスタでモデルをホストしてから、RerankText APIまたはその関連SDKを実行します。
モデルの専用AIクラスタ
リストされた任意のリージョンの専用AIクラスタを介してモデルに到達するには、専用AIクラスタにそのモデルのエンドポイントを作成する必要があります。このモデルに一致するクラスタユニットサイズについては、次の表を参照してください。
ベース・モデル | ファインチューニング・クラスタ | ホスティング・クラスタ | 価格設定ページ情報 | クラスタ制限の引上げをリクエスト |
---|---|---|---|---|
|
ファインチューニングに使用できません |
|
|
|
ヒント
専用AIクラスタでCohere Rerank 3.5モデルをホストするための十分なクラスタ制限がテナンシにない場合は、dedicated-unit-rerank-cohere-count
制限を1増やすようにリクエストします。
クラスタのエンドポイント・ルール
- 専用AIクラスタは、最大50個のエンドポイントを保持できます。
- これらのエンドポイントを使用して、同じベース・モデルまたは同じバージョンのカスタム・モデルのいずれかを指し示す別名を作成しますが、両方のタイプは作成しません。
- 同じモデルの複数のエンドポイントにより、異なるユーザーまたは目的に簡単に割り当てることができます。
ホスト・クラスタ・ユニット・サイズ | エンドポイント・ルール |
---|---|
RERANK_COHERE |
|
ヒント
-
ホスティング・クラスタでサポートされるコール・ボリュームを増やすには、専用AIクラスタを編集してインスタンス数を増やします。専用AIクラスタの更新を参照してください。
-
クラスタ当たり50を超えるエンドポイントの場合、制限
endpoint-per-dedicated-unit-count
の引上げをリクエストします。サービス制限の引上げのリクエストおよび生成AIのサービス制限を参照してください。
クラスタ・パフォーマンス・ベンチマーク
様々なシナリオについて、Cohere Rerank 3.5クラスタ・パフォーマンス・ベンチマークを確認します。
リリース日と除・売却日
モデル | リリース日 | オンデマンド処分日 | 専用モード除・売却日 |
---|---|---|---|
cohere.rerank.3-5
|
2025-05-14 | このモデルではオンデマンド・モードは使用できません。 | 最初の交換モデルのリリースから少なくとも6か月後。 |
モデル・パラメータの再ランク付け
モデル・パラメータの再ランク付けについては、RerankText APIドキュメントを参照してください。