Cohere Rerank 3.5
cohere.rerank.v3-5モデルは、問合せとテキストのリストを取得し、各テキストに関連性スコアが割り当てられた順序付き配列を生成します。関連性スコアは、モデルが文書をどのようにランク付けするか、つまり各テキストが問合せにどの程度一致するかです。
これらの商業地域で利用可能
- ブラジル東部(サンパウロ)(専用AIクラスタのみ)
- ドイツ中央部(フランクフルト)(専用AIクラスタのみ)
- 日本中部(大阪)(専用AIクラスタのみ)
- サウジアラビア中央部(リヤド)(専用AIクラスタのみ)
- 英国南部(ロンドン)(専用AIクラスタのみ)
- 米国東部(アッシュバーン)(専用AIクラスタのみ)
- 米国中西部(シカゴ)(専用AIクラスタのみ)
このソブリン・リージョンで使用可能
このモデルは、次のAPIエンドポイントを介してEU Sovereign Central (フランクフルト)で使用できます:
- 推論API:
https://inference.generativeai.eu-frankfurt-2.oci.oraclecloud.eu - 管理API:
https://generativeai.eu-frankfurt-2.oci.oraclecloud.eu
APIでは、モデル名とモデルOCIDの両方にcohere.rerank.v3-5を使用します。このモデルは、専用AIクラスタ・エンドポイントを介してのみこのリージョンで使用できます。
Oracle EU Sovereign Cloudについて学習します。
この政府リージョンで使用可能
このモデルは、次のAPIエンドポイントを介してUK Gov South (ロンドン)で使用できます:
- 推論API:
https://inference.generativeai.uk-gov-london-1.oci.oraclegovcloud.uk - 管理API:
https://generativeai.uk-gov-london-1.oci.oraclegovcloud.uk
APIでは、モデル名とモデルOCIDの両方にcohere.rerank.v3-5を使用します。このモデルは、専用AIクラスタ・エンドポイントを介してのみこのリージョンで使用できます。
Oracle Cloud Infrastructure United Kingdom Government Cloudについて学習します。
このモデルへのアクセス
主な機能
- 専用モードのみ。
- オンデマンドまたはプレイグラウンドでは使用できません。
- APIおよびSDKを介してクラスタでホストされているモデルにアクセスします。
- 専用モードの場合は、ホスティング専用AIクラスタにエンドポイントを作成し、クラスタでモデルをホストしてから、RerankText APIまたはその関連SDKを実行します。
モデルの専用AIクラスタ
リストされているリージョン内の専用AIクラスタを介してモデルに到達するには、専用AIクラスタ上でそのモデルのエンドポイントを作成する必要があります。このモデルに一致するクラスタユニットサイズについては、次の表を参照してください。
| ベース・モデル | クラスタのファインチューニング | ホスト・クラスタ | 価格設定ページ情報 | クラスタ制限の引上げのリクエスト |
|---|---|---|---|---|
|
ファインチューニングに使用できません |
|
|
|
専用AIクラスタでCohere Rerank 3.5モデルをホストするための十分なクラスタ制限がテナンシにない場合は、dedicated-unit-rerank-cohere-count制限をリクエストして1増やします。
クラスタのエンドポイント・ルール
- 専用AIクラスタには、最大50のエンドポイントを保持できます。
- これらのエンドポイントを使用して、同じベース・モデルまたは同じバージョンのカスタム・モデルのいずれかを指し示すが、両方の型を指さない別名を作成します。
- 同じモデルの複数のエンドポイントにより、それらを異なるユーザーまたは目的に簡単に割り当てることができます。
| ホスト・クラスタ・ユニット・サイズ | エンドポイント・ルール |
|---|---|
| RERANK_COHERE |
|
-
ホスティング・クラスタでサポートされているコール・ボリュームを増やすには、専用AIクラスタを編集してインスタンス数を増やします。専用AIクラスタの更新を参照してください。
-
クラスタ当たり50を超えるエンドポイントの場合は、制限
endpoint-per-dedicated-unit-countの引上げをリクエストします。サービス制限の引上げのリクエストおよび生成AIのサービス制限を参照してください。
クラスタ・パフォーマンス・ベンチマーク
様々なシナリオのCohere Rerank 3.5クラスタ・パフォーマンス・ベンチマークを確認します。
リリースおよび除・売却日
| モデル | リリース日 | オンデマンド除・売却日 | 専用モード除・売却日 |
|---|---|---|---|
cohere.rerank.v3-5
|
2025-05-14 | オンデマンド・モードはこのモデルでは使用できません。 | 最初の交換モデルのリリースから少なくとも6か月後。 |
モデル・パラメータの再ランク付け
Rerankモデル・パラメータについては、RerankText APIドキュメントを参照してください。