Cohere Rerank 4
Cohere Rerank 4は、ProとFastの2つのバリアントで使用可能な再ランク・モデルです。
Rerankingを使用すると、取得した結果の初期セットを並べ替えることで、検索の関連性が向上します。取得ステップによって候補者文書が返されると、再ランク付けモデルによって各候補者と問合せが比較され、最も関連性が低いものから最も関連性が低いものへと結果がランク付けされます。
Cohere Rerank 4は、JSON、テーブル、コードのようなコンテンツなど、多言語の再ランキングおよび半構造化コンテンツをサポートしています。
Rerank 4の新機能
Cohere Rerank 3.5と比較して、Rerank 4は、より大きなコンテキスト・ウィンドウ、再ランク付けの品質向上、セルフラーニング・サポート、および異なるワークロード要件に最適化された2つのバリアントを追加します。
- コンテキスト・ウィンドウの増加
-
Rerank 4では、32,000トークンのコンテキスト・ウィンドウがサポートされています。コンテキスト・ウィンドウが大きいほど、長い文書の処理が改善され、候補者入力が大きくなります。これは、レポート、契約、マニュアル、技術文書などの密度の高いエンタープライズ・コンテンツに役立ちます。
- 再ランキング品質の向上
-
Rerank 4では、エンタープライズ取得ワークロードの結果の順序付けが改善されています。ビジネス、財務、技術、その他のドメイン固有のコンテンツに対してより強力な関連性ランキングを提供します。これにより、より関連性の高いコンテキストを表示することで、下流の検索拡張生成ワークフローを改善できます。
- セルフラーニングのサポート
-
Rerank 4では、自己学習サポートが導入され、注釈付きトレーニング・データを必要とせずに、再ランク付けの動作をドメイン固有のデータ、用語および関連性プリファレンスに適応させるのに役立ちます。
- ProおよびFastバリアント
-
Rerank 4は、次の2つのバリアントで使用できます。
- Proは、より精度の高い再ランク付けおよびより複雑な取得タスク用に最適化されています。
- 高速は、低レイテンシで高スループットのワークロード用に最適化されています。
- 多言語および半構造化データのサポート
-
Rerank 4は、100以上の言語にわたる英語および英語以外のコンテンツの再ランク付けをサポートしています。また、JSON、表、コードのようなコンテンツなど、半構造化コンテンツもサポートしています。
このモデルのリージョン
モデル・バリアント
Cohere Rerank 4には、次のモデル・バリアントが含まれています。
| モデル | OCIモデル名 | 摘要 |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
英語および英語以外のテキストおよび半構造化JSONデータ用の多言語再ランキング・モデル。品質重視の複雑な再ランキング・ワークロードに最適です。 |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
英語および英語以外のテキストおよび半構造化JSONデータ用の軽量多言語再ランキング・モデル。低レイテンシおよび高スループットのワークロードに最適です。 |
オンデマンドモード
一部のCohere Rerank 4バリアントは、サポートされているリージョンでオンデマンドで使用できます。オンデマンド・モードでは、専用のAIクラスタは必要ありません。
オンデマンドで使用可能なモデル・バリアントおよびリージョンを確認するには、リージョン別モデルを参照してください。
| モデル名 | OCIモデル名 | 価格設定ページ製品名 |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Rerank 4 Pro |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Rerank 4 Fast |
価格は1,000件の検索ユニットに基づいています。価格ページを参照してください。
オンデマンド・モードについて学習します。
モデルの専用AIクラスタ
一部のCohere Rerank 4バリアントは、サポートされているリージョンの専用AIクラスタを介して使用できます。これらのモデルはファインチューニングに使用できません。
専用モードの場合は、ホスティング専用AIクラスタにエンドポイントを作成します。
| モデル | ハードウェアユニットサイズ | 使用可能なリージョン | クラスタ制限の引上げのリクエスト |
|---|---|---|---|
Cohere Rerank 4 Pro(cohere.rerank-v4.0-pro) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Pro(cohere.rerank-v4.0-pro) |
COHERE_H100_X1 |
|
|
Cohere Rerank 4 Fast(cohere.rerank-v4.0-fast) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Fast(cohere.rerank-v4.0-fast) |
COHERE_H100_X1 |
|
|
価格については、原価試算ツールおよび価格ページを参照してください。
テナンシに、専用AIクラスタでこれらのモデルをホストするための十分な制限がない場合は、ターゲット・リージョンで使用されるハードウェア・シェイプの制限の引上げをリクエストします。たとえば、米国西部(フェニックス)でモデルをホストするには、dedicated-unit-a100-80g-countに対して1の増加をリクエストします。
このモデルへのアクセス
Cohere Rerank 4モデルを使用するには、サポートされているリージョンからRerankText APIをコールします。
- エンドポイント
https://inference.generativeai.{region}.oci.oraclecloud.com- API操作
POST /20231130/actions/rerankText
RerankTextDetailsのservingModeで、モデルへのアクセス方法に基づいてservingType属性を設定します。
- サポートされているリージョンのオンデマンド・モデルには、
ON_DEMANDを使用します。 - 専用AIクラスタ・エンドポイントでホストされているモデルには、
DEDICATEDを使用します。
可用性および設定の詳細は、前述のオンデマンド・モードおよびモデルの専用AIクラスタの項を参照してください。
OCIのリリース日および除・売却日
リリース日およびリタイア日および置換モデル・オプションについては、モード(オンデマンドまたは専用)に基づいて次のページを参照してください。
モデル・パラメータの再ランク付け
Rerankモデル・パラメータについては、RerankText APIドキュメントを参照してください。