Cohere Embed English 3
OCI生成AIの専用AIクラスタの1つのEmbed Cohereユニットでホストされているcohere.embed-english-v3.0
(Cohere Embed English 3)モデルのパフォーマンス・ベンチマークを確認します。
埋込み
このシナリオは、埋込みモデルにのみ適用されます。このシナリオは、ベクトル・データベースのデータ取込みパイプラインの一部として生成を埋め込むことを模倣します。このシナリオでは、すべてのリクエストが同じサイズ(96ドキュメント)で、それぞれに512トークンがあります。たとえば、大きいPDFファイルの集まりで、ユーザーがベクトルDBに取り込む30,000以上の単語を含む各ファイルがあります。
同時実行性 | リクエスト・レベルのレイテンシ(秒) | リクエスト・レベルのスループット(リクエスト/分) (RPM) |
---|---|---|
1 | 2.53 | 24 |
8 | 4.35 | 108 |
32 | 14.93 | 120 |
128 | 47.66 | 150 |
より軽い埋め込み
このシナリオは、埋込みモデルにのみ適用されます。このより軽い埋込みシナリオは埋込みシナリオに似ていますが、各リクエストのサイズを512個のトークンを持つ16個のドキュメントに減らす点が異なります。このシナリオでは、より少ない単語の小さいファイルをサポートできます。
同時実行性 | リクエスト・レベルのレイテンシ(秒) | リクエスト・レベルのスループット(リクエスト/分) (RPM) |
---|---|---|
1 | 1.19 | 54 |
8 | 1.41 | 348 |
32 | 3.47 | 600 |
128 | 12.08 | 558 |