Cohere Embed English Image 3
OCI生成AIの専用AIクラスタの1つの Embed Cohere ユニットでホストされるcohere.embed-english-image-v3.0 (Cohere Embed English Image 3)モデルのパフォーマンス・ベンチマークを確認します。
-
- このモデルの使用可能なリージョンを参照してください。
- このモデルをホストするための専用AIクラスタ・ユニット・サイズをモデル・ページで確認します。
- メトリックを確認します。
テキストの埋込み
このシナリオは、埋込みモデルにのみ適用されます。このシナリオでは、ベクトル・データベースのデータ取込みパイプラインの一部として生成を埋め込むことを模倣します。このシナリオでは、すべてのリクエストが同じサイズで、それぞれ512個のトークンを持つ96個のドキュメントです。たとえば、ユーザーがベクトルDBに収集する単語が30,000個以上ある大きなPDFファイルの集合です。
| 同時実行性 | リクエスト・レベル・レイテンシ(秒) | リクエスト・レベルのスループット(リクエスト/分)(RPM) |
|---|---|---|
| 1 | 2.53 | 24 |
| 8 | 4.35 | 108 |
| 32 | 14.93 | 120 |
| 128 | 47.66 | 150 |
より軽いテキスト埋込み
このシナリオは、埋込みモデルにのみ適用されます。このより軽い埋込みシナリオは埋込みシナリオと似ていますが、各リクエストのサイズを、それぞれ512個のトークンを持つ16個のドキュメントに減らす点が異なります。このシナリオでは、単語数が少ない小さいファイルをサポートできます。
| 同時実行性 | リクエスト・レベル・レイテンシ(秒) | リクエスト・レベルのスループット(リクエスト/分)(RPM) |
|---|---|---|
| 1 | 1.19 | 54 |
| 8 | 1.41 | 348 |
| 32 | 3.47 | 600 |
| 128 | 12.08 | 558 |
イメージ埋込み
このシナリオは、イメージ入力を含む埋込みモデルにのみ適用されます。各シナリオで、I(M、N): Image with height Npx and width Mpxは、高さがMで幅がNピクセルのイメージを表します。たとえば、I(1024,512)は、高さが1,024ピクセル、幅が512ピクセルのイメージです。
I(512,512)
次の表に、高さと幅が512ピクセルのイメージのシナリオで、専用AIクラスタの1つの Embed Cohere ユニットでホストされたcohere.embed-english-image-v3.0を使用した専用AIクラスタ・ベンチマークのホスティングを示します。
| 同時実行性 | リクエスト・レベル・レイテンシ(秒) | リクエスト・レベルのスループット(リクエスト/秒) (RPS) |
|---|---|---|
| 1 | 0.13 | 6.60 |
| 2 | 0.13 | 12.58 |
| 4 | 0.13 | 24.30 |
| 8 | 0.14 | 43.81 |
| 16 | 0.16 | 74.34 |
| 32 | 0.23 | 105.97 |
| 64 | 0.45 | 107.50 |
| 128 | 0.92 | 99.56 |
| 256 | 1.90 | 88.71 |
I(1024,512)
次の表に、専用AIクラスタの1つの Embed Cohere ユニットでホストされたcohere.embed-english-image-v3.0を使用した専用AIクラスタ・ベンチマークのホスティングを示します(高さが1,024ピクセルで幅が512ピクセルのイメージのシナリオ)。
| 同時実行性 | リクエスト・レベル・レイテンシ(秒) | リクエスト・レベルのスループット(リクエスト/秒) (RPS) |
|---|---|---|
| 1 | 0.14 | 5.72 |
| 2 | 0.14 | 10.99 |
| 4 | 0.14 | 20.77 |
| 8 | 0.16 | 37.19 |
| 16 | 0.18 | 61.51 |
| 32 | 0.27 | 84.59 |
| 64 | 0.50 | 90.00 |
| 128 | 1.08 | 80.20 |
| 256 | 2.15 | 68.20 |
I(2048,2048)
次の表に、高さと幅が2,048ピクセルのイメージのシナリオで、専用AIクラスタの1つの Embed Cohere ユニットでホストされたcohere.embed-english-image-v3.0を使用したホスティング専用AIクラスタ・ベンチマークを示します。
| 同時実行性 | リクエスト・レベル・レイテンシ(秒) | リクエスト・レベルのスループット(リクエスト/秒) (RPS) |
|---|---|---|
| 1 | 0.26 | 2.78 |
| 2 | 0.27 | 5.20 |
| 4 | 0.30 | 9.43 |
| 8 | 0.35 | 15.92 |
| 16 | 0.44 | 26.45 |
| 32 | 0.66 | 35.82 |
| 64 | 1.27 | 36.88 |
| 128 | 2.49 | 36.36 |
| 256 | 6.04 | 37.50 |