オンデマンド推論に対する支払
OCI 生成AIでオンデマンド推論にコミットすると、次の利点が得られます:
- 生成AIの使用を開始するための障壁が低くなります。
- 使用可能なすべての生成AI基盤モデルにアクセスします。
- モデルの実験と評価に最適です。
- トランザクションのPay as you goです。詳細は、次のノートを参照してください。
オンデマンド推論では、次の文字長に従って支払います。
- チャット: プロンプトの長さ(文字数) +レスポンスの長さ(文字数)
- テキスト生成: プロンプトの長さ(文字数) +レスポンスの長さ(文字数)
- サマリー: プロンプトの長さ(文字) +レスポンスの長さ(文字)
- テキスト埋込み: 入力長(文字)
次の例では、OCI 生成AIでのテキスト生成およびテキスト埋込みのオンデマンド推論コストを計算します。専用AIクラスタ・コストの計算については、専用AIクラスタへの支払を参照してください。
製品への基本モデルの対応
オンデマンド推論の10,000トランザクションの単価を検索するには、次の表の製品への推論に使用する基本モデルと一致します。
能力 | 基盤となるベース・モデル | 価格設定ページのオンデマンド推論用製品 |
---|---|---|
チャット | meta.llama-3-70b-instruct |
Oracle Cloud Infrastructure 生成AI - 大規模Meta |
チャット | cohere.command-r-plus |
Oracle Cloud Infrastructure 生成AI - 大規模Cohere V2 |
チャット | cohere.command-r-16k |
Oracle Cloud Infrastructure 生成AI - Small Cohere V2 |
テキスト生成 | cohere.command |
Oracle Cloud Infrastructure 生成AI - Large Cohere |
テキスト生成 | cohere.command-light |
Oracle Cloud Infrastructure 生成AI - Small Cohere |
テキスト生成 | meta.llama2_70b-chat |
Oracle Cloud Infrastructure 生成AI - 大規模Meta |
要約 | cohere.command |
Oracle Cloud Infrastructure 生成AI - Large Cohere |
埋込み | cohere.embed |
Oracle Cloud Infrastructure 生成AI - Cohereの埋込み |
次の例では、OCI 生成AIでのテキスト生成およびテキスト埋込みのオンデマンド推論コストを計算します。専用AIクラスタ・コストの計算については、専用AIクラスタへの支払を参照してください。
チャットの例
Paulは、次のプロンプト(220 characters
long)を使用してmeta.llama-3-70b-instruct
モデルをコールします。
サラウンド・サウンドを記録できるUSB接続コンパクト・マイク用の製品ピッチを生成します。マイクは、音楽や会話の録音に最も役立ちます。マイクは、ポッドキャストの記録にも役立ちます。
モデルからのレスポンスは1,618 characters
longです。ポールはこの電話の費用を知りたい。ここでは、コストを計算するステップを示します。
テキスト生成の例
Paulは、次のプロンプト(220 characters
long)を使用してcohere.command
モデルをコールします。
サラウンド・サウンドを記録できるUSB接続コンパクト・マイク用の製品ピッチを生成します。マイクは、音楽や会話の録音に最も役立ちます。マイクは、ポッドキャストの記録にも役立ちます。
モデルからのレスポンスは1,618 characters
longです。ポールはこの電話の費用を知りたい。ここでは、コストを計算するステップを示します。
テキスト埋込みの例
Ginaは、顧客契約を新しいセマンティック検索アプリケーションの埋込みに変換しています。平均して、Ginaは毎時16の文書を取り込みます。各ドキュメントの長さは約1,000 characters
です。Ginaは、これらの埋込みを生成するための月次請求の見積を取得したいと考えています。ここでは、コストを計算するステップを示します。