専用AIクラスタへの支払い
OCI生成AIで専用AIクラスタを使用する場合、次の利点があります:
- 需要にあわせて変動しない予測可能な価格設定。
- ファインチューニングやホスティングモデルに最適です。
- 最小ホスティング・コミットメント: ホスティング・クラスタ当たり744ユニット時間。
- 最小ファインチューニング・コミットメント: ファインチューニング・ジョブごとに1単位時間。(微調整には2ユニットの実行が必要です)。
次の例では、OCI生成AIにおける専用AIクラスタのコストを計算します。オンデマンド推論コストの計算については、「オンデマンド推論の支払」を参照してください。
基本モデルのホストの例1
Johnは、専用インフラストラクチャでCohere command
(52 billion parameters) (cohere.command
)モデルのインスタンスをホストしようとしています。Johnは40日後にクラスタを削除し、クラスタのコストを知りたいと考えています。cohere.command
モデルをホストするには、Johnが最初にcohere.command
モデルをホストできるユニット・サイズを識別する必要があります。cohere.command
モデルの単位サイズはLarge Cohere単位です。「ベース・モデルへのクラスタの一致」を参照してください。
Johnでは、cohere.command
モデルをホストするために少なくとも1つのLarge Cohereユニットが必要です。1つのLarge Cohere単位でホスティング・クラスタのコストを計算するステップを次に示します。
基本モデルのホストの例2
Aliceは、専用インフラストラクチャでCohere command
light (6 billion parameters) (cohere.command-light
)モデルのインスタンスをホストしようと考えています。cohere.command-light
モデルをホストするには、まずAliceがコマンド・ライト・モデルをホストできるユニット・サイズを識別する必要があります。コマンド・ライトの単位サイズはSmall Cohere単位です。「ベース・モデルへのクラスタの一致」を参照してください。
Aliceは、1つのユニットよりも高いコール量をモデルに対して処理するために、3つの単位のSmall Cohereを購入することを決定します。Aliceでは、5日後にクラスタの削除を計画しています。3つのSmall Cohereユニットを持つホスティング・クラスタのコストを5日間計算するステップを次に示します。
モデルの微調整とホスティングの例
Bobは、Cohere command
(52 billion parameters) (cohere.command
)モデルを微調整します。Bobは、事前設定された値が2つのLarge Cohereユニットであるファインチューニング専用AIクラスタを作成します。Bobはファインチューニング専用でカスタム・モデルを作成し、トレーニング・データで基礎モデルを微調整します。微調整ジョブの完了には5時間かかります。Bobは毎週ファインチューニング・クラスタを作成します。
cohere.command
モデルをホストするには、Bobがcohere.command
モデルをホストできるユニット・サイズを識別する必要があります。cohere.command
モデルの単位サイズはLarge Cohere単位です。「ベース・モデルへのクラスタの一致」を参照してください。Bobは、1つのホスティング・クラスタで最大50個のファインチューニング・モデルをホストできます。ここでは、モデルを微調整およびホスティングするための月次コストを計算するステップを示します。