Cohereコマンドライト

cohere.command-lightモデルは非推奨です。

重要

オンデマンド・サービング・モードでサポートされているcohere.command-lightモデルが廃止され、このモデルは専用サービング・モードでは非推奨になりました。専用AIクラスタ(専用サービング・モード)でcohere.command-lightをホストしている場合は、専用サービング・モードcohere.command-lightモデルが廃止されるまで、生成APIおよびプレイグラウンドでこのホスト・モデル・レプリカを引き続き使用できます。このモデルは、専用AIクラスタでホストされている場合、米国中西部(シカゴ)でのみ使用できます。除・売却日および定義は、モデルの除・売却を参照してください。かわりに、要約の長さおよびスタイルの管理など、同じテキスト生成機能を提供するチャット・モデルを使用することをお薦めします。

これらのリージョンで使用可能

  • 米国中西部(シカゴ)

主な機能

  • モデルには60億個のパラメータがあります。
  • ユーザー・プロンプトおよびレスポンスは、実行ごとに最大4096個のトークンを含めることができます。
  • データセットを使用してこのモデルを微調整できます。

モデルの専用AIクラスタ

前述のリージョン・リストでは、(専用AIクラスタのみ)とマークされていないリージョンのモデルには、オンデマンドと専用AIクラスタの両方のオプションがあります。オンデマンド・オプションの場合、クラスタは必要ありません。また、コンソール・プレイグラウンドまたはAPIを介してモデルにアクセスできます。

リストされた任意のリージョンの専用AIクラスタを介してモデルに到達するには、専用AIクラスタにそのモデルのエンドポイントを作成する必要があります。このモデルに一致するクラスタユニットサイズについては、次の表を参照してください。

ベース・モデル ファインチューニング・クラスタ ホスティング・クラスタ 価格設定ページ情報 クラスタ制限の引上げをリクエスト
  • モデル名: Cohere Command Light (6B)
  • OCIモデル名: cohere.command-light (非推奨)
  • 単位サイズ: Small Cohere
  • 必須単位: 2
  • 単位サイズ: Small Cohere
  • 必須単位: 1
  • 価格設定ページの製品名: Small Cohere - Dedicated
  • ホスティングの場合、単価を乗算します。 x1
  • ファインチューニングの場合、単価を乗算します。 x2
  • 制限名: dedicated-unit-small-cohere-count
  • ホスティングの場合、リクエスト制限の引上げ単位: 1
  • ファインチューニングの場合、リクエスト制限の引上げ単位: 2

リリース日と除・売却日

モデル リリース日 オンデマンド処分日 専用モード除・売却日
cohere.command 2024-02-07 2,024-10-2 2,025-8-7
重要

すべてのモデル・タイム・ラインおよびリタイア詳細のリストは、モデルのリタイアを参照してください。

生成モデル・パラメータ

生成モデルを使用する場合は、次のパラメータを変更して出力を変更できます。

最大出力トークン

レスポンスごとにモデルで生成するトークンの最大の数。トークンごとに4文字を推定します。

温度

出力テキストの生成に使用されるランダム性のレベル。

ヒント

温度の設定を0で開始し、出力を改良のためにプロンプトを再生成するときに温度を上げます高温は、幻覚や事実上誤った情報をもたらす可能性があります。
上位k

top kの最も可能性の高いトークンからモデルが次のトークンをランダムに選択するサンプリング・メソッド。kの値が大きいほど、ランダムな出力が生成され、出力テキストがより自然になります。kのデフォルト値は、commandモデルの場合は0、Llamaモデルの場合は-1です。これは、モデルがすべてのトークンを考慮し、このメソッドを使用しないことを意味します。

上位p

次のトークンで考慮する上位トークンの累積確率を制御するサンプリング方法。確率にpに0から1までの小数を割り当てます。たとえば、上位75パーセントを考慮するには、0.75と入力します。すべてのトークンを考慮するには、pを1に設定します。

ストップ順序

生成された出力を停止するためのタイミングをモデルに指示する、単語、フレーズ、改行(\n)またはピリオドのシーケンス。複数の停止シーケンスがある場合、これらのシーケンスのいずれかに達すると、モデルは停止します。

頻度ペナルティ

トークンが頻繁に表示される場合にトークンに割り当てられるペナルティ。高いペナルティにより、繰り返されるトークンが少なくなり、よりランダムな出力が生成されます。

プレゼンス・ペナルティ

出力に表示されている各トークンにペナルティが割り当てられ、使用されていないトークンを使用した出力の生成を促します。

尤度の表示

新しいトークンが生成されるたびに、-15から0までの数値がすべてのトークンに割り当てられ、この数値が大きいトークンは、現在のトークンの後に続く可能性が高くなります。たとえば、単語favoriteの後に単語zebraではなく単語foodまたはbookが続く可能性が高くなりますこのパラメータは、cohereモデルでのみ使用できます。