Cohereコマンド(52B)

cohere.commandモデルは非推奨です。

重要

オンデマンド・サービング・モードでサポートされているcohere.commandモデルが廃止され、このモデルは専用サービング・モードでは非推奨になりました。専用AIクラスタ(専用サービング・モード)でcohere.commandをホストしている場合は、専用サービング・モードcohere.commandモデルがリタイアされるまで、このホスト・モデル・レプリカをサマリーおよび生成APIとプレイグラウンドで引き続き使用できます。このモデルは、専用AIクラスタでホストされている場合、米国中西部(シカゴ)でのみ使用できます。除・売却日および定義は、モデルの除・売却を参照してください。かわりに、要約の長さおよびスタイルの管理など、同じ要約機能およびテキスト生成機能を提供するチャット・モデルを使用することをお薦めします。

これらのリージョンで使用可能

  • 米国中西部(シカゴ)

主な機能

  • モデルには520億のパラメータがあります。
  • ユーザー・プロンプトおよびレスポンスは、実行ごとに最大4096個のトークンを含めることができます。
  • データセットを使用してこのモデルを微調整できます。

モデルの専用AIクラスタ

前述のリージョン・リストでは、(専用AIクラスタのみ)とマークされていないリージョンのモデルには、オンデマンドと専用AIクラスタの両方のオプションがあります。オンデマンド・オプションの場合、クラスタは必要ありません。また、コンソール・プレイグラウンドまたはAPIを介してモデルにアクセスできます。

リストされた任意のリージョンの専用AIクラスタを介してモデルに到達するには、専用AIクラスタにそのモデルのエンドポイントを作成する必要があります。このモデルに一致するクラスタユニットサイズについては、次の表を参照してください。

ベース・モデル ファインチューニング・クラスタ ホスティング・クラスタ 価格設定ページ情報 クラスタ制限の引上げをリクエスト
  • モデル名: Cohere Command (52B)
  • OCIモデル名: cohere.command (非推奨)
  • 単位サイズ: Large Cohere
  • 必須単位: 2
  • 単位サイズ: Large Cohere
  • 必須単位: 1
  • 価格設定ページの製品名: Large Cohere - Dedicated
  • ホスティングの場合、単価を乗算します。 x1
  • ファインチューニングの場合、単価を乗算します。 x2
  • 制限名: dedicated-unit-large-cohere-count
  • ホスティングの場合、リクエスト制限の引上げ単位: 1
  • ファインチューニングの場合、リクエスト制限の引上げ単位: 2

リリース日と除・売却日

モデル リリース日 オンデマンド処分日 専用モード除・売却日
cohere.command 2024-02-07 2,024-10-2 2,025-8-7
重要

すべてのモデル・タイム・ラインおよびリタイア詳細のリストは、モデルのリタイアを参照してください。

生成モデル・パラメータ

生成モデルを使用する場合は、次のパラメータを変更して出力を変更できます。

最大出力トークン

レスポンスごとにモデルで生成するトークンの上限数。トークンごとに4文字を推定します。

温度

出力テキストの生成に使用されるランダム性のレベル。

ヒント

温度の設定を0で開始し、出力を改良のためにプロンプトを再生成するときに温度を上げます高温は、幻覚や事実上誤った情報をもたらす可能性があります。
上位k

top kの最も可能性の高いトークンからモデルが次のトークンをランダムに選択するサンプリング・メソッド。kの値が大きいほど、ランダムな出力が生成され、出力テキストがより自然になります。kのデフォルト値は、commandモデルの場合は0、Llamaモデルの場合は-1です。これは、モデルがすべてのトークンを考慮し、このメソッドを使用しないことを意味します。

上位p

次のトークンで考慮する上位トークンの累積確率を制御するサンプリング方法。確率にpに0から1までの小数を割り当てます。たとえば、上位75パーセントを考慮するには、0.75と入力します。すべてのトークンを考慮するには、pを1に設定します。

ストップ順序

生成された出力を停止するためのタイミングをモデルに指示する、単語、フレーズ、改行(\n)またはピリオドのシーケンス。複数の停止シーケンスがある場合、これらのシーケンスのいずれかに達すると、モデルは停止します。

頻度ペナルティ

トークンが頻繁に表示される場合にトークンに割り当てられるペナルティ。高いペナルティにより、繰り返されるトークンが少なくなり、よりランダムな出力が生成されます。

プレゼンス・ペナルティ

出力に表示されている各トークンにペナルティが割り当てられ、使用されていないトークンを使用した出力の生成を促します。

尤度の表示

新しいトークンが生成されるたびに、-15から0までの数値がすべてのトークンに割り当てられ、この数値が大きいトークンは、現在のトークンの後に続く可能性が高くなります。たとえば、単語favoriteの後に単語zebraではなく単語foodまたはbookが続く可能性が高くなりますこのパラメータは、cohereモデルでのみ使用できます。

要約モデル・パラメータ

プレイグラウンドでホストされた要約モデルを使用する場合は、次のパラメータを変更して別の出力を取得できます。

長さ

要約の概略の長さ。short、mediumまたはlongを選択できます。短いサマリーは長さが約2文、中間のサマリーは3から5文、長いサマリーには6つ以上の文がある場合があります。「自動」値の場合、モデルで入力サイズに基づいて長さが選ばれます。

フォーマット

要約を自由形式の段落で表示するか、箇条書きで表示するか。「自動」値の場合、モデルは入力テキストに基づいて最適なフォーマットを選択します。

抽出性

要約内の入力をどの程度再利用するか。抽出率が高いサマリーは文を逐語的に使用する傾向があり、抽出率が低いサマリーは言い換える傾向があります。

温度

出力テキストの生成に使用されるランダム性のレベル。

ヒント

テキストを要約するには、まず温度を0に設定します。ランダムな結果を必要としない場合は、温度値を0.2にすることをお薦めします。たとえば、後で様々なサマリーを選択する場合は、高い値を使用します。ただし、要約に高い温度を使用しないようにしてください。高い温度は、モデルでハルシネーションが含まれている可能性もある創造的なテキストの生成を促すため、要約に高い温度を使用しません。
追加コマンド

スタイルやフォーカスなど、その他の要約オプション。モデルへの指示として自然言語で1つ以上の追加コマンドを記述します。たとえば、「日付にフォーカス」や「会話形式で記述」や「終了要約で履歴書を終了」などです。