生成AIでのテキスト埋込みの作成
OCI生成AIのCohere Embedモデルを使用して、セマンティック検索、テキスト分類、テキスト・クラスタリングにアプリケーションで使用するために、テキストのベクトル埋込みを変換します。
テキスト埋込みの入力データには、次の要件が必要です。
- 埋込み用の文、フレーズまたは段落は、一度に1つのフレーズを追加するか、ファイルをアップロードして追加できます。
.txt
拡張子を持つファイルのみが許可されます。- 入力ファイルを使用する場合、ファイル内の入力文、フレーズまたは段落は、改行文字で区切る必要があります。
- 各実行には最大96の入力が許可されます。
- コンソールでは、テキストのみのモデルの各入力は512トークン未満である必要があります。
- 入力が長すぎる場合は、「切捨て」パラメータを「開始」または「終了」に設定して、テキストの開始または終了をトークン制限内に収めるかどうかを選択します。入力が512トークン制限を超え、「切捨て」パラメータが「なし」に設定されている場合、エラー・メッセージが表示されます。
- テキスト・モデルおよびイメージ・モデルでは、最大128,000個のトークンを追加するファイルおよび入力を使用できます。
- Cohere Embed English Image V3などのテキストおよびイメージ埋込みモデルでは、テキストを追加するか、1つのイメージのみを追加できます。イメージには、APIを使用できます。イメージ入力はコンソールで使用できません。APIの場合は、実行ごとにbase64エンコード・イメージを入力します。たとえば、512 x 512イメージは、約1,610トークンに変換されます。
テキストの埋込みを作成するには、embed-text-result操作を使用します。
次のコマンドを入力して、テキスト埋込みを作成するオプションのリストを表示します。
oci generative-ai-inference embed-text-result embed-text -h
OCI生成AI CLIコマンドのパラメータおよび値の完全なリストは、生成AI推論CLIおよび生成AI管理CLIを参照してください。
EmbedText操作を実行して、テキスト埋込みを作成します。
APIの使用およびリクエストの署名の詳細は、REST APIのドキュメントおよびセキュリティ資格証明を参照してください。SDKの詳細は、SDKおよびCLIを参照してください。