生成AIでのテキスト埋め込みの作成
OCI生成AIのCohere Embedモデルを使用して、セマンティック検索、テキスト分類または テキスト・クラスタリングにアプリケーションで使用するために、テキストがベクトル埋込みに変換されます。
文およびフレーズを指定し、モデルにおいてそれらの文をその意味に基づいてグループ化します。次に、生成された埋込みをアプリケーションで使用します。
テキスト埋込みの入力データには、次の要件が必要です。
- 埋込み用の文、フレーズまたは段落は、一度に1つのフレーズを追加するか、ファイルをアップロードして追加できます。
.txt拡張子を持つファイルのみが許可されます。- 入力ファイルを使用する場合、ファイル内の各入力文、フレーズまたは段落は、改行文字で区切る必要があります。
- 各実行で最大96の入力が許可されます。
- コンソールでは、テキストのみのモデルの各入力が512トークン未満である必要があります。
- 入力が長すぎる場合は、「切捨て」パラメータを「開始」または「終了」に設定して、トークン制限内に収まるようにテキストの開始または終了を切り捨てるかどうかを選択します。入力が512トークン制限を超え、Truncateパラメータが Noneに設定されている場合、エラーメッセージが表示されます。
- テキスト・モデルおよびイメージ・モデルでは、すべてのトークンが最大128,000個になるファイルおよび入力を設定できます。
- Cohere Embed English Image V3などのテキストおよびイメージの埋込みモデルの場合は、テキストを追加するか、1つのイメージのみを追加できます。イメージには、APIを使用できます。イメージ入力はコンソールで使用できません。APIの場合は、各実行でbase64エンコード・イメージを入力します。たとえば、512 x 512イメージは約1,610トークンに変換されます。
テキストの埋込みを作成するには、embed-text-result操作を使用します。
次のコマンドを入力して、テキスト埋込みを作成するオプションのリストを表示します。
oci generative-ai-inference embed-text-result embed-text -hOCI生成AI CLIコマンドのパラメータおよび値の完全なリストは、生成AI推論CLIおよび生成AI管理CLIを参照してください。
EmbedText操作を実行して、テキスト埋込みを作成します。
APIの使用およびリクエストの署名の詳細は、REST APIのドキュメントおよびセキュリティ資格証明に関する項を参照してください。SDKの詳細は、SDKおよびCLIを参照してください。