イメージ・コンテンツの説明

これらの例では、特定のイメージのコンテンツのテキスト分析または説明の生成方法を確認できます。

ここでは、プロンプトとしてイメージとともにテキストの質問を指定します(「What is this image about?」または「How many birds are there in this image?」など)。LLMは、プロンプトに指定されたタスクに基づいてテキスト形式の回答または説明で応答します。これらは、イメージの分類、オブジェクトの検出または類似検索に使用できます。

パブリックRESTプロバイダを使用したイメージの説明
Google AI、Hugging Face、OpenAIまたはVertex AIによってパブリックにホストされたサードパーティLLMを使用して、プロンプトとしてイメージとともにテキストの質問を指定することで、イメージからテキストへの変換を実行します。
ローカルRESTプロバイダOllamaを使用したイメージの説明
ローカル・ホストのRESTエンドポイント・プロバイダOllamaを使用してオープンLLMにアクセスし、プロンプトとしてイメージとともにテキストの質問を指定して、イメージからテキストへの変換を実行します。

親トピック: LLMを利用するAPIを使用したサマリーおよびテキストの生成