Visionアクションを使用したイメージからの情報の分析および抽出
AIを使用して、ビジョン・アクションでディープラーニング・ベースのイメージ分析を実行できます。 Oracle Cloud Infrastructure Visionを使用すると、イメージからテキストまたはビジュアル情報を自動的に抽出できます。
機能
OCI Visionは、イメージ内のオブジェクトおよびテキストの検出、ラベルを使用したイメージの分類、イメージ内のフェースの検出を可能にするAIサービスです。 OCI Visionを使用して、視覚的な異常(製造における異常など)を検出し、イメージ内のオブジェクトを識別して、共通品目(パッケージ、製品、出荷、車両など)のカウントを自動化し、識別できます。注意が必要なアイテム(電力線付近の植生の過剰増加など)、アイテム(デジタル・メディア・アセットなど)を分類して整理し、画像内のテキスト/ビジュアル・データを識別してアナリティク・アプリケーションを強化します。 Oracle Integrationは、ビジョン・アクションとの統合でのOCI Visionの使用をサポートしています。
「AIビジョン」を参照してください。
前提条件
Oracle Cloudコンソールで満たす必要のある前提条件の詳細は、前提条件を参照してください。
統合からのOracle Cloud Infrastructure Visionの起動
- 次のいずれかの方法で、「ビジョン」アクションを統合に追加します:
- キャンバスの横にある「アクション」
をクリックし、「OCIビジョン」アクションを適切なロケーションにドラッグします。
- OCI Visionアクションを追加するロケーションの
をクリックし、「OCIビジョン」を選択します。
- キャンバスの横にある「アクション」
- 名前とオプションの説明を入力し、「続行」をクリックします。
- 次の情報を選択し、「続行」をクリックします。
要素 説明 カテゴリ 使用する次のカテゴリのいずれかを選択します。- 事前トレーニング済モデル: 事前トレーニング済モデルでは、独自のモデルを作成せずにイメージ分析を実行できます。 事前トレーニング済モデルにより、データ・サイエンスの経験がなくてもAIを使用できます。 OCI Visionアクション・サービスにイメージを提供し、イメージ内のオブジェクト、テキストおよびフェースに関する情報を取得できます。 ラベルを使用してイメージ内のオブジェクトを分類することもできます。
- イメージ・ジョブ: イメージ・ジョブでは、バッチ・ジョブを作成して、イメージのセットに対して分析を実行できます。 また、バッチ・イメージ・ジョブに関する情報を取得し、バッチ・イメージ・ジョブを取り消すことができます。
- カスタム・モデル: カスタム・モデルを使用すると、カスタム・オブジェクトの検出を実行できます。 たとえば、イメージ内のオブジェクト(自動車、木、犬など)の場所を検出するモデルを構築して使用できます。 この例のカスタム・モデルの出力には、信頼度スコアと、検出された各オブジェクトの境界ボックスの座標を含めることができます。 データ・セットを作成し、データ・セットに基づいてモデルをトレーニングし、そのカスタム・モデルをシナリオに使用できます。 オブジェクト検出用のカスタム・モデルの構築およびトレーニングの詳細は、カスタム・モデルの構築およびカスタム・モデルのトレーニングを参照してください。
アクション 「事前トレーニング済モデル」または「カスタム・モデル」カテゴリを選択した場合は、「イメージの分析」アクションを選択してイメージ分析を実行します。
「イメージ・ジョブ」カテゴリを選択した場合は、次のいずれかのジョブを選択します。- CancelImageJob: 指定したイメージ・ジョブIDを使用してイメージ・ジョブを取り消します。
- CreateImageJob: イメージ・ジョブを作成します。 このアクションは、オブジェクト・ストレージからイメージを読み取り、イメージ・ジョブIDとともに分析の結果を返します。
- GetImageJob: 指定したイメージ・ジョブIDを使用してイメージ・ジョブのステータスを取得します。 このアクションは、イメージ・ジョブのステータスを返します。
- OCI Vision処理を使用して、次のイメージ分析タスクを実行できます。
- イメージ分類: ラベルを使用してイメージ内のオブジェクトを分類します。 たとえば、イメージが、車両、電力線、およびツリーを含む道路の監視イメージである場合、OCI Visionはこれらのオブジェクトを識別し、ラベルを使用して分類してこの情報を返すことができます。 これは、電力線の近くの植生の過剰増加など、注意が必要な項目を特定するのに役立ちます。
- オブジェクト検出: イメージ内のオブジェクトを識別します。 たとえば、イメージに自動車、バス、トラックなどの車両が含まれている場合、OCI Visionはこれらのオブジェクトを識別してこの情報を返すことができます。
- テキスト検出: イメージ内のテキストの単語および行を識別します。 たとえば、イメージがビザ・アプリケーション・フォームで、名前、市区町村、市民権、国およびその他のテキスト・コンテンツなどのテキストが含まれている場合、OCI Visionはテキストを認識してこの情報を返すことができます。
- 顔検出: イメージ内の人の顔および顔の特徴を識別します。 たとえば、イメージが個人のグループの写真である場合、OCI Visionはイメージ内の個人の顔と顔の特徴を識別して、この情報を返すことができます。
イメージ分析タスクを選択するには、次の手順を実行します。
- ステップ3で「事前トレーニング済モデル」カテゴリを選択した場合は、次の情報を選択し、「続行」をクリックします。
要素 説明 コンパートメント Oracle IntegrationがインストールされているOracle Cloud Infrastructureコンパートメントを選択します。
タスク 実行するタスクを選択します。- イメージ分類
- オブジェクト検出
- テキスト検出
- 顔検出
入力ソース 分析するイメージが使用可能な入力ソースを選択します: - インライン: このオプションを選択した場合は、マッパーのリクエスト・ペイロードにbase-64形式のイメージを指定する必要があります。
- オブジェクト・ストレージ: このオプションを選択した場合は、オブジェクト・ストレージ・バケットでイメージを使用可能にする必要があります。 「入力ストレージ・バケット」フィールドにイメージを含むオブジェクト・ストレージ・バケットを選択できます。
入力ストレージ・バケット このフィールドは、入力ソースとして「オブジェクト・ストレージ」を選択した場合にのみ使用できます。
バケットのリストから、分析するイメージを含む入力ストレージ・バケットを選択します。
ネームスペース このフィールドは、入力ソースとして「オブジェクト・ストレージ」を選択した場合にのみ使用できます。
ネームスペースの選択 ネームスペースを理解するには、オブジェクト・ストレージ・ネームスペースの理解を参照してください。
返される結果の最大数 選択したタスクを使用してイメージが分析された後に返される結果の最大数を選択します。 - ステップ3で「イメージ・ジョブ」カテゴリを選択した場合は、次の情報を選択し、「続行」をクリックします。
要素 説明 コンパートメント Oracle IntegrationがインストールされているOracle Cloud Infrastructureコンパートメントを選択します。
タスク 実行するタスクを選択します。- イメージ分類
- オブジェクト検出
- テキスト検出
- 顔検出
出力ストレージ・バケット イメージ分析タスクの結果を格納する出力ストレージ・バケットを選択します。
ネームスペース ネームスペースの選択 ネームスペースを理解するには、オブジェクト・ストレージ・ネームスペースの理解を参照してください。
返される結果の最大数 選択したタスクを使用してイメージが分析された後に返される結果の最大数を選択します。
- ステップ3で「カスタム・モデル」カテゴリを選択した場合は、次の情報を選択して「続行」をクリックします。
要素 説明 コンパートメント Oracle IntegrationがインストールされているOracle Cloud Infrastructureコンパートメントを選択します。
タスク 実行するタスクを選択します。- オブジェクト検出
モデル 選択したコンパートメントで使用可能なモデルのリストから、オブジェクト検出に使用するカスタム・モデルIDを選択します。 入力ソース 分析するイメージが使用可能な入力ソースを選択します: - インライン: このオプションを選択した場合は、マッパーのリクエスト・ペイロードにbase-64形式のイメージを指定する必要があります。
- オブジェクト・ストレージ: このオプションを選択した場合は、オブジェクト・ストレージ・バケットでイメージを使用可能にする必要があります。 「入力ストレージ・バケット」フィールドにイメージを含むオブジェクト・ストレージ・バケットを選択できます。
入力ストレージ・バケット このフィールドは、入力ソースとして「オブジェクト・ストレージ」を選択した場合にのみ使用できます。
バケットのリストから、分析するイメージを含む入力ストレージ・バケットを選択します。
ネームスペース このフィールドは、入力ソースとして「オブジェクト・ストレージ」を選択した場合にのみ使用できます。
ネームスペースの選択 ネームスペースを理解するには、オブジェクト・ストレージ・ネームスペースの理解を参照してください。
返される結果の最大数 選択したタスクを使用してイメージが分析された後に返される結果の最大数を選択します。 - 「サマリー」ページで「終了」をクリックします。
事前トレーニング済モデルおよびカスタム・モデル・カテゴリのインライン・イメージを読み取るためのマッパーの構成
データをbase-64形式で送信する必要があります。 マッパーを開き、必要に応じてソース要素とターゲット要素間のマッピングを定義します。
- ターゲットの「イメージ」要素を展開します。
- 「データ」を右クリックし、「ターゲット・ノードの作成」を選択します。
- 「関数」をクリックします
- 式ビルダーで「設計ビュー」
をクリックします。
- 「関数」セクションで、「上級」を展開し、encodeReferenceToBase64を「データ」ターゲット要素の式ビルダーにドラッグします。
oraext:encodeReferenceToBase64 ( ) - 「ストリーム参照」を「ソース」セクションから式ビルダーにドラッグします。
oraext:encodeReferenceToBase64 (/nssrcmpr:execute/ns23:streamReference)ノート:
オプションで、マッパーで「コンパートメントID」を指定して、最初に「コンパートメント」に対して選択した値をオーバーライドできます。 - マッパーを終了します。
これで、ビジョン・アクションが構成されました。
事前トレーニング済モデルおよびカスタム・モデル・カテゴリのストレージ・バケットからイメージを読み取るためのマッパーの構成
マッパーのオブジェクト・ストレージ・バケットから読み取るオブジェクト名(イメージ)を選択する必要があります。 マッパーを開き、必要に応じてソース要素とターゲット要素間のマッピングを定義します。
- オブジェクト名(イメージのファイル名)を「ソース」セクションから「ターゲット」セクションの「オブジェクト名」要素にドラッグします。
- マッパーを終了します。
これで、ビジョン・アクションが構成されました。
CancelImageJobアクションのマッパーの構成
このアクションは、リクエスト・ペイロードで指定したイメージ・ジョブIDを使用してイメージ・ジョブを取り消します。 イメージ・ジョブIDは、CreateImageJobアクションのレスポンスから取得できます。 キャンセルできるのは、進行中のイメージ・ジョブのみです。
- 「ソース」セクションから「ターゲット」セクションのターゲット「イメージ・ジョブID」にジョブIDをマップします。
- マッパーを終了します。
これで、ビジョン・アクションが構成されました。
CreateImageJobアクションのマッパーの構成
このアクションは、オブジェクト・ストレージ・バケットから一連のイメージを読み取り、指定された分析タスクを実行するイメージ・ジョブを作成します。 ストレージ・バケットからの入力は、リクエスト・マッパーを介して送信されます。 出力がオブジェクト・ストレージ・バケットに送信されます。 返される出力には、イメージ・ジョブIDも含まれます。 マッパーを開き、必要に応じてソース要素とターゲット要素間のマッピングを定義します。
- 適切なソース エレメントを次のターゲット エレメントにマッピングします。
- 特徴
- 機能タイプ
- 「入力場所」の下の「ソース・タイプ」
- 「入力場所」の下のオブジェクトの場所
- 「オブジェクトの場所」の下のバケット名
- 「オブジェクトの場所」の下のネームスペース名
- 「オブジェクトの場所」の下の「オブジェクト名」
- 出力場所の接頭辞
- 「出力場所」の下の表示名
- 「出力場所」でZip出力が有効か
「表示名」や「Zip出力使用可能」などの値はオプションです。 前述のパラメータの詳細は、ImageJobリファレンスを参照してください。
ノート:
- 機能タイプは、ステップ4bで選択したタスクです。
- 接頭辞は、出力ファイルのファイル名で使用されます。
- マッパーを終了します。
これで、ビジョン・アクションが構成されました。
GetImageJobアクションのマッパーの構成
このアクションは、リクエスト・ペイロードで指定したイメージ・ジョブIDを使用してイメージ・ジョブのステータスを返します。 イメージ・ジョブIDは、CreateImageJobアクションのレスポンスから取得できます。
- 「ソース」セクションから「ターゲット」セクションのターゲット「イメージ・ジョブID」にジョブIDをマップします。
- マッパーを終了します。
これで、ビジョン・アクションが構成されました。