23 AIコンピュート

この章では、Oracle AI Data Platform WorkbenchでAIエージェントを強化するための特殊なコンピューティング・リソースの使用について説明します。

AIコンピュート・クラスタを使用すると、AI Data Platform Workbenchワークスペースでエージェントをホストできます。AI計算をエージェントにアタッチしてプレイグラウンド・エクスペリエンスを実行し、本番ワークロード用にデプロイされたエージェントをホストできます。

AIコンピュートを見つける場所

AIコンピュートは、「コンピュート」ページから管理します。このページには、「AIデータ・プラットフォーム・ワークベンチ」の左側のナビゲーション・ペインからアクセスできます。「AIコンピュート」タブをクリックして、ワークスペースで使用可能なAIコンピュート・クラスタを表示します。


「AI Compute」タブが選択された状態で「Compute」ページが開きます。

「AIコンピュート」タブは、現在選択されているワークスペース内のAIコンピュート・リソースのメイン・ランディング・ページです。表アクション、フィルタリング、ソートおよびステータス情報を提供します。

列またはコントロール 目 的
フィルタ 表内で名前または表示可能なテキストでリソースを検索します。
加算(+) 新しいAIコンピュートの作成を開始します。
削除 選択したAI計算を削除します。
AIコンピュート名 コンピュート・リソースの名前。AIコンピュート名をクリックして、リソースの詳細ページを開きます。
設定値 「作成中」、「アクティブ」、「更新中」などの現在のライフサイクル状態。
レプリカ数 AIコンピュートに関連付けられたコンピュート・レプリカの数。
エージェント数 AIコンピュートでホストされているエージェントの数。エージェントが存在する場合、カウントはリンクとして表示されます。
構成 AIコンピュート内のレプリカのコンピュート・シェイプ(1 OCPU、16 GBまたは2 OCPU、32 GBなど)のサマリー。
更新者/更新日/作成日 最新の更新および作成時間の監査情報。
「アクション」メニュー () 選択した行のリソース固有のアクションを開きます。

ノート:

緑色のチェックは、アクティブなリソースを示します。スピナーは、作成または更新などの進行中の操作を示します。リソースがアクティブになるまで待ってから、そのリソースに依存して本番作業を行います。

「AIコンピュート」タブでAIコンピュートの名前をクリックすると、そのAIコンピュートに関する詳細情報を表示できます。AIコンピュート・ビューには、「エージェント」「詳細」「コンピュートの使用状況」および「権限」の4つのタブがあります。

「エージェント」タブ

「エージェント」タブには、AIコンピュート・リソースでホストされているエージェントがリストされます。エージェントがデプロイされていない場合、AIコンピュートは反復的な開発とテストに必要なプレイグラウンド・エクスペリエンスをホストしています。エージェントがデプロイされている場合、計算されたAIは本番ワークロードのエージェント・デプロイメント・エンドポイントをホストしています。


「エージェント」タブが選択された状態で「AI Compute」ページが開きます。

エージェント・タブ項目 説明
エージェント名によるフィルタ 関連付けられたエージェント・リストを検索します。
エージェント名 コンピュート・リソースに関連付けられたエージェントの名前。
認可モード エージェントがどのように作成されたか。ビジュアルまたはコードの値。
デプロイメント デプロイメント状態AIコンピュートでホストされているエージェントは、デプロイできない(プレイグラウンドはAIコンピュートでホストされている)か、デプロイされている(コンピュートがエージェントのデプロイメント・エンドポイントをホストしている)かのいずれかです
URI/URIの状態 エージェントがデプロイされ、URIを持つ場合のエンドポイントURI情報。
AIコンピューティング エージェントの本番エンドポイントに関連付けられたコンピュート。
作成日/更新者 エージェントのメタデータを作成および更新します。

「詳細」タブ

「詳細」タブには、AIコンピュートの各レプリカに対して構成されたシェイプおよびストレージの概要が示されます。


「AI Compute」ページが開き、「Details」タブが選択されています。

「詳細」タブ項目 説明
ドライバ・シェイプ AIコンピュート用に選択されたGPUシェイプ。AMDは、すべてのAI Computeのドライバ・シェイプです。
OCPU AIコンピュート用に選択されたOCPU数。
メモリー(GB) AIコンピュート・メモリー(GB)。
ブロック・ボリューム AIコンピュート・ボリュームのブロック・ボリューム・サイズ(GB)。

「コンピュート使用率」タブ

「コンピュート使用率」タブを使用して、時間の経過に伴うCPU、メモリーおよびネットワーク使用率を確認します。これは、レプリカ、OCPUまたはメモリーをスケール・アップまたはスケール・ダウンするかどうかを決定する場合に便利です。AIコンピュート・スケール・アウト中またはスケール・イン中にダウンタイムはありません。


「コンピュート使用率」タブが選択された状態で「AIコンピュート」ページが開きます。

ノート:

各時系列が異なるレプリカに対応しています。たとえば、2つのレプリカを使用してAIコンピュートを作成すると、上のスクリーンショットのように2つの時系列が表示されます。
「稼働状況の計算」タブ・アイテム 説明
適用済フィルター 稼働状況ビューの開始日時と終了日時を選択します。
表示 メトリックを選択します。オプションは次のとおりです:
  • CPU使用率
  • メモリー使用率
  • ネットワークが受信したバイト数
  • ネットワークが送信したバイト数
時間間隔 カスタム期間または過去7日間のいずれかを選択します。
レプリカID メトリックを特定のレプリカIDにフィルタするか、すべてのコンピュート・レプリカを表示します。
間隔 チャートの集計間隔を選択します。オプションは、自動、1分、5分、15分、30分および60分です。

「権限」タブ

「アクセス権」タブには、このAIコンピュートに対するアクセス権を持つすべてのプリンシパルの表が表示されます。このタブを使用して、プリンシパルの追加、権限レベルの変更、または権限の変更を行います。


AIコンピュート・ページが開き、「権限」タブが選択されています。

「権限」タブ項目 説明
プリンシパルの名前 プリンシパルまたはロールの名前。
プリンシパル・タイプ プリンシパル・タイプUSERまたはROLE。
権限 権限のレベル。
継承されます 親オブジェクトに付与された権限は、含まれているオブジェクトに権限を付与します。

AIクラスタの作成

AIコンピュート・クラスタを作成して、AIデータ・プラットフォームでAIエージェントを実行できます。

  1. ホーム・ページで、ワークスペースに移動します。
  2. 「作成」をクリックし、「AIコンピュート」をクリックします。
  3. AIコンピュート・クラスタの名前および説明を指定します。
  4. コンピュート・レプリカの数を設定します。レプリカによって計算プールがスケーリングされます。各レプリカは、AIコンピュートでホストされているすべてのエージェントのコピーをホストします。

    ノート:

    レプリカの最大数は10です。レプリカ制限を引き上げる必要がある場合は、Oracle担当者にお問い合せください。
  5. 各レプリカのOCPU数を設定します。1、2、4、8、16、32または64 OCPUを選択できます。
  6. レプリカ当たりのメモリー(GB単位)を設定します。使用できるメモリーの範囲は、OCPUの数によって異なります。
    OCPU Memory
    1 OCPU 16 または 32G バイト
    2 OCPU 16、32または64 GB
    4 OCPU 32、64または128 GB
    8 OCPU 32. 64、128または256 GB
    16 OCPU 64、128、256または512 GB
    32 OCPU 128、256または512 GB
    64 OCPU 256、512、または1024GB
  7. このようなAIコンピュート構成コストが1時間当たりである、対応するAIDPユニットを確認します。
  8. 「作成」をクリックします。新しいリソースが「作成中」状態のリストに表示されます。プロビジョニングが完了すると、状態が「アクティブ」に変わります。

AIクラスタの編集

編集操作を使用して、AIコンピュートの構成設定を変更できます。

AIコンピュート・クラスタのOCPUまたはメモリーの変更が完了するまでに数分かかる場合があります。また、エージェントで長時間実行される問合せを中断することもできます。
  1. ホーム・ページで、ワークスペースに移動します。
  2. 「コンピュート」をクリックし、「AIコンピュート」タブをクリックします。
  3. 変更するAIコンピュート・クラスタの横で、アクションの3つのドット・アイコン 「アクション」をクリックし、「編集」をクリックします。AIコンピュートの名前をクリックし、右上の「編集」をクリックすることもできます。

    「AI Compute」タブで「Compute」ページが開きます。AIコンピュート用の「Actions」メニューが開き、「Edit」が強調表示されます。


    AIコンピュート・ページが開きます。画面の右上にある「編集」ボタンが強調表示されます。

  4. 名前、説明、コンピュート・レプリカの数、レプリカ当たりのOCPU数およびレプリカ当たりのメモリーを変更します。AIコンピューティングへの変更は、ダウンタイムなしで完了します。
  5. 更新」をクリックします。更新の進行中に、AIコンピュート状態が「更新中」と表示されます。

AIクラスタの削除

未使用または不要になったAIコンピュート・クラスタを削除できます。

  1. ワークスペースに移動し、「コンピュート」をクリックして、「AIコンピュート」タブをクリックします。
  2. 削除するAIクラスタの横にあるアクションの3つのドット・アイコン 「アクション」をクリックし、「削除」をクリックします。
  3. 「削除」をクリックします

    「Actions」メニューが開き、「Delete」が強調表示された「AI Compute」ページ

AIクラスタの停止

AIコンピュートを停止して、AIコンピュートで実行されているすべてのエージェントを停止できます。コンピュートが解放され、測定が停止します。

コンピュートでホストされているエージェントが使用中でない場合、AIコンピュートを停止することをお薦めします。
  1. ホーム・ページで、ワークスペースに移動します。
  2. 「コンピュート」をクリックし、「AIコンピュート」タブをクリックします。
  3. 停止するAIクラスタの横にあるアクションの3つのドット・アイコン 「アクション」をクリックし、「停止」をクリックします。

    「Actions」メニューが表示された「AI compute」ページで、「Stop」が強調表示された状態を開きます

AIクラスタの起動

以前に停止したAIコンピュートを開始できます。

  1. ホーム・ページで、ワークスペースに移動します。
  2. 「コンピュート」をクリックし、「AIコンピュート」タブをクリックします。
  3. 起動するAIクラスタの横で、アクションの3つのドット・アイコン 「アクション」をクリックし、「開始」をクリックします。

    「Actions」メニューが開き、「Start」が強調表示された「AI compute」ページ

AIクラスタの再起動

アクティブなAIコンピュートを再起動して、最近の変更または更新を取得できます。

ノート:

アクティブ・コンピュートでホストされているエージェントは、再起動時に中断されます。
  1. ホーム・ページで、ワークスペースに移動します。
  2. 「コンピュート」をクリックし、「AIコンピュート」タブをクリックします。
  3. 起動するAIクラスタの横で、アクションの3つのドット・アイコン 「アクション」をクリックし、「再起動」をクリックします。

    「Actions」メニューが開き、「Restart」が強調表示された「AI compute」ページ