プレイグラウンドでAIエージェントを反復的に編集およびテストする
プレイグラウンドで編集を使用して、AIエージェントおよび大規模言語モデル(LLM)ノードを編集およびテストできます。 このオプションは、本番環境に変更をデプロイせずに、エージェントの指示およびパラメータの反復的なリアルタイム・テストおよび絞込みを可能にします。 これは、高レベルのインテントとステップバイステップの実行のギャップを埋めるため、エージェントの動作を本番環境にデプロイする前に安全にテスト、調整および微調整できます。
AIエージェントを編集およびテストするには:
- AI Agent Studioに移動します。
- プロジェクトに基づいて適切なタブを選択します。
- エージェント・チーム: コラボレーション・フローまたはマルチエージェント・フローの場合
- エージェント: 個々のエージェント構成用
- エージェントまたはエージェント・チームを検索し、「編集」
を選択して設定を変更します。 - 編集領域から「プレイグラウンドで編集」を選択し、AIエージェントを編集およびテストします。
- エージェントの詳細を編集して、プロンプト・ロジックおよびモデル・パラメータを調整します。 デュアルペイン・レイアウトでリアルタイムの結果を編集および表示するには、「結果の表示」
を選択します。 「プロンプト」タブ
エージェントの動作をガイドするテンプレートおよび指示を設計できます。ノート:システム・プロンプトおよび要約プロンプトは、エージェントの管理者タイプに固有です。フィールド 説明 システム・プロンプト システム・プロンプトを編集して、エージェントのアイデンティティ、ジョブの説明およびルールを定義します。 要約プロンプト 要約モードを選択し、要約プロンプトを編集して、特定のユース・ケースに関連する重要な指示のみを含めます。 ノート: 「式の挿入」
を使用して、フィールドに式を追加できます。 詳細については、Expressions in AI Agent Studioを参照してください。 「LLM」タブ
モデルのタイプを選択し、必要に応じてカスタム・モデル・プロパティを変更します。 デフォルト・モデルを使用するか、モデルを選択できます。フィールド 説明 プロバイダ デフォルト・モデルを使用するか、モデルを選択します。 カスタム・モデルを使用する場合は、モデル・プロパティを指定します。 「入力」タブ
エージェントまたはLLMノードの実行に必要な特定のテスト・データ、変数またはコンテキストを入力します。 実際のトリガーをシミュレートし、変更を保存する前に、エージェントが受信情報を正しく処理していることを確認できます。フィールド 説明 ユーザー入力 エージェントのロジックを開始する問合せまたは実行可能なコマンドを入力します。 評価 評価セットを使用して、エージェントのパフォーマンスを評価します。 評価セットには、1つ以上のテスト質問、予想されるエージェント・レスポンスおよび測定されるメトリックが含まれます。 詳細は、エージェントの評価を参照してください。 変数 変数を構成し、エージェントのワークフロー・タイプ内のすべてのノードからアクセスできるようにします。 追加変数 プロンプトに変数を追加します。 たとえば、現在のシステム日付をプロンプトに追加するには、「式の挿入」
を使用して「現在の日時」オプションを選択します。 「出力」タブ
JSONスキーマを使用してエージェントの出力の全体的な構造を構成し、正確な出力を指定します。フィールド 説明 仕様モード 出力のJSONスキーマを直接変更するには、このモードを選択します。 簡易モード このモードを選択して、出力値および出力タイプを定義します。 対応するJSONスキーマが自動的に生成され、さらなる変更のために仕様モードで表示されます。 - 「保存してテスト」を選択して、変更を確認し、エージェントまたはLLMノードをテストします。 テストの実行中に、次のセクションで結果とパフォーマンスをモニターできます。
- 入力: 「入力」タブの「入力メッセージ」フィールドに入力したメッセージを確認します。 JSONスキーマを表示するには、「JSON」を選択します。 最終応答を表示するには、「ヒューマン」を選択します。
- 出力: 詳細トレース・ビューを開くセッションを選択します。 トレースには、コールされたツール、各ステップにかかった時間、各ステップのメトリックなど、実行のステップバイステップのタイムラインが表示されます。 レイテンシ、入出力トークン使用状況などの詳細を表示するには、色分けされたトレース行を選択します。 最終応答を表示するには、「ヒューマン」を選択します。
- 「実行履歴」
を選択して、以前のテスト実行を表示、比較および再利用します。 すべての実行の詳細なレコードを表示し、エージェントのパフォーマンスを追跡できます。 - 「編集」
を選択して、変更ログにコメントを追加します。 - 「適用」
を選択して、実績のある構成をパネルにロードし、高品質のベースラインから反復テストを再開します。 このアクションはテスト環境にのみ影響し、デプロイされるまで本番エージェントは更新されません。 - 「展開」
を使用して、テストの変更ログの詳細を表示します。 - 2つの実行を選択して比較できます。 「比較」を選択して、各実行の詳細を表示するペインを表示し、その差異を強調表示します。
- 「保存してテスト」を選択して変更内容をエージェントに保存し、テスト構成でエージェントを実行します。
- 「編集」
- 「完了」を選択します。
- 変更をテストした後、エージェント・チームを公開します。