エージェント・メモリー
エージェント・メモリーを使用すると、エージェントはインタラクション間でコンテキストを保持して使用できます。会話内の短期メモリと会話全体の長期メモリの両方をサポートし、継続性、関連性、効率性を向上させます。
短期メモリー
短期記憶とは、進行中の会話の中で繰り越される会話のコンテキストを指します。Responses APIとConversations APIは、会話の状態管理を簡素化し、マルチターンのインタラクションを可能にします。
長期メモリー
長期間のメモリは、会話全体で永続的なコンテキストを提供します。有効にすると、サービスは会話から重要な情報を抽出して格納し、同じプロジェクト内の将来の相互作用でリコールできるようにします。
長期メモリーは、次のようなセッション間の継続性を必要とするシナリオで役立ちます。
- 安定したユーザー・プリファレンスの記憶
- 繰返しバックグラウンド・コンテキストの保持
- 相互作用の継続性の維持
短期メモリー圧縮
会話履歴が増えるにつれて、完全な履歴を送信すると、トークンの使用状況と待機時間が増加する可能性があります。短期メモリー圧縮は、以前の会話履歴を要約し、より小さく構造化された表現に圧縮します。これにより、モデルに送信されるコンテキストの量を削減しながら、キーの詳細を保持できます。
この方法の特徴は、次のとおりです。
- 以前のターンからの重要な情報を保持します
- 長い会話のトークン使用を削減
- コンテキストを軽量に保つことでレイテンシを向上