Memoria del agente

La memoria del agente permite a los agentes retener y utilizar el contexto entre interacciones. Admite tanto la memoria a corto plazo dentro de una conversación como la memoria a largo plazo en todas las conversaciones, lo que ayuda a mejorar la continuidad, la relevancia y la eficiencia.

Memoria a corto plazo

La memoria a corto plazo se refiere al contexto de conversación que se lleva a cabo dentro de una conversación en curso. La API de respuestas y la API de conversaciones simplifican la gestión del estado de la conversación, lo que permite interacciones de varios giros.

Memoria a largo plazo

La memoria a largo plazo proporciona un contexto persistente en las conversaciones. Cuando está activado, el servicio extrae información clave de las conversaciones y la almacena para que se pueda recuperar en interacciones futuras dentro del mismo proyecto.

La memoria a largo plazo es útil para escenarios que requieren continuidad entre sesiones, como:

Recordando preferencias de usuario estables
Retención del contexto en segundo plano recurrente
Mantenimiento de la continuidad entre interacciones

Compactación de memoria a corto plazo

A medida que el historial de conversaciones crece, el envío del historial completo puede aumentar el uso y la latencia de los tokens. La compactación de memoria a corto plazo resume y comprime el historial de conversaciones anteriores en una representación más pequeña y estructurada. Esto ayuda a preservar los detalles clave al tiempo que reduce la cantidad de contexto enviado al modelo.

Este enfoque:

Conserva la información clave de turnos anteriores
Reduce el uso de tokens para conversaciones largas
Mejora la latencia al mantener el contexto ligero

Documentación de Oracle Cloud Infrastructure

Memoria del agente

Memoria a corto plazo

Memoria a largo plazo

Compactación de memoria a corto plazo