Ativando a Memória de Curto Prazo
Na API Conversas, você pode ativar a compactação de memória de curto prazo definindo o parâmetro de metadados short_term_memory_optimization como true.
Você pode ativar a compactação de memória de curto prazo no nível do projeto ao criar um projeto. Se você não o ativou durante a criação do projeto, poderá ativá-lo posteriormente editando o projeto.
Você também pode ativá-lo para uma conversa específica definindo o parâmetro metadata.short_term_memory_optimization como true ao criar a conversa.
Se você não definir short_term_memory_optimization nos metadados da conversa, o sistema usará as definições padrão do projeto.
Para obter detalhes sobre qual modelo é usado para compactação, consulte Para Compactação de Memória de Curto Prazo (Histórico de Conversas).
Exemplo:
conversation1 = client.conversations.create(
metadata={"topic": "demo", "short_term_memory_optimization": "True"},
items=[{"type": "message", "role": "user", "content": "Tell me a joke."}],
)