Memória e Conhecimento para Agentes de IA

Engram

Compilador de conhecimento e engine de consulta para memória de agentes de IA

Agentes de IA esquecem tudo entre sessões. O Engram transforma arquivos Markdown com frontmatter YAML em um índice pesquisável com BM25, cache em múltiplas camadas, travessia de grafo causal, consultas temporais e controles de governança. Uma base de conhecimento para todos os seus agentes.

513

Testes de integração

Crates Rust

Camadas de consulta

Campos de frontmatter

Ver no GitHub Explorar Arquitetura

O Desafio

Agentes de IA não têm
memória persistente

Quando agentes de IA operam entre sessões, projetos e equipes, perdem contexto constantemente. Toda conversa começa do zero. O conhecimento institucional fica preso em interações individuais, sem nunca se acumular em inteligência organizacional.

Sem contexto persistente

Cada sessão de agente começa em branco. Decisões anteriores, contexto e conhecimento acumulado desaparecem no instante em que a sessão termina.

Sem recuperação estruturada

Mesmo quando o contexto existe em arquivos, os agentes não têm como buscar, ranquear ou recuperar o conhecimento mais relevante para uma consulta.

Sem raciocínio causal

Agentes não conseguem rastrear cadeias de causa e efeito entre entradas de conhecimento. Entender por que algo aconteceu exige reconstrução manual.

Sem governança de acesso

Qualquer agente pode acessar qualquer conhecimento. Não há controles de acesso por agente, por domínio ou por operação para proteger contexto organizacional sensível.

Capacidades

Seis camadas de inteligência

Cada consulta flui por um pipeline de múltiplas camadas. Cada camada adiciona uma compreensão progressivamente mais profunda.

Compilador de Conhecimento

Faz parsing de Markdown com frontmatter YAML, valida 19 campos estruturados e compila em um índice de full-text search com Tantivy. Modo watch permite compilação incremental conforme o conhecimento evolui.

Cache em Múltiplas Camadas

Cache de correspondência exata (MD5, TTL de 60s), cache fuzzy (similaridade Jaccard com limiar de 0.6) e invalidação por geração garantem respostas rápidas e consistentes.

Busca BM25

Busca multi-campo com pesos configuráveis — título 3x, tags 2x, tags de domínio 1.5x. Pontuação composta que combina BM25, confiança, importância e recência.

Grafo Causal

Percorre relações de causa e efeito em até 6 saltos de profundidade. Disparado automaticamente por palavras-sinal causais como 'causado por', 'leva a', 'por que'.

Consultas Temporais

Padrões CurrentState, SinceTimestamp e EventHistory. Disparados automaticamente por palavras-chave como 'atual', 'mais recente', 'desde' e 'histórico'.

Síntese por LLM

Tier 3 opt-in que dispara quando as pontuações de busca caem abaixo do limiar. Sintetiza respostas a partir do conhecimento recuperado usando Claude, com controles completos de governança.

Arquitetura

Pipeline de consultas

Cada consulta de conhecimento flui por um pipeline determinístico, com cache e auditável — da correspondência exata à síntese por LLM.

Entrada da Consulta

Linguagem natural ou estruturada

Política Bulwark

Controle de acesso e governança

Tier 0: Cache Exato

Fingerprint MD5, TTL 60s

Tier 1: Cache Fuzzy

Similaridade Jaccard, limiar 0.6

Tier 2: Busca BM25

Multi-campo com pesos

Tier 2.5: Causal + Temporal

Travessia de grafo e histórico de eventos

Tier 3: Síntese LLM

Opt-in, com Claude

Cada camada faz short-circuit quando um resultado de alta confiança é encontrado — a maioria das consultas resolve no Tier 0 ou 1.

Integração

Três modos, qualquer agente

O Engram se adapta ao seu fluxo de agentes. CLI direto, plugin do Claude Code ou corpora ByteRover existentes — uma engine de conhecimento cobre todos.

Modo	Interface	Caso de Uso
CLI Direct	compile / query / curate	Local development, CI pipelines
Claude Code Plugin	Hook-based (UserPromptSubmit)	Auto-retrieval on every prompt
ByteRover Corpus	Transparent field aliasing	Existing knowledge bases

Por dentro

Construído em Rust, 6 crates

Um workspace Rust modular onde cada preocupação é uma crate própria — compilação de conhecimento, execução de consultas, governança e integração com agentes.

engram-core/

Schema, parsing, and validation

engram-bulwark/

Policy engine and audit log

engram-compiler/

Indexing and compilation

engram-query/

Search, caching, causal/temporal

engram-openclaw/

Plugin interface, context formatting

engram-cli/

Binary entry point and commands

Nossa Abordagem

Como a Honto
engenharizou o Engram

O Engram representa o compromisso da Honto com sistemas de IA que acumulam conhecimento ao longo do tempo. Cada decisão de design prioriza precisão na recuperação, desempenho de consulta e governança.

Modelagem do Conhecimento

Definimos 19 campos estruturados de frontmatter cobrindo tipos de fato, níveis de confiança, vínculos causais, metadados temporais e tags de domínio.

Pipeline Multi-Camada

Desenhamos um pipeline de consulta que equilibra velocidade e profundidade — cache exato para consultas repetidas, BM25 para descoberta, grafos causais para compreensão.

Workspace Rust Modular

6 crates independentes, cada uma responsável por uma fronteira de capacidade. 513 testes em 16 arquivos de integração garantem a correção em cada camada.

Lançamento Open-Source

Construído para ser transparente, extensível e orientado à comunidade. Compatibilidade completa com corpora de conhecimento ByteRover existentes.

Precisa de memória persistente
para seus agentes de IA?

O Engram é open-source e pronto para implantar. Para sistemas de conhecimento corporativos, design de ontologia personalizada ou suporte de integração — a equipe de engenharia da Honto está à disposição.

Repositório no GitHub Fale com Nosso Time