Memória e Conhecimento para Agentes de IA

Engram

Compilador de conhecimento e engine de consulta para memória de agentes de IA

Agentes de IA esquecem tudo entre sessões. O Engram transforma arquivos Markdown com frontmatter YAML em um índice pesquisável com BM25, cache em múltiplas camadas, travessia de grafo causal, consultas temporais e controles de governança. Uma base de conhecimento para todos os seus agentes.

513
Testes de integração
6
Crates Rust
4
Camadas de consulta
19
Campos de frontmatter
O Desafio

Agentes de IA não têm
memória persistente

Quando agentes de IA operam entre sessões, projetos e equipes, perdem contexto constantemente. Toda conversa começa do zero. O conhecimento institucional fica preso em interações individuais, sem nunca se acumular em inteligência organizacional.

Sem contexto persistente

Cada sessão de agente começa em branco. Decisões anteriores, contexto e conhecimento acumulado desaparecem no instante em que a sessão termina.

Sem recuperação estruturada

Mesmo quando o contexto existe em arquivos, os agentes não têm como buscar, ranquear ou recuperar o conhecimento mais relevante para uma consulta.

Sem raciocínio causal

Agentes não conseguem rastrear cadeias de causa e efeito entre entradas de conhecimento. Entender por que algo aconteceu exige reconstrução manual.

Sem governança de acesso

Qualquer agente pode acessar qualquer conhecimento. Não há controles de acesso por agente, por domínio ou por operação para proteger contexto organizacional sensível.

Capacidades

Seis camadas de inteligência

Cada consulta flui por um pipeline de múltiplas camadas. Cada camada adiciona uma compreensão progressivamente mais profunda.

Compilador de Conhecimento

Faz parsing de Markdown com frontmatter YAML, valida 19 campos estruturados e compila em um índice de full-text search com Tantivy. Modo watch permite compilação incremental conforme o conhecimento evolui.

Cache em Múltiplas Camadas

Cache de correspondência exata (MD5, TTL de 60s), cache fuzzy (similaridade Jaccard com limiar de 0.6) e invalidação por geração garantem respostas rápidas e consistentes.

Busca BM25

Busca multi-campo com pesos configuráveis — título 3x, tags 2x, tags de domínio 1.5x. Pontuação composta que combina BM25, confiança, importância e recência.

Grafo Causal

Percorre relações de causa e efeito em até 6 saltos de profundidade. Disparado automaticamente por palavras-sinal causais como 'causado por', 'leva a', 'por que'.

Consultas Temporais

Padrões CurrentState, SinceTimestamp e EventHistory. Disparados automaticamente por palavras-chave como 'atual', 'mais recente', 'desde' e 'histórico'.

Síntese por LLM

Tier 3 opt-in que dispara quando as pontuações de busca caem abaixo do limiar. Sintetiza respostas a partir do conhecimento recuperado usando Claude, com controles completos de governança.

Arquitetura

Pipeline de consultas

Cada consulta de conhecimento flui por um pipeline determinístico, com cache e auditável — da correspondência exata à síntese por LLM.

Entrada da Consulta
Linguagem natural ou estruturada
Política Bulwark
Controle de acesso e governança
Tier 0: Cache Exato
Fingerprint MD5, TTL 60s
Tier 1: Cache Fuzzy
Similaridade Jaccard, limiar 0.6
Tier 2: Busca BM25
Multi-campo com pesos
Tier 2.5: Causal + Temporal
Travessia de grafo e histórico de eventos
Tier 3: Síntese LLM
Opt-in, com Claude

Cada camada faz short-circuit quando um resultado de alta confiança é encontrado — a maioria das consultas resolve no Tier 0 ou 1.

Integração

Três modos, qualquer agente

O Engram se adapta ao seu fluxo de agentes. CLI direto, plugin do Claude Code ou corpora ByteRover existentes — uma engine de conhecimento cobre todos.

ModoInterfaceCaso de Uso
CLI Directcompile / query / curateLocal development, CI pipelines
Claude Code PluginHook-based (UserPromptSubmit)Auto-retrieval on every prompt
ByteRover CorpusTransparent field aliasingExisting knowledge bases
Por dentro

Construído em Rust, 6 crates

Um workspace Rust modular onde cada preocupação é uma crate própria — compilação de conhecimento, execução de consultas, governança e integração com agentes.

engram-core/
Schema, parsing, and validation
engram-bulwark/
Policy engine and audit log
engram-compiler/
Indexing and compilation
engram-query/
Search, caching, causal/temporal
engram-openclaw/
Plugin interface, context formatting
engram-cli/
Binary entry point and commands
Nossa Abordagem

Como a Honto
engenharizou o Engram

O Engram representa o compromisso da Honto com sistemas de IA que acumulam conhecimento ao longo do tempo. Cada decisão de design prioriza precisão na recuperação, desempenho de consulta e governança.

01

Modelagem do Conhecimento

Definimos 19 campos estruturados de frontmatter cobrindo tipos de fato, níveis de confiança, vínculos causais, metadados temporais e tags de domínio.

02

Pipeline Multi-Camada

Desenhamos um pipeline de consulta que equilibra velocidade e profundidade — cache exato para consultas repetidas, BM25 para descoberta, grafos causais para compreensão.

03

Workspace Rust Modular

6 crates independentes, cada uma responsável por uma fronteira de capacidade. 513 testes em 16 arquivos de integração garantem a correção em cada camada.

04

Lançamento Open-Source

Construído para ser transparente, extensível e orientado à comunidade. Compatibilidade completa com corpora de conhecimento ByteRover existentes.

Precisa de memória persistente
para seus agentes de IA?

O Engram é open-source e pronto para implantar. Para sistemas de conhecimento corporativos, design de ontologia personalizada ou suporte de integração — a equipe de engenharia da Honto está à disposição.