Memoria y Conocimiento de Agentes de IA

Engram

Compilador de conocimiento y motor de consultas para memoria de agentes de IA

Los agentes de IA olvidan todo entre sesiones. Engram transforma archivos Markdown con frontmatter YAML en un índice buscable BM25 con caché multi-nivel, recorrido de grafos causales, consultas temporales y controles de gobernanza. Una base de conocimiento impulsa todos tus agentes.

513

Pruebas de integración

Crates de Rust

Niveles de consulta

Campos de frontmatter

Ver en GitHub Explorar Arquitectura

El Desafío

Los agentes de IA no tienen
memoria persistente

Cuando los agentes de IA operan entre sesiones, proyectos y equipos, pierden contexto constantemente. Cada conversación empieza de cero. El conocimiento institucional queda atrapado en interacciones individuales, sin acumularse en inteligencia organizacional.

Sin contexto persistente

Cada sesión de agente empieza en blanco. Decisiones previas, contexto y conocimiento acumulado desaparecen en el momento en que una sesión termina.

Sin recuperación estructurada

Incluso cuando el contexto existe en archivos, los agentes no tienen forma de buscar, clasificar o recuperar el conocimiento más relevante para una consulta dada.

Sin razonamiento causal

Los agentes no pueden rastrear cadenas de causa-efecto a través de entradas de conocimiento. Entender por qué algo sucedió requiere reconstrucción manual.

Sin gobernanza de acceso

Cualquier agente puede acceder a cualquier conocimiento. No existen controles de acceso por agente, por dominio o por operación para proteger el contexto organizacional sensible.

Capacidades

Seis capas de inteligencia

Cada consulta fluye a través de un pipeline multi-nivel. Cada nivel agrega comprensión progresivamente más profunda.

Compilador de Conocimiento

Analiza Markdown con frontmatter YAML, valida 19 campos estructurados y compila en un índice de búsqueda de texto completo Tantivy. El modo watch permite compilación incremental a medida que el conocimiento evoluciona.

Caché Multi-Nivel

Caché de coincidencia exacta (MD5, 60s TTL), caché difusa (similitud Jaccard con umbral 0.6) e invalidación consciente de generación aseguran respuestas rápidas y consistentes.

Búsqueda BM25

Búsqueda multi-campo con impulsos configurables — título 3x, etiquetas 2x, etiquetas de dominio 1.5x. Puntuación compuesta combina BM25, confianza, importancia y actualidad.

Grafo Causal

Recorre relaciones causa-efecto hasta 6 saltos de profundidad. Se activa automáticamente por palabras señal causales como 'causado por', 'lleva a', 'por qué'.

Consultas Temporales

Patrones EstadoActual, DesdeMarcaDeTiempo e HistorialDeEventos. Se activan automáticamente por palabras clave como 'actual', 'último', 'desde' e 'historial'.

Síntesis LLM

Nivel 3 opcional que se activa cuando las puntuaciones de búsqueda caen por debajo del umbral. Sintetiza respuestas del conocimiento recuperado usando Claude, con controles completos de gobernanza.

Arquitectura

Pipeline de consultas

Cada consulta de conocimiento fluye a través de un pipeline determinista, cacheado y auditable — desde coincidencia exacta hasta síntesis LLM.

Entrada de Consulta

Lenguaje natural o estructurado

Política Bulwark

Control de acceso y gobernanza

Nivel 0: Caché Exacto

Huella MD5, TTL de 60s

Nivel 1: Caché Difuso

Similitud Jaccard, umbral 0.6

Nivel 2: Búsqueda BM25

Multi-campo con impulsos

Nivel 2.5: Causal + Temporal

Recorrido de grafo e historial

Nivel 3: Síntesis LLM

Opcional, potenciado por Claude

Cada nivel cortocircuita cuando se encuentra un resultado de alta confianza — la mayoría de consultas se resuelven en el Nivel 0 o 1.

Integración

Tres modos, cualquier agente

Engram se adapta a tu flujo de trabajo de agentes. CLI directo, plugin de Claude Code o corpus ByteRover existentes — un motor de conocimiento maneja todo.

Modo	Interfaz	Caso de Uso
CLI Direct	compile / query / curate	Local development, CI pipelines
Claude Code Plugin	Hook-based (UserPromptSubmit)	Auto-retrieval on every prompt
ByteRover Corpus	Transparent field aliasing	Existing knowledge bases

Bajo el capó

Construido en Rust, 6 crates

Un espacio de trabajo modular en Rust donde cada responsabilidad es su propio crate — compilación de conocimiento, ejecución de consultas, gobernanza e integración de agentes.

engram-core/

Schema, parsing, and validation

engram-bulwark/

Policy engine and audit log

engram-compiler/

Indexing and compilation

engram-query/

Search, caching, causal/temporal

engram-openclaw/

Plugin interface, context formatting

engram-cli/

Binary entry point and commands

Nuestro Enfoque

Cómo Honto
diseñó Engram

Engram representa el compromiso de Honto con sistemas de IA que acumulan conocimiento con el tiempo. Cada decisión de diseño prioriza la precisión de recuperación, el rendimiento de consultas y la gobernanza.

Modelado de Conocimiento

Definimos 19 campos de frontmatter estructurados que cubren tipos de hechos, niveles de confianza, enlaces causales, metadatos temporales y etiquetas de dominio.

Pipeline Multi-Nivel

Diseñamos un pipeline de consultas que equilibra velocidad y profundidad — caché exacto para consultas repetidas, BM25 para descubrimiento, grafos causales para comprensión.

Espacio de Trabajo Modular en Rust

6 crates independientes, cada uno con un límite de capacidad propio. 513 pruebas en 16 archivos de integración aseguran la corrección en cada capa.

Lanzamiento de Código Abierto

Construido para ser transparente, extensible e impulsado por la comunidad. Compatibilidad total con corpus de conocimiento ByteRover existentes.

¿Necesitas memoria persistente
para tus agentes de IA?

Engram es de código abierto y está listo para desplegar. Para sistemas de conocimiento empresarial, diseño de ontología personalizada o soporte de integración — el equipo de ingeniería de Honto está aquí para ayudar.

Repositorio en GitHub Habla con Nuestro Equipo