Los agentes de IA no tienen
memoria persistente
Cuando los agentes de IA operan entre sesiones, proyectos y equipos, pierden contexto constantemente. Cada conversación empieza de cero. El conocimiento institucional queda atrapado en interacciones individuales, sin acumularse en inteligencia organizacional.
Sin contexto persistente
Cada sesión de agente empieza en blanco. Decisiones previas, contexto y conocimiento acumulado desaparecen en el momento en que una sesión termina.
Sin recuperación estructurada
Incluso cuando el contexto existe en archivos, los agentes no tienen forma de buscar, clasificar o recuperar el conocimiento más relevante para una consulta dada.
Sin razonamiento causal
Los agentes no pueden rastrear cadenas de causa-efecto a través de entradas de conocimiento. Entender por qué algo sucedió requiere reconstrucción manual.
Sin gobernanza de acceso
Cualquier agente puede acceder a cualquier conocimiento. No existen controles de acceso por agente, por dominio o por operación para proteger el contexto organizacional sensible.
Seis capas de inteligencia
Cada consulta fluye a través de un pipeline multi-nivel. Cada nivel agrega comprensión progresivamente más profunda.
Compilador de Conocimiento
Analiza Markdown con frontmatter YAML, valida 19 campos estructurados y compila en un índice de búsqueda de texto completo Tantivy. El modo watch permite compilación incremental a medida que el conocimiento evoluciona.
Caché Multi-Nivel
Caché de coincidencia exacta (MD5, 60s TTL), caché difusa (similitud Jaccard con umbral 0.6) e invalidación consciente de generación aseguran respuestas rápidas y consistentes.
Búsqueda BM25
Búsqueda multi-campo con impulsos configurables — título 3x, etiquetas 2x, etiquetas de dominio 1.5x. Puntuación compuesta combina BM25, confianza, importancia y actualidad.
Grafo Causal
Recorre relaciones causa-efecto hasta 6 saltos de profundidad. Se activa automáticamente por palabras señal causales como 'causado por', 'lleva a', 'por qué'.
Consultas Temporales
Patrones EstadoActual, DesdeMarcaDeTiempo e HistorialDeEventos. Se activan automáticamente por palabras clave como 'actual', 'último', 'desde' e 'historial'.
Síntesis LLM
Nivel 3 opcional que se activa cuando las puntuaciones de búsqueda caen por debajo del umbral. Sintetiza respuestas del conocimiento recuperado usando Claude, con controles completos de gobernanza.
Pipeline de consultas
Cada consulta de conocimiento fluye a través de un pipeline determinista, cacheado y auditable — desde coincidencia exacta hasta síntesis LLM.
Cada nivel cortocircuita cuando se encuentra un resultado de alta confianza — la mayoría de consultas se resuelven en el Nivel 0 o 1.
Tres modos, cualquier agente
Engram se adapta a tu flujo de trabajo de agentes. CLI directo, plugin de Claude Code o corpus ByteRover existentes — un motor de conocimiento maneja todo.
| Modo | Interfaz | Caso de Uso |
|---|---|---|
| CLI Direct | compile / query / curate | Local development, CI pipelines |
| Claude Code Plugin | Hook-based (UserPromptSubmit) | Auto-retrieval on every prompt |
| ByteRover Corpus | Transparent field aliasing | Existing knowledge bases |
Construido en Rust, 6 crates
Un espacio de trabajo modular en Rust donde cada responsabilidad es su propio crate — compilación de conocimiento, ejecución de consultas, gobernanza e integración de agentes.
Cómo Honto
diseñó Engram
Engram representa el compromiso de Honto con sistemas de IA que acumulan conocimiento con el tiempo. Cada decisión de diseño prioriza la precisión de recuperación, el rendimiento de consultas y la gobernanza.
Modelado de Conocimiento
Definimos 19 campos de frontmatter estructurados que cubren tipos de hechos, niveles de confianza, enlaces causales, metadatos temporales y etiquetas de dominio.
Pipeline Multi-Nivel
Diseñamos un pipeline de consultas que equilibra velocidad y profundidad — caché exacto para consultas repetidas, BM25 para descubrimiento, grafos causales para comprensión.
Espacio de Trabajo Modular en Rust
6 crates independientes, cada uno con un límite de capacidad propio. 513 pruebas en 16 archivos de integración aseguran la corrección en cada capa.
Lanzamiento de Código Abierto
Construido para ser transparente, extensible e impulsado por la comunidad. Compatibilidad total con corpus de conocimiento ByteRover existentes.
¿Necesitas memoria persistente
para tus agentes de IA?
Engram es de código abierto y está listo para desplegar. Para sistemas de conocimiento empresarial, diseño de ontología personalizada o soporte de integración — el equipo de ingeniería de Honto está aquí para ayudar.