Saltar al contenido
Herramientas IA

Cómo construir agentes IA que funcionan: contexto, memoria y skills

El sistema de contexto, memoria y skills que convierte a cualquier agente IA en algo útil de verdad. Guía práctica para founders y operadores LATAM.

Jorge · ·
agentes-iacontext-engineeringMCPclaude-codeskills-iaautomatizacion

Resumen rápido

La mayoría de los agentes IA fallan porque nadie les explicó quiénes son ni para qué sirven. El sistema que realmente funciona tiene tres piezas: un archivo de contexto permanente (agents.md o claude.md), un archivo de memoria que aprende con cada corrección (memory.md), y skills que convierten tus procesos repetitivos en comandos de una línea. Greg Eisenberg y Remy Gasill lo demuestran en vivo en su último episodio.

El error que comete casi todo el mundo

La primera pregunta que hace la mayoría cuando empieza con agentes IA es: “¿Qué plataforma uso?”

Es la pregunta equivocada.

Entrar a Claude Code, Cowork o Manus sin haber resuelto el problema de contexto produce resultados mediocres con cualquier herramienta. El agente no sabe quién eres, qué vendes, a quién le hablas, ni cómo prefieres trabajar. Entonces improvisa. Y la improvisación de un LLM sin contexto es genérica por definición.

Greg Eisenberg y Remy Gasill documentaron esto en detalle en su último episodio del Late Checkout Podcast. Remy tiene toda su empresa corriendo a través de carpetas y archivos markdown. En el episodio demuestra en vivo cómo construir el sistema desde cero, comparando tres plataformas distintas con el mismo prompt. El resultado: todas producen outputs razonables, pero la diferencia real no está en la plataforma. Está en el contexto que le das.

El 14% de las empresas en Latinoamérica tiene proyectos de IA agéntica operativos hoy, según datos de IDC de 2026. El 47% ya usa IA en alguna forma. La brecha entre los dos grupos no es de acceso a tecnología. Es de arquitectura.

Qué hace que un agente sea un agente

Antes de construir nada, conviene tener claro por qué un agente es diferente de un chatbot.

Un chatbot funciona en modo pregunta-respuesta. Tú escribes, él responde, tú actúas. El ciclo depende de ti en cada paso.

Un agente funciona en modo objetivo-resultado. Le das una tarea, él planifica, ejecuta y entrega. Si necesita investigar algo antes de actuar, lo investiga. Si necesita iterar, itera. No para hasta concluir.

La arquitectura interna de cualquier agente tiene 4 componentes: el modelo de lenguaje (el cerebro), el loop (el mecanismo de repetición hasta completar), las herramientas conectadas (lo que puede hacer en el mundo real), y el contexto (lo que sabe de ti y de tu negocio).

Definición clave: Un agent harness es una plataforma que facilita el loop agente: recibe tu tarea, gestiona el ciclo Observar-Pensar-Actuar, conecta las herramientas, y entrega el resultado. Claude Code, Cowork, Codex, OpenClaw y Manus son todos agent harnesses. La diferencia está en la interfaz y el nivel de autonomía, no en el modelo subyacente.

El loop opera en 3 pasos que se repiten: observar el estado actual, pensar qué hacer, actuar. En la demo de Remy, Claude Code recibe la tarea “construye un portfolio para Greg Eisenberg”. Su primer paso del loop: ¿quién es Greg Eisenberg? Investiga. Su segundo paso: tengo la investigación, ¿qué sigue? Escribo el código. Su tercer paso: el sitio está construido, ¿el resultado es aceptable? Toma un screenshot y verifica. Concluye que sí. Entrega.

Eso es el loop en acción.

Todas las plataformas del mercado, desde Claude Code hasta Codex, OpenClaw, Manus o Cowork, son lo mismo: una interfaz que facilita este loop. Las diferencias son de usabilidad, nivel de autonomía y ecosistema de herramientas. Pero si entiendes el loop, puedes usar cualquiera. Es como aprender a manejar antes de elegir el auto.

Paso 1: el archivo de contexto (agents.md)

Imagina que contratas a una asistente ejecutiva y el primer día le dices: “escríbeme un email”. Sin presentarte, sin contarle a qué te dedicas, sin decirle a quién va el email. El resultado será mediocre, no porque sea mala asistente, sino porque no tiene la información para hacer bien su trabajo.

El archivo agents.md (también llamado claude.md, gemini.md o .continue/config.json dependiendo de la plataforma) es exactamente eso: el onboarding de tu agente. Se carga al inicio de cada sesión y le dice quién eres, qué vendes, a quién, cómo trabajas, qué herramientas usas, y qué tono prefieres.

En la demo del episodio, sin este archivo el agente pregunta “¿qué vendes?”, “¿quién es tu audiencia?”, “¿qué tono quieres?” antes de poder escribir un email de prospección. Con el archivo cargado, el mismo prompt produce un email decente en 30 segundos.

El contenido mínimo de un buen archivo de contexto:

  • Quién eres y qué hace tu empresa (2-3 párrafos concretos)
  • Tu audiencia principal y su problema real
  • Tus herramientas de trabajo y para qué usas cada una
  • Preferencias de tono y formato en las comunicaciones
  • Reglas que nunca quieres que viole (ej: “nunca CC al cliente en correos internos”)

Puedes construir este archivo en una conversación. Abre Claude, Cowork o cualquier LLM y pide que te haga preguntas tipo entrevista para extraer el contexto. En 20-30 minutos tienes el primer borrador.

Para operaciones más complejas, conviene dividir el contexto en una carpeta con archivos separados: brand.md, voice.md, customer-profile.md, tools.md. En el archivo principal le dices al agente que lea esa carpeta antes de responder cualquier cosa.

Remy menciona que muchos usuarios de Obsidian van un paso más lejos: en su claude.md le instruyen al agente que revise su vault completo para encontrar contexto relevante. El segundo cerebro se convierte en la memoria del agente.

Paso 2: la memoria explícita (memory.md)

Aquí hay una diferencia crítica entre los chatbots de consumo y los agentes locales.

ChatGPT y Claude.ai guardan automáticamente en la nube lo que les dices. Esa memoria es cómoda pero opaca: no ves qué guardó, no puedes editarla, y en algún momento empieza a contaminar resultados. Si hablas de tres empresas distintas, pides consejos de relaciones y luego quieres copy de landing page, el modelo mezcla todo.

Un agente local no recuerda nada entre sesiones por defecto. Lo que no está escrito, no existe. Al principio parece una limitación. Con el tiempo resulta ser una ventaja.

El archivo memory.md resuelve esto de forma explícita. En el archivo de contexto le dices al agente: “cuando te corrija o aprendas algo nuevo, actualiza memory.md”. Cada vez que dices “nunca me saludes así” o “siempre usa este formato para los propuestas”, el agente registra la preferencia. Al inicio de la siguiente sesión, lee ese archivo y ya sabe.

Las preferencias se acumulan. Los errores disminuyen. Después de 3 semanas de uso real, el agente conoce tus particularidades mejor de lo que las recuerda cualquier colaborador nuevo.

Una recomendación práctica de Remy: limitar el archivo a preferencias sustanciales. Si empieza a guardar trivialidades, dile en el agents.md que solo persista correcciones relevantes para el trabajo. El tamaño recomendado es menos de 200 líneas para mantener la carga de contexto eficiente.

Paso 3: los skills (SOPs para IA)

Un skill es un archivo markdown que describe exactamente cómo ejecutar un proceso específico.

La diferencia con el archivo de memoria: la memoria guarda preferencias (“siempre firma así”, “nunca uses este tono”). Los skills documentan procesos (“para analizar una biblioteca de anuncios, sigue estos pasos: primero, extrae todos los creativos, luego…”).

Remy tiene un skill de análisis de biblioteca publicitaria Meta. En su versión manual, ese proceso le tomaba 3-4 horas: revisar los anuncios de un competidor, analizar creativos, evaluar copy, documentar findings. Con el skill activo, pega la URL de la biblioteca y espera 15 minutos. El resultado: 220 anuncios analizados, captura de pantalla de cada landing page, análisis visual y de copy, informe consolidado.

Hay dos maneras de crear un skill. La primera: si ya tienes documentado el proceso (un SOP, el transcript de un curso, un artículo), pasas ese material al agente y le pides que use su “skill creator” para convertirlo en un skill. La segunda: ejecutas el proceso manualmente una vez con el agente, y al terminar le dices “crea un skill de lo que acabamos de hacer”. El agente empaqueta el proceso con toda la lógica que usó.

Los skills se pueden encadenar. Un skill de “morning brief” puede invocar automáticamente un skill de “investigar al invitado” si detecta una reunión en el calendario. Un skill de “proposal” puede invocar un skill de “crear link de pago en Stripe”. La automatización no está en la plataforma: está en los skills que tú defines.

Los skills también tienen scope. Hay skills globales que aplican a todos tus proyectos (un skill de “acortar texto”, por ejemplo). Y hay skills de proyecto que solo viven en su contexto específico (el skill de “referir al socio X” no tiene sentido en el proyecto Y).

MCP: cómo tu agente habla con tus herramientas

Construir el contexto y la memoria resuelve el problema de lo que el agente sabe. El MCP resuelve el problema de lo que puede hacer.

Model Context Protocol es el estándar abierto que Anthropic lanzó en noviembre de 2024. La analogía más clara que circula en el ecosistema: antes de MCP, tu agente hablaba “inglés” y cada herramienta hablaba su propio idioma. Gmail hablaba francés, Notion español, Slack chino. Conectarlos requería traducción manual en cada caso: desarrollo custom, tiempo, mantenimiento.

MCP es el intérprete universal. Se sienta en el medio, recibe las instrucciones del agente en su lenguaje, las traduce al lenguaje de la herramienta, y devuelve la respuesta al agente. Una vez que una herramienta implementa el protocolo, cualquier agente puede usarla.

Hoy hay cientos de conectores MCP disponibles para Gmail, Google Calendar, Notion, Slack, Stripe, GitHub, Linear, y más. Las principales plataformas de agentes tienen interfaces visuales para activarlos sin código. En Claude Code, cuentan como configuración en el archivo de settings. En Cowork, hay una sección de “connectors” con un catálogo de integraciones.

La potencia real aparece cuando combinas herramientas. En la demo del episodio, Remy da esta instrucción: “revisa mis notas de la reunión con Maltoshi de hoy, prepara el email con la propuesta, crea el link de pago en Stripe y abre el proyecto en Notion”. El agente va a Granola (sus notas de reunión), extrae los puntos clave, va a Stripe, crea el producto con el precio acordado, va a Notion, crea la ficha del proyecto, redacta el email con todo integrado. Una instrucción, 4 herramientas, 5 minutos.

Sin MCP, eso habría requerido abrir 4 tabs, copiar y pegar entre ellas, y dedicarle 30-40 minutos.

Qué plataforma usar según tu nivel

Esta pregunta sí tiene respuesta, aunque no la que la mayoría espera.

PlataformaNivelMejor paraMemoria automática
CoworkPrincipianteEmpezar, entender el loopNo (manual)
Perplexity ComputerPrincipianteTareas con búsqueda webNo
ManusPrincipiante/IntermedioMemoria automática, bajo setup
Claude CodeIntermedioControl total, vault Obsidian, MCPsNo (manual)
CodexIntermedioProyectos con códigoNo
OpenClawAvanzadoAutonomía 24/7, múltiples agentes

Para empezar, Cowork tiene la interfaz más simple y hace explícito el loop. Perplexity Computer y Manus son también buenas opciones de entrada. Lo importante no es la plataforma: es entender los conceptos para que cuando cambies de herramienta no tengas que empezar de cero.

Claude Code es la opción que los usuarios más avanzados recomiendan para trabajo serio. Da más visibilidad sobre lo que el agente está pensando, permite integrar el vault de Obsidian directamente, y tiene el ecosistema de MCPs más maduro. No requiere saber programar, pero sí tener comodidad trabajando desde terminal.

OpenClaw es la opción más autónoma. Tiene memoria automática, archivos de “soul” e “identity” que definen la personalidad del agente, y puede correr tareas en segundo plano sin que estés mirando. También es la más compleja de configurar. La recomendación práctica de Remy: construye primero todo en Claude Code, verifica que el sistema funciona bien, y después migra a OpenClaw si necesitas más autonomía.

El mercado latinoamericano está en una posición particular. El 47% de las empresas de la región ya implementa alguna forma de IA, por encima del 42% global según el estudio de Meta y Linux Foundation de diciembre de 2025. Pero la mayoría sigue en modo chat. La brecha entre “usar ChatGPT para escribir emails” y “tener un agente que gestiona tus operaciones” es exactamente lo que este sistema resuelve.

Los 3 errores que destruyen el contexto

Antes de llegar al AIOS completo, hay 3 errores concretos que arruinan la mayoría de los proyectos de agentes:

Error 1: El agents.md genérico. “Soy un emprendedor que trabaja en startups” no es contexto útil. El agente necesita especificidad: qué vendes exactamente, a quién, en qué mercado, con qué equipo, con qué herramientas. La diferencia entre un agents.md genérico y uno específico es la diferencia entre “escribe un email de seguimiento” y un email que suena como tú, para tu cliente real, en el tono adecuado.

Error 2: No separar contextos por proyecto. Un agente que tiene mezclados 4 proyectos activos produce outputs contaminados. El skill de copywriting del cliente A no debería estar disponible cuando trabajas para el cliente B. La arquitectura correcta: un directorio por proyecto, cada uno con su propio agents.md. Contextos separados, outputs limpios.

Error 3: Ignorar el memory.md hasta que es tarde. Sin actualizar la memoria, cada sesión empieza de cero. El agente sigue cometiendo los mismos errores porque nadie documentó las correcciones. El hábito correcto: al final de cualquier sesión donde corrijas algo importante, revisa que memory.md tenga registrado el aprendizaje. 5 minutos de mantenimiento por sesión ahorran horas de repetición futura.

Definición clave — context engineering: la práctica de seleccionar con precisión qué información le das a tu agente para cada tarea. Como definió el equipo de Neo4j en enero de 2026: “Prompt Engineering is what you do inside the context window. Context Engineering is how you decide what fills the window.” El context engineering es la disciplina que reemplaza al prompt engineering en la era de los agentes.

La visión que se está construyendo ahora

Remy Gasill ya no abre Gmail, Notion, Google Calendar ni Stripe directamente. Vive en Claude Code como interfaz central. Todas las herramientas están conectadas vía MCP. Cada proceso repetitivo tiene su skill. El archivo de memoria tiene meses de preferencias acumuladas.

Cody Schneider, emprendedor al que Eisenberg cita en el episodio, lo formuló así: en el futuro, cada profesional va a llegar a su trabajo con un AI Operating System personal ya construido. El valor diferencial no va a ser la herramienta que uses, sino la calidad del sistema que hayas construido sobre ella.

El proceso es más gradual de lo que parece. Empieza con un archivo de contexto sólido. Añade memoria. Automatiza 3-5 procesos repetitivos como skills durante las primeras semanas. Conecta las herramientas que usas a diario via MCP. En 30 días tienes algo que funciona. En 90 días, algo que genuinamente te ahorra tiempo.

La infraestructura para construir esto existe hoy y es accesible sin saber programar. La ventana de ventaja competitiva para los founders que lo hagan primero es real, pero no infinita.


Remy Gasill comparte el sistema completo en el episodio del Late Checkout Podcast de Greg Eisenberg: Building AI Agents that actually work. El episodio incluye demos en vivo con Claude Code, Codex y Anti-gravity.

Preguntas frecuentes

¿Qué necesito para empezar a construir un agente IA?
Un agent harness (Claude Code, Cowork, o Manus son buenas opciones para empezar), un archivo agents.md con información sobre tu negocio, y claridad sobre qué tarea repetitiva quieres automatizar primero. No necesitas saber programar.
¿Cuál es la diferencia entre un agente IA y un chatbot?
Un chatbot responde preguntas. Un agente tiene un objetivo, planifica los pasos para lograrlo, ejecuta acciones en herramientas reales (Gmail, Notion, Stripe) y repite hasta terminar. No espera que le digas qué hacer en cada paso.
¿Qué es el context engineering y por qué reemplaza al prompt engineering?
El prompt engineering se enfoca en cómo formulas la pregunta. El context engineering se enfoca en qué información tiene disponible el agente antes de que respondas. Un agente con excelente contexto produce buenos resultados con prompts simples. Sin contexto, ni el mejor prompt lo salva.
¿Qué es MCP y para qué sirve en un agente IA?
MCP (Model Context Protocol) es el estándar abierto creado por Anthropic en noviembre de 2024 para conectar agentes IA con herramientas externas: Gmail, Google Calendar, Notion, Slack, Stripe, y cientos más. Sin MCP, conectar cada herramienta requería desarrollo custom. Con MCP, es un proceso estándar que cualquier plataforma implementa.
¿Cuánto tiempo tarda en construirse un agente funcional?
Un agente básico con contexto, memoria y 2-3 skills puede estar operativo en un día. La inversión real está en documentar tus procesos y entrenar la memoria con las primeras correcciones. Después de 2-3 semanas de uso real, el agente empieza a ser genuinamente útil.

IA, low-code y automatización para equipos en LatAm y España.

Ver artículos →