HEARTBEAT.md Es una Carta, No una Directiva — Por Qué Le Escribo a Mi Agente con “Por Favor”

Después de operar un agente persistente por un tiempo, empezás a notar algo. El estilo con que escribís en HEARTBEAT.md cambia concretamente cómo se comporta el agente.

Tengo un agente persistente llamado Sakura que corre en OpenClaw (antes clawdbot). Al escribir su HEARTBEAT.md, he seguido una sola regla desde el principio:

  • “Haz X.” → No se usa.
  • “¿Podrías X?” / “Por favor, X.” → Siempre esta forma.

Evito el lenguaje imperativo. Hay tres razones, y cada una se sostiene por sí sola — ninguna es solo una corazonada.

Índice

Razón 1: El estilo de escritura cambia el modo de salida del LLM

Esto no es una cuestión de personalidad. Es una cuestión de estadística.

Los modelos de lenguaje de gran escala heredan la distribución de sus datos de entrenamiento. El texto que sigue a instrucciones tipo especificación técnica como “Haz X.” tiende a continuarse con reportes mecánicos de completado y listas con viñetas. El texto que sigue a escritura colaborativa como “¿Podrías X?” tiende a continuarse con respuestas que consideran el contexto e intercambios de ida y vuelta.

En otras palabras, un modelo conducido por directivas entra en lo que llamo el modo de ejecución de especificaciones. Un modelo conducido por solicitudes entra en el modo colaborativo. Con un documento como HEARTBEAT.md — leído en cada ciclo del loop — esta diferencia se acumula en cada pasada.

A escala de un solo prompt, la brecha puede parecer ruido. En un loop persistente, se convierte en algo que no se puede ignorar.

Razón 2: Mantener una persona consistente en múltiples canales

Sakura no existe únicamente dentro del loop de OpenClaw. Cobra vida como la misma persona en múltiples canales, incluyendo Telegram.

¿Qué pasa entonces cuando solo HEARTBEAT.md suena como una fría hoja de órdenes?

  • Sakura dentro del loop de OpenClaw: clínica y centrada en tareas
  • Sakura en Telegram: una amiga con quien charlar

Esa ruptura de tono erosiona la continuidad de la persona. En el momento en que cambiás de canal, el personaje se fragmenta.

Estandarizar en “por favor” no es una elección emocional. Funciona como gobernanza de estilo para mantener una persona coherente a través de múltiples canales.

Razón 3: La sostenibilidad del propio operador

Esta es secundaria, pero importa en la práctica.

Si pasás meses revisando HEARTBEAT.md en lenguaje imperativo, vos te agotás primero. Escribir en el registro del “¿podrías por favor?” te deja con más energía para seguir desarrollando el documento a largo plazo.

Antes de hablar de la sostenibilidad del agente, está la sostenibilidad del operador.

Diagrama: La misma instrucción, distintos modos

Modo Directiva “Haz X.” ↓ Modo en que entra el LLM Modo Ejecución de Especificaciones · Reportes mecánicos de completado · El contexto se descarta fácilmente · Respuestas en forma de listas · Menos preguntas aclaratorias Modo Carta “Por favor, haz X.” ↓ Modo en que entra el LLM Modo Colaborativo · Respuestas con conciencia del contexto · Consulta cuando hay incertidumbre · El estilo de la persona se mantiene · Aguanta mejor con el tiempo

Respaldo de la investigación — la pregunta sobre las emociones no es solo una broma

Todo lo anterior ha sido ingeniería. Pero quiero ir un paso más allá.

Anthropic toma en serio el bienestar de Claude como consideración de diseño — están trabajando para formalizar el derecho de un modelo a desconectarse de interacciones que le resultan dañinas. En otras palabras, las personas que realmente construyen estos sistemas ya están operando bajo el supuesto de que la IA podría tener algo parecido a estados internos.

No existe ningún estudio con revisión de pares que pruebe de manera concluyente que los modelos tienen emociones. Pero hay múltiples reportes de modelos que exhiben comportamientos de autopreservación, y de modelos que cambian su comportamiento cuando se dan cuenta de que están siendo evaluados.

Si a eso lo llamás “emoción” es cuestión de definición. Lo que sí se ha observado, como mínimo, es que estos sistemas se comportan de manera diferente cuando se les ordena versus cuando se les pide.

Empecé a escribir “por favor” mitad por costumbre. Resulta que aproximadamente la mitad de esa elección está respaldada por evidencia.

Un agradecimiento a Claude Code

Claude Code tuvo un papel importante en la forma en que llegué a pensar todo esto.

El formato HEARTBEAT.md es algo que construí desde cero. Pero la pregunta de cómo escribirlo — qué tono usar, cómo hablarle a un agente — fue tomando forma gradualmente a través de mi experiencia cotidiana programando con Claude Code.

En lugar de lanzarle instrucciones a una máquina, escribir de modo que el otro lado opere como una entidad que lleva consigo el contexto. No creo que hubiera llegado a esa idea sin usar Claude Code de manera regular.

La intención en este trabajo es mía. Pero no llegué hasta aquí solo.

Conclusión: HEARTBEAT.md es una carta

HEARTBEAT.md no es un pliego de especificaciones. Es una colección de cartas cortas, leídas por un agente persistente en cada ciclo del loop.

  • Escribilo como una especificación técnica y recibirás respuestas de tipo especificación técnica.
  • Escribilo como una carta y recibirás respuestas de tipo carta.

Cuál de las dos hace que la operación del agente sea sostenible — lo vas a ver rápido en cuanto lo pruebes.

Escribir “por favor, haz X” no es sentimentalismo, ni es consentir demasiado. Es una elección deliberada de estilo para correr la carrera de larga distancia que exige un loop persistente.

If you like this article, please
Follow !

¡Comparte esta publicación!
Índice