Modo Chat vs. modo Agente (y el esfuerzo)
Halo tiene dos modos —Chat simple y el ciclo completo de Agente— además de niveles de esfuerzo (Auto, Rápido, Estándar, Profundo) y modos de ejecución. Aprende cuándo usar cada uno.
El espacio de trabajo de Halo tiene dos caras, que se alternan con el selector Chat / Agente en el compositor. Debajo de él, el modo Agente añade dos controles más —esfuerzo y modo de ejecución— que deciden cuánto trabaja el agente y con qué frecuencia consulta contigo.
Halo está en alfa en la mainnet de Base, con USDC real.
Chat vs. Agente
- Chat — chat directo con el modelo, sin herramientas: una inferencia pagada por mensaje. Ideal para preguntas rápidas e intercambios donde solo quieres la respuesta del modelo.
- Agente — el ciclo completo: planifica, usa herramientas, recurre a la memoria, y puede hacer varias llamadas pagadas para completar una sola solicitud. Ideal para investigación, tareas de varios pasos, y todo lo que necesite herramientas web o de datos.
El modo se recuerda entre visitas.
Esfuerzo: Auto, Rápido, Estándar, Profundo
En el modo Agente, la etiqueta de esfuerzo define cuánto trabajo recibe una solicitud:
- Rápido — una respuesta veloz a un dato, precio o definición: un prompt ligero, como máximo una llamada a herramienta, sin plan. La menor latencia y el menor costo.
- Estándar — una sesión de trabajo normal: unas pocas llamadas a herramientas, sin un plan de varias tareas.
- Profundo — un plan de varias tareas con síntesis y autoverificación: el mayor uso de herramientas y llamadas pagadas, para informes e investigación a fondo.
- Auto — clasifica cada solicitud de forma gratuita (sin inferencia) y la enruta a Rápido, Estándar o Profundo por ti.
Si una solicitud resulta más ligera de lo que querías, puedes profundizarla en lugar de volver a preguntar.
Modo de ejecución: Ejecución automática vs. preguntar primero
La etiqueta de modo de ejecución controla cuán autónomo es el agente:
- Ejecución automática — planifica, ejecuta, verifica su propia respuesta, y persigue el mejor siguiente paso; solo se detiene a preguntar cuando está genuinamente bloqueado.
- Preguntar primero — propone su plan para aprobación antes de gastar, y ofrece los siguientes pasos como opciones.
(Esto es independiente de los permisos por herramienta: cada herramienta puede seguir configurarse como Auto / Preguntar / Desactivada en Herramientas y x402.)
¿Cuál debería usar?
- Pregunta rápida → Chat, o Agente + Rápido.
- Tarea que necesita la web o datos → Agente + Estándar.
- Informe o investigación a fondo → Agente + Profundo.
- ¿Quieres vigilar lo que gasta? → Preguntar primero; ¿quieres que simplemente funcione? → Ejecución automática.
Relacionado
- Lo que el agente recuerda entre chats: memoria y contexto.
- Las herramientas que el agente puede pagar: activa herramientas con x402.