Modo Chat vs. modo Agente (y el esfuerzo)

El espacio de trabajo de Halo tiene dos caras, que se alternan con el selector Chat / Agente en el compositor. Debajo de él, el modo Agente añade dos controles más —esfuerzo y modo de ejecución— que deciden cuánto trabaja el agente y con qué frecuencia consulta contigo.

Halo está en alfa en la mainnet de Base, con USDC real.

Research the best L2s for a payments app and compare fees…

ChatAgent Effort Deep Run Auto-run

Effort: Auto Quick Standard Deep

Illustration — Chat / Agent, effort & run mode

Chat vs. Agente

Chat — chat directo con el modelo, sin herramientas: una inferencia pagada por mensaje. Ideal para preguntas rápidas e intercambios donde solo quieres la respuesta del modelo.
Agente — el ciclo completo: planifica, usa herramientas, recurre a la memoria, y puede hacer varias llamadas pagadas para completar una sola solicitud. Ideal para investigación, tareas de varios pasos, y todo lo que necesite herramientas web o de datos.

El modo se recuerda entre visitas.

Esfuerzo: Auto, Rápido, Estándar, Profundo

En el modo Agente, la etiqueta de esfuerzo define cuánto trabajo recibe una solicitud:

Rápido — una respuesta veloz a un dato, precio o definición: un prompt ligero, como máximo una llamada a herramienta, sin plan. La menor latencia y el menor costo.
Estándar — una sesión de trabajo normal: unas pocas llamadas a herramientas, sin un plan de varias tareas.
Profundo — un plan de varias tareas con síntesis y autoverificación: el mayor uso de herramientas y llamadas pagadas, para informes e investigación a fondo.
Auto — clasifica cada solicitud de forma gratuita (sin inferencia) y la enruta a Rápido, Estándar o Profundo por ti.

Si una solicitud resulta más ligera de lo que querías, puedes profundizarla en lugar de volver a preguntar.

Modo de ejecución: Ejecución automática vs. preguntar primero

La etiqueta de modo de ejecución controla cuán autónomo es el agente:

Ejecución automática — planifica, ejecuta, verifica su propia respuesta, y persigue el mejor siguiente paso; solo se detiene a preguntar cuando está genuinamente bloqueado.
Preguntar primero — propone su plan para aprobación antes de gastar, y ofrece los siguientes pasos como opciones.

(Esto es independiente de los permisos por herramienta: cada herramienta puede seguir configurarse como Auto / Preguntar / Desactivada en Herramientas y x402.)

¿Cuál debería usar?

Pregunta rápida → Chat, o Agente + Rápido.
Tarea que necesita la web o datos → Agente + Estándar.
Informe o investigación a fondo → Agente + Profundo.
¿Quieres vigilar lo que gasta? → Preguntar primero; ¿quieres que simplemente funcione? → Ejecución automática.

Relacionado

Lo que el agente recuerda entre chats: memoria y contexto.
Las herramientas que el agente puede pagar: activa herramientas con x402.