Halo 的工作区有两副面孔,通过输入框中的 Chat / Agent 切换开关来回切换。在该开关之下, 智能体模式还多出两个控制项——投入程度(effort)和运行模式(run mode)——决定智能体 的工作强度,以及它多久向你确认一次。
Halo 目前处于 Base 主网 alpha 阶段,使用真实 USDC。
Research the best L2s for a payments app and compare fees…
ChatAgent Effort Deep Run Auto-run
Effort: Auto Quick Standard Deep
聊天模式 vs 智能体模式
- Chat(聊天)——直接与模型对话,不使用工具:每条消息对应一次付费推理。适合快速提问、 以及只想要模型直接给出答案的往返对话。
- Agent(智能体)——完整的循环流程:它会制定计划、调用工具、参考记忆,并可能为完成一次 请求发起多次付费调用。适合研究类任务、多步骤工作,以及任何需要联网或数据工具的场景。
模式选择会在你的历次访问之间被记住。
投入程度:自动、快速、标准、深度
在智能体模式下,**投入程度(effort)**芯片决定一次请求会获得多少工作量:
- Quick(快速)——针对事实、价格或定义给出快速答案:精简的提示词,最多调用一次工具, 不制定计划。延迟和成本最低。
- Standard(标准)——普通的工作会话:调用少量工具,不涉及多任务计划。
- Deep(深度)——包含综合分析与自我验证的多任务计划:调用工具和付费调用次数最多, 适用于报告和深度研究。
- Auto(自动)——免费(不产生推理调用)对每个请求进行分类,并自动为你路由到 Quick、Standard 或 Deep。
如果某次请求给出的结果比你预期的要浅,你可以直接要求它加大投入,而不必重新提问。
运行模式:自动运行 vs 先问后做
**运行模式(run mode)**芯片控制智能体的自主程度:
- Auto-run(自动运行)——制定计划、执行、自行验证结果,并主动推进最优后续步骤; 只有在真正被卡住时才会停下来提问。
- Ask first(先问后做)——在花费之前先提出计划请你批准,并以可选项的形式给出后续建议。
(这些设置与逐个工具的权限设置是分开的——每个工具仍可在 工具与权限 中单独设为自动 / 询问 / 关闭。)
我该用哪种?
- 快速提问 → Chat,或 Agent + Quick。
- 需要联网或数据的任务 → Agent + Standard。
- 报告或深度研究 → Agent + Deep。
- 想盯着它花了多少钱 → Ask first;想让它直接跑起来 → Auto-run。
相关内容
- 智能体在对话之间会记住什么:记忆与上下文。
- 智能体可以付费使用的工具:通过 x402 启用工具。