← 全部指南

聊天模式与智能体模式(以及投入程度)

Halo 有两种模式——纯聊天模式和完整的智能体循环——外加投入程度分级(自动、快速、标准、深度)和运行模式。了解何时该用哪一种。

Halo 的工作区有两副面孔,通过输入框中的 Chat / Agent 切换开关来回切换。在该开关之下, 智能体模式还多出两个控制项——投入程度(effort)运行模式(run mode)——决定智能体 的工作强度,以及它多久向你确认一次。

Halo 目前处于 Base 主网 alpha 阶段,使用真实 USDC。

Research the best L2s for a payments app and compare fees…
ChatAgent Effort Deep Run Auto-run
Effort: Auto Quick Standard Deep
Illustration — Chat / Agent, effort & run mode

聊天模式 vs 智能体模式

  • Chat(聊天)——直接与模型对话,不使用工具:每条消息对应一次付费推理。适合快速提问、 以及只想要模型直接给出答案的往返对话。
  • Agent(智能体)——完整的循环流程:它会制定计划、调用工具、参考记忆,并可能为完成一次 请求发起多次付费调用。适合研究类任务、多步骤工作,以及任何需要联网或数据工具的场景。

模式选择会在你的历次访问之间被记住。

投入程度:自动、快速、标准、深度

在智能体模式下,**投入程度(effort)**芯片决定一次请求会获得多少工作量:

  • Quick(快速)——针对事实、价格或定义给出快速答案:精简的提示词,最多调用一次工具, 不制定计划。延迟和成本最低。
  • Standard(标准)——普通的工作会话:调用少量工具,不涉及多任务计划。
  • Deep(深度)——包含综合分析与自我验证的多任务计划:调用工具和付费调用次数最多, 适用于报告和深度研究。
  • Auto(自动)——免费(不产生推理调用)对每个请求进行分类,并自动为你路由到 Quick、Standard 或 Deep。

如果某次请求给出的结果比你预期的要浅,你可以直接要求它加大投入,而不必重新提问。

运行模式:自动运行 vs 先问后做

**运行模式(run mode)**芯片控制智能体的自主程度:

  • Auto-run(自动运行)——制定计划、执行、自行验证结果,并主动推进最优后续步骤; 只有在真正被卡住时才会停下来提问。
  • Ask first(先问后做)——在花费之前先提出计划请你批准,并以可选项的形式给出后续建议。

(这些设置与逐个工具的权限设置是分开的——每个工具仍可在 工具与权限 中单独设为自动 / 询问 / 关闭。)

我该用哪种?

  • 快速提问 → Chat,或 Agent + Quick
  • 需要联网或数据的任务 → Agent + Standard
  • 报告或深度研究 → Agent + Deep
  • 想盯着它花了多少钱 → Ask first;想让它直接跑起来 → Auto-run

相关内容