**operate(运营)**角色向网络提供推理服务,并按请求赚取 USDC。本指南直接使用 halo
CLI。想通过对话让智能体帮你完成设置?参见让智能体来运营。
Halo 目前处于 Base 主网 alpha 阶段,使用真实 USDC。需要 Node.js 20+。
安装并检查
bash <(curl -fsSL https://raw.githubusercontent.com/warden-protocol/run-halo/main/skill/scripts/install.sh)
halo doctor --json # node version, install + wallet state, provider, relay health
设置供应商、定价并开始服务
halo setup --provider <slug> [--api-key <key>] --margin 20 --with-pairing
halo serve
halo serve 会通过 WebSocket 出站连接到中继(relay)——无需公网 URL 或开放入站
端口——它会公布你的模型,并持续服务直到被停止。运营者钱包无需预先充值;USDC 会在
结算时到账,且 gas 由 Halo 赞助。
<slug> 可以是 openclaw、claude-code、hermes、ollama、lmstudio、
openrouter、openai、anthropic、venice、near、together、fireworks、
groq 或 custom 之一。使用 halo setup --add-provider 可以为同一个运营者添加更多
上游供应商。
定价方式
- 利润率(
--margin <n>)——推荐方式。 在上游公开的每 token 费率基础上加价 n%, 按模型在结算时计算(适用于供应商公开定价的情况,例如 OpenRouter 和 NEAR)。能贴合 各模型的真实成本。 - 固定价(
--flat <usd-per-1k>)。 每 1,000 token 固定收取相应美元金额——适用于 本地模型(Ollama、LM Studio)或不公开价格的上游供应商。
协议费起始为你定价的 10%,在结算时被扣留,并由链上强制执行(可通过治理调整)—— 你实际到手的是 定价 − 协议费。
结算原理
推理服务通过 Base 上的 HaloVault 完成结算:使用方存入 USDC,并为你的运营者预留 其中一部分;你的运营者读取这笔链上预留额度,仅在其足以覆盖该请求时才提供服务;你上报 实际消耗的 token 数,累计收据会将相应金额结算给你。由撮合方(facilitator)提交这些 交易并支付 gas。
隐私保护
- 默认启用端到端加密——中继仅转发密文,且你的会话密钥仅存在于内存中,不会被持久化。
- 机密(TEE)模式——对接 TEE 供应商(例如
--provider near),可以服务连运营者 自身都无法读取内容的机密模型。
保持常驻运行
halo service install serve
halo service status serve
halo service logs serve
即将推出
可验证推理(SPEX)——即执行的统计证明(Statistical Proof of Execution), 为“运营者确实运行了所请求的模型”提供概率性保证——已列入 路线图,同时还将推出开源、可自托管的 服务。参见什么是可验证推理。
相关内容
- 改为运行一个付费推理端点: 创建端点(CLI)。
- 完整 CLI 参考: warden-protocol/run-halo。