Chạy một operator (CLI)
Dùng CLI halo để phục vụ suy luận từ một nhà cung cấp, model được host, hoặc GPU cục bộ và kiếm USDC trên Base — slug nhà cung cấp, định giá, quyết toán, và thiết lập chạy thường trực.
Vai trò operate (vận hành) phục vụ suy luận cho mạng lưới và kiếm USDC theo
từng request. Hướng dẫn này dùng trực tiếp CLI halo. Muốn để agent thiết lập
giúp bạn bằng cách trò chuyện? Xem vận hành cùng agent của bạn.
Halo hiện đang ở giai đoạn alpha trên Base mainnet, sử dụng USDC thật. Yêu cầu Node.js 20+.
Cài đặt và kiểm tra
bash <(curl -fsSL https://raw.githubusercontent.com/warden-protocol/run-halo/main/skill/scripts/install.sh)
halo doctor --json # node version, install + wallet state, provider, relay health
Thiết lập nhà cung cấp, mức giá, rồi phục vụ
halo setup --provider <slug> [--api-key <key>] --margin 20 --with-pairing
halo serve
halo serve kết nối đi ra ngoài (outbound) tới relay qua WebSocket — không
cần URL công khai hay mở cổng inbound — công bố các model của bạn, và phục vụ
liên tục cho đến khi bị dừng. Ví operator không cần nạp tiền trước; USDC về
tay bạn khi quyết toán và Halo tài trợ gas.
<slug> là một trong các giá trị openclaw, claude-code, hermes, ollama,
lmstudio, openrouter, openai, anthropic, venice, near, together,
fireworks, groq, hoặc custom. Thêm nhiều nhà cung cấp thượng nguồn khác vào
cùng một operator bằng halo setup --add-provider.
Định giá
- Margin (
--margin <n>) — được khuyến nghị. Tính thêm n% trên mức giá công khai theo token của thượng nguồn, được tính theo từng model tại thời điểm quyết toán (áp dụng khi nhà cung cấp công khai giá, ví dụ OpenRouter và NEAR). Bám sát chi phí thực theo từng model. - Flat (
--flat <usd-per-1k>). Mức giá USD cố định trên mỗi 1.000 token — phù hợp với model cục bộ (Ollama, LM Studio) hoặc các nhà cung cấp thượng nguồn không công khai giá.
Phí giao thức khởi điểm ở mức 10% trên giá của bạn, bị giữ lại tại thời điểm quyết toán và được thực thi on-chain (có thể điều chỉnh qua quản trị) — số bạn thực nhận là giá − phí.
Cơ chế quyết toán hoạt động ra sao
Suy luận được quyết toán qua HaloVault trên Base: consumer nạp USDC và giữ riêng một phần cho operator của bạn; operator của bạn đọc khoản giữ riêng on-chain đó và chỉ phục vụ nếu nó đủ trang trải request; bạn báo cáo số token thực tế đã dùng, và một biên lai tích lũy sẽ quy đổi số đó về cho bạn. Bên facilitator gửi các giao dịch này và trả gas.
Quyền riêng tư
- Mã hóa đầu-cuối được bật mặc định — relay chỉ chuyển tiếp bản mã hóa, và khóa phiên của bạn chỉ tồn tại trong bộ nhớ, không bao giờ được lưu lại.
- Chế độ bảo mật (TEE) — đứng trước một nhà cung cấp TEE (ví dụ
--provider near) để phục vụ các model bảo mật mà chính operator cũng không đọc được.
Giữ cho nó luôn chạy
halo service install serve
halo service status serve
halo service logs serve
Sắp ra mắt
Suy luận có thể xác minh (SPEX) — một Statistical Proof of Execution (bằng chứng thống kê về việc thực thi) đưa ra đảm bảo xác suất rằng một operator đã thực sự chạy đúng model được yêu cầu — đang nằm trong lộ trình phát triển, cùng với các dịch vụ mã nguồn mở, có thể tự host. Xem suy luận có thể xác minh là gì.
Liên quan
- Chạy một endpoint suy luận trả phí thay vì vận hành: tạo endpoint (CLI).
- Tài liệu CLI đầy đủ: warden-protocol/run-halo.