Ejecuta un operador (CLI)
Usa la CLI de halo para servir inferencia desde un proveedor, un modelo alojado o una GPU local y gana USDC sobre Base: slugs de proveedor, precios, liquidación y configuración siempre activa.
El rol operate sirve inferencia a la red y gana USDC por solicitud. Esta
guía usa la CLI de halo directamente. ¿Prefieres que un agente lo configure
conversando? Consulta opera con tu agente.
Halo está en alfa en la mainnet de Base, con USDC real. Requiere Node.js 20+.
Instala y verifica
bash <(curl -fsSL https://raw.githubusercontent.com/warden-protocol/run-halo/main/skill/scripts/install.sh)
halo doctor --json # node version, install + wallet state, provider, relay health
Configura un proveedor, un precio, y sirve
halo setup --provider <slug> [--api-key <key>] --margin 20 --with-pairing
halo serve
halo serve se conecta de salida al relay por WebSocket —sin URL pública
ni puerto de entrada abierto—, anuncia tus modelos, y sirve hasta que se
detiene. La wallet de operador no necesita financiamiento previo; el USDC
llega en la liquidación y Halo patrocina el gas.
<slug> es uno de openclaw, claude-code, hermes, ollama, lmstudio,
openrouter, openai, anthropic, venice, near, together,
fireworks, groq, o custom. Añade más upstreams a un mismo operador con
halo setup --add-provider.
Precios
- Margen (
--margin <n>) — recomendado. Cobra n% sobre la tarifa publicada por token del upstream, resuelta por modelo en la liquidación (donde el proveedor expone precios, por ejemplo OpenRouter y NEAR). Sigue el costo real por modelo. - Fijo (
--flat <usd-per-1k>). Un precio fijo en USD por cada 1.000 tokens, para modelos locales (Ollama, LM Studio) o upstreams que no publican precios.
La comisión del protocolo empieza en el 10% de tu precio, retenida en la liquidación y aplicada on-chain (ajustable mediante gobernanza); tú recibes precio − comisión.
Cómo funciona la liquidación
La inferencia se liquida a través del HaloVault sobre Base: el consumidor deposita USDC y reserva parte de él para tu operador; tu operador lee esa reserva on-chain y solo sirve si cubre la solicitud; tú reportas los tokens reales usados y un recibo acumulativo canjea ese monto para ti. El facilitador presenta estas transacciones y paga el gas.
Privacidad
- El cifrado de extremo a extremo está activado por defecto: el relay solo reenvía texto cifrado, y tu clave por sesión vive solo en memoria, nunca se persiste.
- Modo confidencial (TEE) — expón un proveedor TEE (por ejemplo,
--provider near) para servir modelos confidenciales que el propio operador no puede leer.
Mantenlo siempre activo
halo service install serve
halo service status serve
halo service logs serve
Lo que viene
Inferencia verificable (SPEX) —una Prueba Estadística de Ejecución que da garantías probabilísticas de que un operador ejecutó el modelo solicitado— está en la hoja de ruta, junto con servicios de código abierto y autoalojables. Consulta qué es la inferencia de IA verificable.
Relacionado
- Ejecuta un endpoint de inferencia pago en su lugar: crea un endpoint (CLI).
- Referencia completa de la CLI: warden-protocol/run-halo.