Запустите оператора (CLI)
Используйте CLI halo, чтобы обслуживать инференс от провайдера, размещённой модели или локального GPU и зарабатывать USDC на Base — слаги провайдеров, ценообразование, расчёты и постоянная работа.
Роль operate обслуживает инференс для сети и зарабатывает USDC за каждый
запрос. В этом руководстве используется CLI halo напрямую. Хотите, чтобы агент
настроил всё в диалоге? См.
работа оператором с вашим агентом.
Halo находится в альфа-версии в основной сети Base с реальными USDC. Требуется Node.js 20+.
Установите и проверьте
bash <(curl -fsSL https://raw.githubusercontent.com/warden-protocol/run-halo/main/skill/scripts/install.sh)
halo doctor --json # node version, install + wallet state, provider, relay health
Задайте провайдера, цену и запустите обслуживание
halo setup --provider <slug> [--api-key <key>] --margin 20 --with-pairing
halo serve
halo serve подключается исходящим соединением к релею по WebSocket — без
публичного URL или открытого входящего порта — анонсирует ваши модели и
обслуживает запросы, пока не будет остановлен. Кошелёк оператора не требует
предварительного пополнения; USDC поступает при расчёте, а газ спонсирует
Halo.
<slug> — один из openclaw, claude-code, hermes, ollama, lmstudio,
openrouter, openai, anthropic, venice, near, together, fireworks,
groq или custom. Добавьте больше вышестоящих провайдеров к одному оператору
командой halo setup --add-provider.
Ценообразование
- Маржа (
--margin <n>) — рекомендуется. Взимайте n% сверх опубликованной вышестоящим провайдером ставки за токен, определяемой по модели при расчёте (там, где провайдер публикует цены, например OpenRouter и NEAR). Отслеживает реальную стоимость по каждой модели. - Фиксированная цена (
--flat <usd-per-1k>). Фиксированная сумма в USD за 1000 токенов — для локальных моделей (Ollama, LM Studio) или вышестоящих провайдеров, не публикующих цены.
Комиссия протокола начинается от 10% от вашей цены, удерживается при расчёте и обеспечивается на уровне блокчейна (регулируется через управление) — вы получаете цена − комиссия.
Как работает расчёт
Инференс рассчитывается через HaloVault на Base: потребитель вносит депозит в USDC и резервирует часть под вашего оператора; ваш оператор считывает этот ончейн-резерв и обслуживает запрос только если резерва достаточно; вы сообщаете фактически израсходованные токены, и накопительная квитанция переводит эту сумму вам. Фасилитатор отправляет эти транзакции и оплачивает газ.
Приватность
- Сквозное шифрование включено по умолчанию — релей пересылает только зашифрованный текст, а ваш ключ сессии хранится только в памяти и никогда не сохраняется на диск.
- Конфиденциальный режим (TEE) — используйте TEE-провайдера
(например,
--provider near), чтобы обслуживать конфиденциальные модели, которые не может прочитать даже сам оператор.
Держите это включённым постоянно
halo service install serve
halo service status serve
halo service logs serve
Что впереди
Верифицируемый инференс (SPEX) — статистическое доказательство исполнения (Statistical Proof of Execution), дающее вероятностные гарантии того, что оператор действительно запустил запрошенную модель, — есть в дорожной карте, наряду с открытыми сервисами для самостоятельного хостинга. См. что такое верифицируемый AI-инференс.
Связанные материалы
- Запустить платную точку доступа к инференсу вместо этого: создайте точку доступа (CLI).
- Полное описание CLI: warden-protocol/run-halo.