Chat mode và Agent mode (và mức đầu tư effort)
Halo có hai chế độ — Chat thuần túy và vòng lặp Agent đầy đủ — cộng thêm các mức đầu tư effort (Auto, Quick, Standard, Deep) và run mode. Tìm hiểu khi nào nên dùng chế độ nào.
Không gian làm việc của Halo có hai diện mạo, chuyển đổi bằng công tắc Chat / Agent trong ô soạn thảo. Bên dưới công tắc đó, Agent mode có thêm hai tùy chỉnh nữa — effort (mức đầu tư) và run mode (chế độ chạy) — quyết định agent làm việc “chăm” đến mức nào và bao lâu thì nó hỏi lại bạn một lần.
Halo hiện đang ở giai đoạn alpha trên Base mainnet, sử dụng USDC thật.
Chat vs Agent
- Chat — trò chuyện trực tiếp với model, không dùng tool: mỗi tin nhắn tương ứng với một lượt suy luận trả phí. Phù hợp cho các câu hỏi nhanh và các đoạn hội thoại qua lại khi bạn chỉ cần câu trả lời trực tiếp từ model.
- Agent — vòng lặp đầy đủ: nó lập kế hoạch, dùng tool, tham khảo bộ nhớ, và có thể thực hiện nhiều lượt gọi trả phí để hoàn thành một request. Phù hợp cho các tác vụ nghiên cứu, công việc nhiều bước, và bất cứ điều gì cần đến web hay các công cụ dữ liệu.
Chế độ bạn chọn sẽ được ghi nhớ giữa các lần truy cập.
Effort: Auto, Quick, Standard, Deep
Trong Agent mode, chip effort quyết định một request sẽ được đầu tư bao nhiêu công sức:
- Quick — câu trả lời nhanh cho một sự kiện, mức giá, hay định nghĩa: một prompt gọn, tối đa một lượt gọi tool, không có kế hoạch. Độ trễ và chi phí thấp nhất.
- Standard — một phiên làm việc bình thường: vài lượt gọi tool, không có kế hoạch đa tác vụ.
- Deep — một kế hoạch đa tác vụ có tổng hợp và tự kiểm chứng: dùng tool và gọi trả phí nhiều nhất, dành cho báo cáo và nghiên cứu chuyên sâu.
- Auto — phân loại miễn phí từng request (không tốn suy luận) rồi tự động định tuyến sang Quick, Standard, hoặc Deep giúp bạn.
Nếu một request được xử lý nhẹ hơn bạn muốn, bạn có thể đẩy nó đi xa hơn thay vì phải hỏi lại từ đầu.
Run mode: Auto-run vs Ask first
Chip run mode kiểm soát mức độ tự chủ của agent:
- Auto-run — lập kế hoạch, thực thi, tự kiểm chứng câu trả lời của chính nó, và theo đuổi hướng đi tiếp theo tốt nhất; nó chỉ dừng lại để hỏi khi thực sự bị bế tắc.
- Ask first — đề xuất kế hoạch để bạn duyệt trước khi tốn phí, và đưa ra các bước tiếp theo dưới dạng các lựa chọn.
(Đây là những cài đặt tách biệt với quyền của từng tool — mỗi tool vẫn có thể được đặt riêng thành Auto / Ask / Off trong Tools & permissions.)
Nên dùng cái nào?
- Câu hỏi nhanh → Chat, hoặc Agent + Quick.
- Tác vụ cần đến web hoặc dữ liệu → Agent + Standard.
- Báo cáo hay nghiên cứu chuyên sâu → Agent + Deep.
- Muốn theo dõi từng khoản chi → Ask first; muốn nó cứ thế chạy → Auto-run.
Liên quan
- Những gì agent nhớ được giữa các cuộc trò chuyện: bộ nhớ & ngữ cảnh.
- Các tool mà agent có thể trả phí để dùng: bật tool với x402.