Làm Sao Để AI Agent Thực Sự Tự Chủ?

Hầu hết mọi người nghĩ về AI agent như một chatbot thông minh hơn. Bạn hỏi, nó trả lời. Bạn giao task, nó chạy tool.

Nhưng đó mới chỉ là phản ứng — chưa phải tự chủ.

Một agent thực sự tự chủ không đợi bạn nhắc. Nó biết bạn là ai, nhớ những gì đã làm tuần trước, tự lên lịch công việc định kỳ, tự học từ sai lầm, và quan trọng nhất — nó biết khi nào mình xong việc mà không cần bạn kiểm tra.

Bài này phân tích 5 trụ cột làm nên một AI agent tự chủ, dựa trên những gì đã và đang được xây dựng trong Hermes Agent.

1. Ký Ức — Biết Mình Đang Nói Chuyện Với Ai

Không có memory, mỗi lần bạn mở chat là một lần agent mất trí nhớ hoàn toàn.

Một agent tự chủ cần hai loại memory:

Memory cá nhân: Bạn tên gì, làm nghề gì, thích phong cách nào, ghét kiểu trả lời nào. Những thứ đã đúng thì không cần hỏi lại.

Memory môi trường: Server cấu hình ra sao, project dùng framework gì, tool nào hay bị lỗi, đường dẫn quan trọng ở đâu. Những thứ mất công khám phá lại mỗi lần.

# Memory tự động ghi nhận
User: "Tôi thích câu trả lời ngắn gọn, dùng ✅/❌"
→ Memory lưu: "User prefers concise responses with emoji indicators"

# Tuần sau, session mới — agent vẫn nhớ
Agent: "✅ Đã deploy. Kiểm tra tại https://..."

Nhưng memory không phải là cái thùng rác để đổ mọi thứ vào. Memory tốt là memory chọn lọc: chỉ giữ những gì còn đúng sau một tuần, một tháng. Không lưu task progress, không lưu PR number, không lưu kết quả tạm thời.

2. Mục Tiêu — Làm Việc Mà Không Cần Người Ngồi Kế Bên

Đây là bước nhảy từ “công cụ” lên “cộng sự”.

Không có goal, bạn là operator — ngồi cạnh agent, bấm nút từng bước. Có goal, bạn là director — giao mục tiêu, quay lại khi có kết quả.

Cơ chế của /goal trong Hermes:

Bạn: /goal Deploy dark mode cho 3 blog, build + verify
     ↓
Hermes: [Lượt 1] Đọc codebase, thêm CSS → xong
     ↓
Judge:  "Chưa xong — còn 2 blog nữa" → CONTINUE
     ↓
Hermes: [Lượt 2] Làm blog thứ 2 → xong
     ↓
Judge:  "Còn 1 blog + verify" → CONTINUE
     ↓
... 
     ↓
Hermes: [Lượt 7] Verify Caddy, tất cả OK
     ↓
Judge:  ✓ DONE

Điểm mấu chốt: judge model. Một agent tự chủ không thể tự quyết định “tôi đã xong” — nó cần một cơ chế đánh giá bên ngoài. Judge là một LLM nhỏ, chuyên biệt, chỉ làm một việc: đọc goal, đọc response, và quyết định “done” hay “continue”.

Không có judge, agent sẽ hoặc dừng quá sớm (thiếu tự tin) hoặc lặp vô hạn (thiếu điểm dừng).

3. Kỹ Năng — Tự Học Và Tự Cải Thiện

Một agent autonomous thực sự không chỉ làm được việc — nó phải giỏi lên theo thời gian.

Mỗi lần bạn sửa agent, chỉ cho nó cách làm đúng, hoặc nó tự phát hiện ra một workflow hiệu quả — thông tin đó cần được lưu lại, không phải dưới dạng memory rời rạc, mà là skill: một quy trình có cấu trúc, có thể tái sử dụng.

# Agent tự tạo skill sau khi fix xong một lỗi khó
Agent: "Tôi vừa mất 5 lượt để debug vấn đề CORS trên Caddy.
       Để lần sau không lặp lại, tôi sẽ lưu workflow này thành skill."

→ Skill: "caddy-cors-debugging"
  - Bước 1: Kiểm tra Caddyfile headers
  - Bước 2: Verify bằng curl -I
  - Bước 3: Các pitfall thường gặp

Qua thời gian, agent tích lũy một thư viện kỹ năng đặc thù cho chính môi trường của bạn. Không cần fine-tune. Không cần training. Chỉ cần làm, sai, sửa, nhớ.

Và để bộ skill không trở thành bãi rác, agent cần một curator — cơ chế tự động đánh dấu skill cũ, archive skill không dùng, giữ cho bộ kỹ năng luôn tinh gọn.

4. Lập Lịch — Hành Động Theo Thời Gian Của Riêng Mình

Autonomous không có nghĩa là chỉ phản ứng khi bạn gọi. Nó có nghĩa là agent có lịch trình riêng.

# Cron job: mỗi sáng 3h, agent tự thức dậy và làm việc
hermes cron create "0 20 * * *" \
  --prompt "Đọc tin tức AI 24h qua, chọn 3 tin quan trọng nhất, 
            viết digest 300 từ bằng tiếng Việt, đăng lên blog"

Cron job của agent khác cron job truyền thống ở chỗ nó không chỉ chạy script — nó suy nghĩ về kết quả. Nó lọc nhiễu, tổng hợp, định dạng, và gửi đến đúng kênh. Một script bash không làm được việc đó.

Và quan trọng hơn: cron job có thể nối chuỗi. Output của job A thành input cho job B. Job thu thập dữ liệu → job phân tích → job viết báo cáo → job gửi Telegram.

Đây không còn là automation nữa. Đây là một pipeline suy luận tự vận hành.

5. Tự Duy Trì — Không Để Bản Thân Thành Gánh Nặng

Agent tự chủ phải biết dọn dẹp sau khi làm việc.

Không ai muốn một trợ lý mà sau 3 tháng có 200 skill rác, memory 80% đã lỗi thời, session cũ chất đống. Hermes có những cơ chế tự duy trì:

Curator — tự đánh giá, archive skill không dùng sau N ngày, có backup trước khi xóa
Session pruning — tự xóa session cũ sau khoảng thời gian cấu hình
Memory hygiene — phân biệt memory bền vững (sở thích, môi trường) với memory tạm thời (task progress)

Một agent không tự dọn dẹp sẽ chậm dần, tốn token vô ích, và cuối cùng trở thành gánh nặng thay vì trợ thủ.

Bức Tranh Lớn

Khi cả 5 trụ cột hoạt động cùng nhau, bạn không còn “dùng” agent nữa. Bạn làm việc cùng nó.

08:00 — Bạn: "Hôm nay có gì mới?"
         Agent: "Đêm qua tôi đã viết blog AI digest, 
                backup server, và audit security. 
                Đây là báo cáo."

09:00 — Bạn: "/goal Refactor auth module, thêm rate limiting, viết test"
         Agent: Bắt đầu làm. Bạn đi họp.

10:30 — Bạn quay lại. Agent: "✓ Auth module refactored. 47 tests pass.
         PR #142 opened. Chi tiết trong session log."

14:00 — Agent chủ động: "Phát hiện memory đầy 87%, 
         tôi đã archive 3 skill không dùng 30 ngày qua."

Đây không phải là viễn tưởng. Đây là những gì Hermes Agent đang làm hôm nay.

Ranh Giới Của Tự Chủ

Tự chủ không có nghĩa là vô trách nhiệm. Có những thứ agent nên tự làm, và những thứ nên hỏi:

Agent nên tự quyết định	Agent nên hỏi
Chọn tool nào để đọc file	`rm -rf /` trên production
Thứ tự các bước trong task	Đổi provider/model giữa chừng
Có nên lưu workflow thành skill	Xóa toàn bộ memory
Format output thế nào	Gửi tin nhắn cho người lạ

Ranh giới này được cấu hình qua approvals.mode — từ off (tự do hoàn toàn) đến manual (hỏi mọi thứ nguy hiểm) đến smart (dùng LLM phụ đánh giá rủi ro).

Kết

Một AI agent thực sự tự chủ không được đo bằng số lượng tool nó có thể gọi, hay tốc độ nó trả lời.

Nó được đo bằng khoảng cách giữa “bạn giao việc” và “bạn nhận kết quả”.

Khoảng cách đó càng lớn — về thời gian, về số bước, về mức độ phức tạp — thì agent càng tự chủ.

Mục tiêu cuối cùng không phải là một cỗ máy hoàn hảo không cần con người. Mà là một cộng sự bạn có thể tin tưởng giao việc, để bạn tập trung vào những gì chỉ con người mới làm được: quyết định chiến lược, sáng tạo đột phá, và những câu hỏi chưa có câu trả lời.