DeepSeek Reasonix: Coding agent 'thuần DeepSeek' đạt 94% cache hit — có thực sự cần thiết?

DeepSeek ra mắt Reasonix, coding agent mã nguồn mở được thiết kế riêng cho API DeepSeek với vòng lặp append-only giúp đạt 90%+ cache hit. Nhưng liệu một agent 'native' có thực sự cần thiết? Phân tích từ cuộc tranh luận 460 điểm trên Hacker News.

deepseekcoding-agentai-toolsopen-source

Ngày 24/5, DeepSeek chính thức công bố Reasonix — một coding agent mã nguồn mở (MIT license) được xây dựng “thuần” cho API DeepSeek. Trong vòng chưa đầy 24 giờ, bài đăng trên Hacker News đã thu về 460 điểm và 200 bình luận, cho thấy cộng đồng dev cực kỳ quan tâm.

Nhưng câu hỏi lớn nhất trong cuộc tranh luận là: Có thực sự cần một agent “native” cho DeepSeek không, hay chỉ cần dùng công cụ có sẵn như OpenCode/Codex với API DeepSeek là đủ?

Điểm khác biệt cốt lõi: Vòng lặp append-only

Khác với hầu hết coding agent hiện tại, Reasonix không cố gắng “agnostic” với nhiều provider. Nó chỉ nói chuyện với api.deepseek.com và toàn bộ kiến trúc được thiết kế xoay quanh cơ chế prefix cache của DeepSeek.

Cụ thể:

  • DeepSeek dùng byte-level prefix cache — cache chỉ hoạt động khi byte prefix của request mới khớp chính xác với request trước đó
  • Hầu hết agent loop hiện tại sắp xếp lại, ghi đè, hoặc chèn timestamp mới vào mỗi lượt → cache hit rate thực tế: <20%
  • Reasonix dùng append-only loop: tin nhắn và kết quả tool call được nối vào cuối, không bao giờ bị sửa đổi → cache hit rate: 90-94% trong các session dài

Kết quả: chi phí input token giảm xuống còn ~1/5 so với thông thường, vì phần lớn token được tính ở mức cache hit (Flash: $0.0028/M, Pro: $0.0145/M thay vì $0.14/M và $1.74/M).

Có gì trong Reasonix?

Reasonix v0.50.0 cung cấp một bộ công cụ khá đầy đủ:

Terminal-first TUI — viết bằng TypeScript + Ink, chạy qua npx reasonix code, Node ≥ 22

Hai tầng model — mặc định dùng V4 Flash (nhanh, rẻ), gõ /pro để chuyển sang V4 Pro cho task phức tạp

MCP first-class — hỗ trợ STDIO, SSE, Streamable HTTP cho MCP servers

Sandbox + plan gate — bắt buộc phê duyệt kế hoạch trước khi thực thi, giới hạn tool trong thư mục dự án

Composable skills — thả file Markdown vào .reasonix/skills/, hỗ trợ runAs: subagentallowed-tools

Replay & events — tua lại session cũ, xem thống kê token/cache/chi phí

Chỉ chạy với DeepSeek — nếu bạn dùng Claude, GPT-4o, hoặc Gemini, Reasonix vô dụng

Mới ở v0.50.0 — còn non, chưa có ecosystem plugin như OpenCode hay Codex

Cuộc tranh luận: Native agent hay chỉ là marketing?

Trên HN, ý kiến chia làm hai phe rõ rệt.

Phe hoài nghi (tiêu biểu: user “embedding-shape”):

“Tôi viết một cái bridge nhỏ để dùng DeepSeek V4 Pro qua Codex, chẳng làm gì đặc biệt về cache cả. Kết quả: 39 triệu token cache hit vs 1.6 triệu cache miss. Cache hit gần như tự động.”

Lập luận: Bạn không cần agent “native” — cứ dùng OpenCode/Codex/Cline với API DeepSeek, cache vẫn hoạt động tốt, lại được hưởng ecosystem tooling trưởng thành hơn.

Phe ủng hộ (user “kiproping”):

“Hầu hết agent loop có cache hit <20% vì chúng sắp xếp lại message mỗi lượt. Reasonix tối ưu chính xác điểm này.”

Lập luận: Cache tự động chỉ hoạt động khi byte-prefix khớp chính xác. Các agent general-purpose liên tục thay đổi thứ tự message, chèn timestamp, rewrite system prompt → cache bị phá. Append-only loop là giải pháp kỹ thuật thực sự, không phải marketing.

Vậy ai nên dùng Reasonix?

Nên thử nếu:

  • Bạn đã dùng DeepSeek API và muốn tối ưu chi phí triệt để
  • Bạn làm việc với session dài (vài giờ), nơi 90%+ cache hit thực sự tạo khác biệt
  • Bạn thích triết lý “làm một việc thật tốt” hơn là công cụ đa năng

Chưa nên nếu:

  • Bạn cần dùng nhiều model khác nhau (Claude cho code review, GPT-4o cho viết docs…)
  • Bạn đã quen với OpenCode/Codex và chi phí DeepSeek vốn đã rất rẻ
  • Bạn cần plugin ecosystem phong phú (Reasonix mới có MCP + Markdown skills, chưa có marketplace)

Điểm mấu chốt

Reasonix không cố gắng thay thế OpenCode hay Codex. Nó đánh vào một ngách cụ thể: developer dùng DeepSeek API với session dài, nơi tối ưu cache là ưu tiên số một. Với 6.8k star GitHub và 1,300+ commit chỉ trong thời gian ngắn, dự án này có vẻ không phải “one-weekend project”.

Câu hỏi thực sự không phải là “có nên dùng Reasonix không”, mà là: cách tiếp cận “native agent” — thiết kế agent xoay quanh đặc tính kỹ thuật của một model cụ thể — có phải là xu hướng tiếp theo của AI coding tools? Nếu OpenAI, Anthropic, Google cũng bắt đầu làm agent “native” cho model của họ, cuộc chơi sẽ rất khác.


Nguồn: