

🔧 Harness Engineering: Vibe Coding Đã Chết, Kỷ Nguyên Mới Bắt Đầu
Bạn vẫn đang "vibe coding" rồi cầu nguyện code chạy đúng? Năm 2026 rồi, cách đó không còn đủ nữa.
🔧 Harness Engineering là gì?
Hãy tưởng tượng bạn có một con ngựa cực mạnh nhưng hoang dã. Bạn không cần con ngựa khác, bạn cần bộ dây cương tốt. Đó chính là Harness Engineering. Nó là kỷ luật thiết kế hệ thống ràng buộc, vòng phản hồi và cơ chế kiểm soát bao quanh AI agent, giúp chúng hoạt động đáng tin cậy trong môi trường production thực tế. Harness không phải là con agent, mà là mọi thứ xung quanh nó: tools, memory, retries, quyền duyệt của con người, context engineering và sub-agents.
🚀 Con số không thể tin nổi từ OpenAI
OpenAI đã làm một thí nghiệm điên rồ. Đội 3 kỹ sư bắt đầu với repo trống, sau 5 tháng tạo ra hơn 1 triệu dòng code production. Không một dòng nào viết tay. Tốn chỉ 10% thời gian so với cách truyền thống. Bí quyết? Họ không viết code, họ xây harness. Công việc chính là chia nhỏ mục tiêu lớn thành các building block, prompt agent xây từng block, rồi dùng chúng để mở khóa task phức tạp hơn.
💡 Cùng model, kết quả khác hoàn toàn
LangChain chứng minh điều này rõ nhất. Agent coding của họ nhảy từ 52.8% lên 66.5% trên Terminal Bench 2.0, từ Top 30 lên Top 5. Họ không đổi model. Không đổi prompt. Chỉ thay đổi harness xung quanh. Cùng một AI, nhưng môi trường vận hành khác thì kết quả khác một trời một vực.
🎯 4 nguyên tắc cốt lõi
Thứ nhất, context là tài nguyên khan hiếm. File hướng dẫn khổng lồ sẽ chen lấn task và code thực sự. Khi mọi thứ đều "quan trọng" thì không gì quan trọng cả. Thứ hai, AGENTS.md là mục lục, không phải bách khoa toàn thư. Knowledge base nằm trong thư mục docs/ có cấu trúc rõ ràng. Thứ ba, repository phải dễ đọc cho agent vì những gì agent không truy cập được trong context thì coi như không tồn tại. Thứ tư, custom linter với thông báo lỗi tự dạy agent cách sửa. Khi agent vi phạm boundary, error message giải thích boundary là gì, tại sao nó tồn tại và cách fix.
🛠️ Công cụ nào đang dẫn đầu?
Claude Code với Agent SDK đang là lựa chọn hàng đầu, có sẵn permission model, hooks system và hỗ trợ multi-session agents. CrewAI chuyên về orchestration nhiều agent với Flows feature. Cursor tích hợp harness trực tiếp vào IDE với rules files và loop detection. Mỗi tool một thế mạnh, nhưng điểm chung là đều xây xung quanh triết lý harness.
🔮 Vai trò kỹ sư đã thay đổi
Năm 2025 chứng minh AI viết code được. Năm 2026 cho thấy phần khó không phải model mà là harness. Kỹ sư không còn ngồi viết code nữa. Họ thiết kế hệ thống, xác định ý định, xây vòng phản hồi. Khi agent cho output kém, câu trả lời không phải "cố hơn đi" mà là "môi trường đang thiếu gì?" Đây mới là moat thực sự của 2026.
#AI #HarnessEngineering #VibeCoding #ClaudeCode #VibeAICoder #learnontiktok


