

🧠 Context Engineering: Kỹ Năng Quan Trọng Nhất Khi Build AI Agent Mà Ít Ai Nói
Prompt engineering ai cũng biết. Nhưng context engineering mới là thứ quyết định AI agent của bạn hoạt động tốt hay tệ. Anthropic vừa chia sẻ toàn bộ kinh nghiệm của họ về chủ đề này.
📖 Context Engineering Là Gì
Prompt engineering là viết instruction tốt. Context engineering rộng hơn nhiều: nó là chiến lược quản lý toàn bộ thông tin mà LLM nhận được khi inference. Bao gồm system instructions, tools, MCP, external data, message history, và mọi thứ khác trong context window.
Mục tiêu: tìm tập token nhỏ nhất nhưng chứa nhiều tín hiệu nhất để tối đa hóa kết quả mong muốn.
⚡ Context Rot: Vấn Đề Mà Ai Dùng AI Cũng Gặp
Khi context window dài ra, hiệu suất model giảm. Anthropic gọi hiện tượng này là "context rot". Lý do nằm ở kiến trúc transformer: mỗi token phải attend đến mọi token khác, tạo ra n bình phương relationships. Context window giống như working memory của con người, nó có giới hạn.
Bạn nhét 100K tokens vào context không có nghĩa model sẽ nhớ hết. Nó sẽ bỏ sót, nhầm lẫn, và "quên" thông tin quan trọng.
🔑 3 Nguyên Tắc Thiết Kế Context
Nguyên tắc 1: Tìm đúng "độ cao". System prompt cần đủ cụ thể để hướng dẫn hành vi nhưng đủ linh hoạt để model tự xử lý edge cases. Dùng XML tags hoặc Markdown headers để tổ chức nội dung.
Nguyên tắc 2: Tools phải self-contained, robust to error, và cực kỳ rõ ràng về mục đích. Tránh tool set phình to với chức năng chồng chéo.
Nguyên tắc 3: Dùng examples đa dạng và canonical thay vì liệt kê mọi edge case. Vài ví dụ đúng trọng tâm hiệu quả hơn cả trang documentation.
🏗️ 3 Kỹ Thuật Cho Task Dài
Khi task vượt quá context window, có 3 cách xử lý:
Compaction: Tóm tắt lịch sử hội thoại và restart với context nén gọn. Quan trọng: phải giữ lại architectural decisions, unresolved bugs, và implementation details. Chỉ bỏ output thừa.
Structured Note-Taking: Agent ghi notes ra bên ngoài context window, đọc lại khi cần. Ví dụ kinh điển: Claude chơi Pokemon và duy trì chính xác các con số thống kê qua hàng nghìn game steps bằng cách ghi chép có hệ thống.
Sub-Agent Architectures: Agent chuyên biệt xử lý task nhỏ, trả về summary 1,000-2,000 tokens cho agent coordinator. Tách biệt trách nhiệm rõ ràng.
💡 Just-In-Time Retrieval
Thay vì nhét hết data vào context từ đầu, hãy giữ lightweight references (file paths, URLs) và load data khi cần. Giống như con người: chúng ta không nhớ hết mọi thứ mà biết cách tìm lại.
Claude Code là ví dụ điển hình: CLAUDE.md load sẵn từ đầu cho context cố định, còn grep và glob dùng để khám phá dynamic khi cần. Hybrid model này hiệu quả hơn nhiều so với load-all-upfront.
Khi model ngày càng mạnh, agent cần ít prescriptive engineering hơn. Nhưng context vẫn luôn là tài nguyên hữu hạn quý giá. Hiểu cách quản lý nó là kỹ năng nền tảng cho bất kỳ ai build AI agent.
#AI #ContextEngineering #Anthropic #AIAgent #LLM #VibeAICoder #learnontiktok


