🤯 16 Con Claude Chạy Song Song Viết Compiler C Từ Đầu: 100K Dòng Code, Build Được Linux Kernel

🤯 16 Con Claude Chạy Song Song Viết Compiler C Từ Đầu: 100K Dòng Code, Build Được Linux Kernel

Một người ở Anthropic thả 16 con Claude Opus 4.6 chạy song song trong 2 tuần. Kết quả? Một compiler C viết bằng Rust từ số 0, đủ mạnh để build Linux kernel 6.9. Không phải demo, không phải toy project.

🏗️ Quy Mô Dự Án

Nicholas Carlini từ team Safeguards của Anthropic đã chạy hơn 2,000 sessions Claude Code liên tục trong gần 2 tuần. Chi phí: khoảng 20,000 USD tiền API. Token tiêu thụ: 2 tỷ input tokens140 triệu output tokens.

Kết quả là một compiler C viết hoàn toàn bằng Rust, 100,000 dòng code, chỉ dùng Rust standard library. Không dependency bên ngoài.

🎮 Compiler Này Làm Được Gì

Compiler đạt 99% pass rate trên bộ test GCC torture. Nó build được Linux kernel 6.9 trên cả 3 kiến trúc x86, ARMRISC-V. Ngoài Linux kernel, nó còn compile được QEMU, FFmpeg, SQLite, PostgreSQL, Redis. Và đặc biệt: build được Doom chạy ngon.

Đây không phải compiler đồ chơi. Nó xử lý được những codebase phức tạp nhất trong thế giới open source.

⚙️ Cách 16 Agent Phối Hợp

Hệ thống dùng một bash loop liên tục spawn Claude Code sessions mới. Khi hoàn thành task, agent tự chọn task tiếp theo mà không cần người can thiệp.

Đồng bộ qua git với file-based locking. Mỗi agent claim task bằng cách ghi lock file (ví dụ current_tasks/parse_if_statement.txt). Git conflict resolution tự động đẩy agent trùng task sang bài khác. Agent pull, merge, push, rồi release lock.

Các agent chia vai rõ ràng: compiler optimization, code quality, documentation, debugging. Nhờ vậy không có agent nào làm trùng việc.

🧠 Bài Học Từ Dự Án

Bài học lớn nhất: task verifier phải gần như hoàn hảo. Claude sẽ tự giải bất kỳ bài nào bạn đưa. Nếu verifier sai, Claude sẽ giải sai bài.

Context window cần được tối ưu. Test tránh in hàng nghìn bytes vô dụng. Error messages đều có tag "ERROR" để grep dễ. Pre-computed statistics để Claude không phải tính lại.

Claude không biết thời gian đã trôi bao lâu. Harness phải có --fast option chạy 1-10% random test samples để agent không ngồi chờ test chạy quá lâu.

Khi gặp task monolithic như build Linux kernel, tất cả agent bị stuck cùng chỗ. Giải pháp: dùng GCC làm reference oracle, random compile một số file bằng GCC trong khi test phần còn lại bằng compiler mới. Nhờ đó phân tán workload.

⚠️ Giới Hạn

Compiler chưa hỗ trợ 16-bit x86, chưa có assembler và linker riêng (vẫn dùng GCC tools), code generation chưa tối ưu bằng GCC, và chất lượng Rust code chưa production-grade. Nhiều lần thử fix những giới hạn này đều gây regression, cho thấy Opus 4.6 đã chạm ngưỡng capability cho task này.

Dự án này cho thấy AI đang chuyển từ "trợ lý code" sang "tự viết cả project". 20,000 USD và 2 tuần để có compiler build được Linux kernel. Câu hỏi không còn là "AI code được không" mà là "AI code được đến đâu".

#AI #ClaudeCode #Compiler #Anthropic #ParallelAgents #VibeAICoder #learnontiktok

Bài viết liên quan