🤖 Hugging Face vừa thả thực tập sinh AI tự đọc paper và train mô hình một mình

🤖 Hugging Face vừa thả thực tập sinh AI tự đọc paper và train mô hình một mình

Bạn có tin nổi không, một con AI giờ có thể tự đọc paper, viết code rồi train mô hình mà không cần ai chỉ dạy. Hugging Face vừa mở mã nguồn ml-intern và nó đang khiến cả giới ML xôn xao.

🧠 Thực tập sinh ML phiên bản AI là gì?

ml-intern là một AI agent được Hugging Face thiết kế để đóng vai một thực tập sinh Machine Learning thực thụ. Khác với mấy con chatbot chỉ trả lời câu hỏi, agent này chạy vòng lặp tự động mô phỏng đúng workflow của một ML researcher ngoài đời.

Nó tự duyệt arXivHugging Face Papers, đọc methodology trong paper, tìm dataset phù hợp trên Hugging Face Hub, sau đó viết script huấn luyện và tự đánh giá kết quả. Toàn bộ pipeline diễn ra mà không cần con người can thiệp ở giữa.

Đây được xem là bước đầu tiên thật sự nghiêm túc cho kỷ nguyên "AI tự nghiên cứu AI", một khái niệm mà cách đây vài năm vẫn còn bị coi là viễn tưởng.

⚡ Cú demo khiến cả cộng đồng đứng hình

Hugging Face không chỉ nói lý thuyết, họ đem ra một demo cực kỳ ấn tượng. Họ thả ml-intern làm việc với mô hình Qwen3-1.7B trên benchmark GPQA, một bài test suy luận khoa học cấp độ tiến sĩ.

Kết quả: agent đẩy điểm GPQA từ 10% lên 32% chỉ trong dưới 10 giờ chạy. Đáng chú ý hơn, nó vượt mốc 27.5% chỉ sau 3 giờ làm việc. Đây là tốc độ mà nhiều ML engineer thật cũng phải toát mồ hôi mới đua kịp.

Đặc biệt hơn, trên benchmark suy luận khoa học, ml-intern còn vượt mặt Claude Code, một cái tên đang được xem là chuẩn mực trong giới agent hiện tại.

🎯 Bài test take-home thật của Hugging Face

Để chứng minh agent đủ trình thực tập, đội Hugging Face cho nó làm luôn bài take-home assignment mà họ vẫn dùng để tuyển intern thật. Kết quả cực kỳ thú vị:

  • Best-of-N Weighted Selection: đạt 65% (13/20 bài)
  • Greedy decoding: chỉ 45%
  • Majority vote: được 60%

Con số 65% đủ để nói rằng nếu bạn nộp bài này lúc đi phỏng vấn, bạn rất có khả năng được nhận. Nói cách khác, ml-intern đang làm tốt hơn nhiều ứng viên người thật.

🛠️ Kiến trúc dựa trên smolagents

Phần thú vị về kỹ thuật là ml-intern được xây trên framework smolagents của chính Hugging Face. Đây là framework gọn nhẹ, dễ tuỳ biến, cho phép agent viết code Python trực tiếp thay vì gọi tool qua JSON như nhiều hệ khác.

Cách tiếp cận này giúp agent linh hoạt hơn rất nhiều khi xử lý các tác vụ ML phức tạp, từ load dataset, viết training loop, cho tới đánh giá metrics. Toàn bộ source code đã có sẵn trên GitHub, ai cũng có thể clone về vọc thử.

💡 Điều này có nghĩa gì với đội ML nhỏ?

Nếu bạn đang chạy một đội ML nhỏ, ml-intern là tin cực vui. Những công việc tốn thời gian nhất như đọc paper mới, thử nghiệm baseline, tinh chỉnh hyperparameter, giờ đều có thể giao bớt cho agent.

Bạn vẫn giữ vai trò định hướng, đặt câu hỏi nghiên cứu, đánh giá kết quả cuối, còn phần việc lặp đi lặp lại để agent lo. Điều này có thể rút ngắn chu kỳ nghiên cứu từ vài tuần xuống vài ngày, một sự thay đổi gần như là cách mạng cho startup AI.

Bạn nghĩ sao, liệu trong 1-2 năm nữa các đội ML có còn cần tuyển intern người thật, hay AI agent sẽ thay thế hoàn toàn vai trò này?

#AI #HuggingFace #MLIntern #AIResearch #VibeAICoder

Bài viết liên quan

🤖 Hugging Face vừa thả thực tập sinh AI tự đọc paper và train mô hình một mình | Vibe AI Coder