

🔒 Anthropic giấu mô hình Mythos mạnh hơn Claude Opus 4.7 vì quá nguy hiểm
Anthropic vừa lặng lẽ thừa nhận một sự thật khiến cả ngành AI đứng hình: họ đang nắm trong tay một mô hình nội bộ tên Mythos, mạnh hơn cả Claude Opus 4.7, nhưng quyết định không public vì rủi ro an toàn quá lớn. Đây là lần đầu tiên một big lab công khai chuyện "giấu hàng" có chủ đích.
🧬 MYTHOS LÀ AI GÌ MÀ ĐÁNG SỢ ĐẾN VẬY
Mythos không phải tin đồn nữa, Anthropic đã chính thức xác nhận sự tồn tại của nó trong tài liệu nội bộ rò rỉ tuần này. Theo nguồn tin, Mythos được đồn vượt 90% SWE-Bench Verified, một con số mà ngay cả Claude Opus 4.7 hay GPT-5 cũng chưa chạm tới.
Nó làm chủ tool use đa modality, tức là có thể vừa đọc ảnh, vừa chạy code, vừa duyệt web, vừa thao tác file system trong cùng một chuỗi reasoning mà không bị đứt mạch. Đáng sợ hơn, Mythos được cho là có khả năng tự sinh exploit zero-day cho các hệ thống yếu, một capability mà Anthropic gọi thẳng là "không thể release ra công chúng".
🎯 MYTHOS PREVIEW VÀ NHÓM RED-TEAM BÍ MẬT
Hiện tại, Mythos Preview chỉ được trao tay một nhóm rất hẹp gồm các công ty cyber security lớn và một vài đối tác tech được Anthropic tin tưởng tuyệt đối. Mục đích duy nhất là red-team, tức là tấn công, dò lỗi, kiểm tra giới hạn của model trước khi nghĩ tới chuyện public.
Không có API. Không có playground. Không có waitlist. Bạn không thể "đăng ký dùng thử" Mythos kể cả khi bạn là enterprise customer của Anthropic. Đây là cách tiếp cận hoàn toàn mới so với GPT-4 hay Gemini Ultra, vốn được phát hành rộng rãi rồi mới patch dần.
🛡️ SAFETY CASE MỚI CỦA ANTHROPIC
Quyết định giữ Mythos không phải ngẫu hứng. Anthropic vừa cập nhật khung "safety case" nội bộ, yêu cầu mọi model trước khi release phải vượt qua ba bài đánh giá khắc nghiệt:
- CBRN risk (chemical, biological, radiological, nuclear): model có thể bị lợi dụng để chế tạo vũ khí hủy diệt không?
- Persuasion: model có khả năng thao túng tâm lý người dùng ở mức nguy hiểm không?
- Autonomy: model có thể tự lập kế hoạch dài hạn, tự thực thi, tự né giám sát không?
Mythos được cho là fail ở cả ba mục trong bản review nội bộ tháng 3, đó là lý do nó bị "đóng băng" vô thời hạn.
⚔️ CỘNG ĐỒNG CHIA PHE GAY GẮT
Ngay khi tin lộ, X và Reddit nổ tung. Một bên ủng hộ Anthropic hết mình, cho rằng đây là quyết định đạo đức đúng đắn và là tiêu chuẩn vàng mới cho ngành. Họ lập luận: nếu Mythos thật sự sinh được zero-day, việc public nó chẳng khác nào phát súng cho hacker toàn cầu.
Phe ngược lại lo sợ Anthropic đang tự bắn vào chân mình. Trong khi xAI tung Grok 4 mạnh tay, OpenAI đẩy GPT-5.5 ra thị trường, Anthropic lại "ngồi trên kho báu" mà không khai thác.
🔮 ĐIỀU NÀY NÓI GÌ VỀ TƯƠNG LAI AI
Sự kiện Mythos đánh dấu một bước ngoặt: lần đầu tiên, capability của AI vượt quá tốc độ alignment. Các lab buộc phải chọn giữa tốc độ và an toàn, và Anthropic đã chọn an toàn một cách công khai.
Câu hỏi lớn hơn: nếu Mythos đã đạt mức này vào năm 2026, thì Mythos 2 hay Claude Opus 5 sẽ ở đâu?
Bạn nghĩ Anthropic làm đúng khi giữ Mythos, hay đang quá thận trọng đến mức tự đánh mất lợi thế cạnh tranh?


