🤖 Google DeepMind ra mắt Gemini Robotics-ER 1.6, robot tự đọc đồng hồ nhà máy

🤖 Google DeepMind ra mắt Gemini Robotics-ER 1.6, robot tự đọc đồng hồ nhà máy

Robot giờ đây có thể tự đi tuần nhà máy, đọc đồng hồ công nghiệp và báo cáo bất thường, công việc trước đây chỉ con người mới làm được.

Ngày 14/04/2026, Google DeepMind chính thức công bố một bước nhảy vọt lớn cho ngành robot.

🧠 Gemini Robotics-ER 1.6 là gì?

Đây là bản nâng cấp chuyên dụng cho mô hình embodied reasoning, thiết kế riêng cho robot. Khác với các phiên bản Gemini phổ thông mà bạn dùng để chat hay viết code, ER 1.6 tập trung vào hiểu không gian vật lýlên kế hoạch hành động trong môi trường thực.

Nói đơn giản, đây là bộ não giúp robot không chỉ "nhìn" mà còn "hiểu" thế giới xung quanh, từ đó tự ra quyết định di chuyển và thao tác như một nhân viên thực thụ.

📊 Đột phá: đọc đồng hồ công nghiệp chính xác 93%

Đây là cải tiến gây sốc nhất của bản 1.6, được phát triển qua hợp tác trực tiếp với Boston Dynamics.

Ở phiên bản trước, độ chính xác đọc đồng hồ chỉ đạt 23%, gần như không dùng được trong thực tế. Với ER 1.6 và tính năng agentic vision, con số này nhảy vọt lên 93%.

Ý nghĩa cực lớn: robot giờ có thể tuần tra nhà máy hóa chất, kiểm tra thiết bị áp suất, đọc mặt kính chỉ thị trong môi trường khắc nghiệt mà trước đây bắt buộc phải có kỹ sư đứng giám sát.

👁️ Suy luận không gian vượt trội

Mô hình mới mạnh hơn rõ rệt so với Gemini Robotics-ER 1.5 và cả Gemini 3.0 Flash ở hàng loạt tác vụ quan trọng:

  • Pointing: chỉ chính xác vị trí vật thể trong không gian 3D
  • Đếm vật thể: nhận diện và đếm chuẩn xác trong cảnh phức tạp
  • Phát hiện hoàn thành nhiệm vụ: tự biết khi nào việc đã xong để chuyển bước

Những kỹ năng tưởng đơn giản này lại là nền tảng để robot thực sự tự chủ thay vì chạy theo kịch bản cứng.

🎥 Multi-view understanding: nhìn từ nhiều góc

Một robot hiện đại thường có nhiều camera: camera trên cao bao quát, camera gắn cổ tay nhìn cận cảnh. Trước đây mỗi góc nhìn xử lý riêng, dẫn đến hiểu biết rời rạc.

ER 1.6 kết hợp tất cả góc camera để xây dựng bức tranh tổng thể về môi trường. Kể cả khi vật thể bị che khuất một phần hay tầm nhìn kém do khói bụi, robot vẫn suy luận được vị trí và trạng thái nhờ ghép thông tin từ các camera khác.

🚀 Đã có sẵn cho developer

Tin vui cho cộng đồng làm robot và AI: mô hình này đã mở cho developer qua Gemini APIGoogle AI Studio.

Thực tế đã chứng minh sức mạnh: robot Boston Dynamics Spot tích hợp Gemini Robotics-ER 1.6 hiện tự động đi tuần các nhà máy hóa chất, đọc thông số và báo cáo bất thường hoàn toàn không cần người.

Đây là tín hiệu rõ ràng rằng kỷ nguyên robot tuần tra công nghiệp tự động đã bắt đầu, không còn là khái niệm tương lai xa.

Bạn nghĩ trong 2-3 năm tới, công việc nào sẽ là công việc tiếp theo được robot AI thay thế hoàn toàn?

#VibeAICoder #GeminiRobotics #GoogleDeepMind #BostonDynamics #AIRobot

Bài viết liên quan

🤖 Google DeepMind ra mắt Gemini Robotics-ER 1.6, robot tự đọc đồng hồ nhà máy | Vibe AI Coder