Việc phát triển các dự án robot phức tạp tại nhà giờ đây đã trở nên dễ dàng hơn bao giờ hết nhờ sáng kiến mới từ Hugging Face.
Nền tảng phát triển AI Hugging Face vừa công bố một mô hình AI mã nguồn mở dành cho robot, mang tên SmolVLA. Được huấn luyện trên các bộ dữ liệu cộng đồng được cấp phép hợp lệ, SmolVLA vượt trội hơn nhiều mô hình robot lớn hơn trong cả môi trường ảo và thực tế, theo tuyên bố của Hugging Face.
SmolVLA: Mô Hình Nhẹ Nhưng Mạnh Mẽ
“SmolVLA không chỉ là một mô hình nhẹ nhưng hiệu quả, mà còn là một phương pháp để huấn luyện và đánh giá các công nghệ robot đa năng,” Hugging Face chia sẻ trong một bài đăng blog. Mô hình này hướng đến việc dân chủ hóa quyền tiếp cận các mô hình vision-language-action (VLA) và thúc đẩy nghiên cứu về các tác nhân robot tổng quát.
SmolVLA là một phần trong nỗ lực mở rộng nhanh chóng của Hugging Face nhằm xây dựng một hệ sinh thái phần cứng và phần mềm robot giá phải chăng. Năm ngoái, công ty đã ra mắt LeRobot, một bộ sưu tập các mô hình, bộ dữ liệu và công cụ tập trung vào robot. Gần đây, Hugging Face đã mua lại Pollen Robotics, một startup robot tại Pháp, và giới thiệu một số hệ thống robot giá rẻ, bao gồm cả robot hình người, để bán.
Hiệu Suất Và Tính Linh Hoạt
Với kích thước chỉ 450 triệu tham số (parameters), SmolVLA được huấn luyện trên LeRobot Community Datasets – các bộ dữ liệu robot được gắn thẻ đặc biệt, chia sẻ trên nền tảng phát triển AI của Hugging Face. Tham số, đôi khi được gọi là “weights”, là các thành phần nội tại định hướng hành vi của mô hình.
Hugging Face khẳng định SmolVLA đủ nhỏ gọn để chạy trên một GPU thông thường hoặc thậm chí trên MacBook, cho phép thử nghiệm và triển khai trên phần cứng giá cả phải chăng, bao gồm cả các hệ thống robot của chính công ty. Điểm độc đáo của SmolVLA nằm ở “asynchronous inference stack”, giúp tách biệt quá trình xử lý hành động của robot khỏi việc xử lý dữ liệu thị giác và âm thanh. “Nhờ sự tách biệt này, robot có thể phản hồi nhanh hơn trong các môi trường thay đổi liên tục,” Hugging Face giải thích trong blog.
Ứng Dụng Thực Tế Và Cộng Đồng
SmolVLA hiện đã có sẵn để tải xuống từ Hugging Face. Một người dùng trên X đã chia sẻ rằng họ sử dụng mô hình này để điều khiển một cánh tay robot bên thứ ba, cho thấy tiềm năng ứng dụng thực tế của SmolVLA.
Cạnh Tranh Trong Lĩnh Vực Robot Mã Nguồn Mở
Hugging Face không phải là đơn vị duy nhất trong cuộc đua robot mã nguồn mở. Nvidia cung cấp một loạt công cụ cho robot mã nguồn mở, trong khi startup K-Scale Labs đang phát triển các thành phần cho “robot hình người mã nguồn mở”. Các công ty đáng gờm khác trong lĩnh vực này bao gồm Dyna Robotics, Physical Intelligence (được hỗ trợ bởi Jeff Bezos) và RLWRLD.
Kết Luận
Sự ra mắt của SmolVLA đánh dấu một bước tiến quan trọng trong việc làm cho công nghệ robot trở nên dễ tiếp cận hơn với các nhà phát triển và người đam mê. Với khả năng chạy trên phần cứng phổ thông như MacBook và hiệu suất vượt trội, SmolVLA hứa hẹn sẽ mở ra nhiều cơ hội cho các dự án robot tại nhà và thúc đẩy nghiên cứu trong lĩnh vực robot đa năng.
Theo TechCrunch, https://techcrunch.com/2025/06/04/hugging-face-says-its-new-robotics-model-is-so-efficient-it-can-run-on-a-macbook/
