谷歌的数据收集系统 AutoRT 可以同时利用视觉语言模型(VLM)和大型语言模型(LLM),以理解其环境,适应陌生环境,并决定适当的任务。
本次起草的“机器人宪法”受艾萨克・阿西莫夫的“机器人三大定律”启发,围绕着安全出发,指示 LLM 避免选择涉及人类、动物、尖锐物体甚至电器的任务。
DeepMind 表示为了提高安全性,编程限制了机器人的关节,力超过一定阈值时自动停止,此外还配有专门的物理紧急停止开关。
谷歌表示在过去 7 个月的时间里,部署了一支由 53 台 AutoRT 机器人组成的机群,分别部署在四个不同的办公楼,并进行了超过 77000 次试验。
一些机器人由人类操作员远程控制,而另一些则根据脚本或完全自主地使用谷歌的机器人变形器(RT-2)人工智能学习模型运行。
试用中使用的机器人看起来更实用而不是花哨 —— 只配备了摄像头、机械臂和移动底座。对于每个机器人,系统使用 VLM 来理解其环境和视野内的物体。接下来,LLM 提出了机器人可以执行的创造性任务清单,比如将零食放在台面上,并扮演决策者的角色,选择机器人执行的适当任务。
IT之家从报道中获悉,DeepMind 的另一项新技术是 SARA-RT,这是一种神经网络架构,可以比现有的 Robotic Transformer RT-2 更准确,速度也更快。
谷歌还宣布了 RT-Trajectory,添加了 2D 轮廓,以帮助机器人更好地执行擦桌子等特定的物理任务。
AI写作助手 原创文章,如若转载,请注明出处:http://noahtech.cn/list/shijie/9954.html