谷歌DeepMind团队在人工智能领域的最新研究成果备受瞩目。最近,该团队公布了一系列的新进展,其中包括一款名为AutoRT的数据收集系统,一款用于改进机器人Transformer神经网络架构的模型,以及一种能够帮助机器人更好地完成特定物理任务的模型。这些新成果将会推动机器人在自然环境中的表现更加出色,同时也能更好地服务于人类。
AutoRT是一款数据收集系统,它可以指挥20个机器人进行数据收集训练。这款系统结合了视觉语言模型(VLM)、大语言模型(LLM)以及机器人控制模型(RT-1或RT-2),可以在新环境中一次性指挥20个机器人进行数据收集训练。AutoRT的安全护栏采用“以安全为重点的提示”,灵感源自科幻作家艾萨克·阿西莫夫的“机器人三定律”。它可以让机器人避免选择涉及人类、动物、尖锐物体甚至电器的任务,以确保它们的安全。
谷歌DeepMind团队还推出了一款用于改进机器人Transformer神经网络架构的模型。这款模型叫做SARA-RT,它的主要目标是让现有的机器人Transformer神经网络架构更快更准确。传统的机器人Transformer模型需要大量的计算资源和时间来进行训练,而且它们的性能受到很多因素的影响,比如网络结构、激活函数等等。而SARA-RT模型则采用了新的架构和技术,能够更快地收敛并且更准确地进行预测。
除了AutoRT和SARA-RT之外,谷歌DeepMind团队还推出了一种能够帮助机器人更好地完成特定物理任务的模型。这种模型叫做RT-Trajectory模型,它可以从训练视频中自动添加描述机器人运动的视觉轮廓,让机器人理解“如何做”任务。这个模型可以帮助机器人识别物体的形状、大小和位置,并根据这些信息来规划自己的行动。这种模型可以用于各种不同的任务,比如搬运物品、清洁房间、组装零件等等。