人形机器人技术难题及发展方向
人形机器人研发面临挑战:大模型和灵巧手是当前两大难题
近日,在人形机器人领域,具身智能成为了业内讨论的热点。专家指出,当前人形机器人面临着两大难题:一是机器人软件端的通用大模型和垂直专业模型,仍在攻坚阶段;二是灵巧手在技术和成本上的攻克难点。
王田苗,北航机器人研究所名誉所长,中关村智友研究院院长,在接受采访时提到,当前的具身智能热潮主要体现在垂直领域的具身技能。他指出,具身智能(Embodied Intelligence)强调机器人通过综合感知、推理和自主决策,实现多任务处理和复杂环境中的人机交互,具备广泛的认知能力;而具身技能(Embodied Skills)更聚焦于特定场景下的专业化能力,旨在高效完成特定任务,应用更垂直、商业化更容易。业内认为,具身智能侧重“广而全”的智能化,具身技能则注重“专而精”的能力。
目前,人形机器人成本还没有达到客户的要求,此外量产还涉及到供应链的问题。现阶段,人形机器人主要是在科研平台搭建各类应用,包括对硬件的开放,离我们所说的软件开发应用,还有相当一段距离。
王田苗认为,具身智能机器人或人形机器人,业界基本停留在对通用领域的探索上。他表示,未来三至五年,机器人很有可能会进入复杂环境,在安全和功能上得到有效检验,通过客户的检验,这是目前非常重要的问题。在危险环境、工业、家用甚至一些泛商业化的场景中,技术都不停在迭代。
王田苗认为,大模型对人形机器人的核心贡献在于实现类似人类的交互、推理和环境适应能力。然而,目前仍存在理论和技术挑战。人类认知是分层的,有概念逻辑认知、感知、视觉与触觉,还有肢体协调运用,这些不同层次的关系尚未完全理清。此外,大模型在算法选择上,是监督学习、强化学习,还是端到端学习或者模拟学习,这些都在探索中。另外,训练大模型的数据生成方面也存在问题,尤其是实际操作数据的获取。大模型有望在通用机器人和具体操作中发挥作用,但现实中许多任务仍需专和精。