我叫远征A2,是一款面向交互服务场景的机器人,全身具备超过40个主动自由度的关节和仿人的灵巧双手。”远征A2人形机器人一边介绍着自己,一边转动手腕、活动手指,展示着灵巧双手,动作丝滑柔和,仿佛真的拥有“人类”双手。
在8月18日智元机器人年度新品发布会上,智元机器人一口气发布了“远征”与“灵犀”两大系列、五款商用人形机器人。其中,最值得关注的是智元机器人在灵巧手方面的突破,达到19个自由度,并加入MEMS触觉(利用微机电系统实现触觉感知与反馈)和视触觉的多传感融合,让灵巧手实现更广泛的物体交互。
“手”是人类感知世界的重要工具,一双灵巧手同样也是人形机器人重要的末端执行器,当它真正学会通过触觉来认知世界时,或许就是硅基生命“诞生”的开始。
能打麻将,能穿针引线
在2024世界人工智能大会上,“青龙”人形机器人用双手缓慢且轻柔地抓起桌面上混合摆放的面包和水果,分类放进左右两个篮筐内,即便是柔软的面包,也不会因为抓力而变形;机器人初创企业Figure和Open AI合作打造的Figure01,凭借一条清理桌面的视频火爆全网,双手可以识别并抓取光滑的玻璃杯、扁形的盘子、圆形的苹果……
当人们都在惊叹于多模态大模型赋予人形机器人一颗智能“大脑”时,往往会忽略这些动作的执行末端——机器人的灵巧手。
手,对人类的重要程度不言而喻。从生理结构来看,一个成年人一只手大约有27个关节数量,其中包括腕关节、腕掌关节、指关节等。若转化为自由度(一个结构可以独立运动的方向)概念,根据《山西大学学报》上一篇名为《手部姿态估计方法综述》的论文,一只人手的自由度共26个,其中本体20个,手腕6个。这意味着,人形机器人的灵巧手想要更加灵活,自由度就要趋近,甚至超过人手结构。
在智元机器人新品发布会上,拥有“华为天才少年”和“野生钢铁侠”之称的智元联合创始人“稚晖君”(彭志辉)介绍,在动力域方面,智元自研PowerFlow关节模组已经实现量产化迭代升级,灵巧手的自由度升级为19个,其中通过驱动器主动控制的主动自由度相比上一代翻倍,为12个。单手最大负载达到5KG以上,可以实现重物拿取。在感知能力方面,智元机器人引入MEMS触觉(利用微机电系统实现触觉感知与反馈)和视触觉的多传感融合技术。
演示视频中,智元机器人打造的灵巧手不仅可以完成握拳、张开、抓取物品等基本动作,还可以手持工具完成拧螺丝、拆快递、倒水等操作,在基于视触觉位姿估计技术下,甚至可以完成纽扣穿针、识别麻将等“精细活”。
对比来看,智元机器人打造的灵巧手已经超越具有11个自由度和6个执行器的特斯拉一代人形机器人,但距离英国Shadow Robot打造的拥有24个自由度和20个执行器的Shadow Hand灵巧手还有一定差距。
“一双手”背后的不同技术路线
“灵巧手一般采用位置控制和力度控制两种方式。”国地中心市场体系总监杨正叶告诉《IT时报》记者,位置控制是机器人通过计算物品体积或大小,分析手部抓取需要移动到的空间位置,但当计算出现偏差时会导致两种情况出现:一是将手指掰断也要到达位置,二是将物体直接抓坏。力量控制则是分析抓取物体需要用多大力量,即使出现偏差,也可以减少甚至避免上述两种情况的发生。
传感器是灵巧手控制力度的核心部件。目前,机器人领域使用最多的还是六维力传感器,随着MEMS(微机电系统)技术工艺的提升,MEMS压力传感器和MEMS惯性传感器也被逐渐应用在灵巧手上,这是智元机器人采用的技术之一。
国内灵巧手厂商因时机器人则押注“触觉感知”。8月21日,在世界机器人大会上,因时机器人发布了全新的FTP系列仿人五指灵巧手,在原有内置力传感器基础上,为指尖、指腹、手掌部位增加了12个触觉传感器模块,可以让灵巧手实时获取5个手指的受力情况和各个接触面的触觉信息。
在灵巧手驱动方面,各家也是“各显神通”。蓝胖子机器智能研发总监王涛在《机器人灵巧手的研究及应用》直播课中介绍,灵巧手驱动方式包括电机直线驱动、连杆传动、肌腱传动、气动、液压等。
目前,智元灵巧手可以实现手指左右摆动,达到张开效果。通过掌心部位驱动组件连接的多个传动连杆,驱动手指根部部件。而手指弯曲则由齿轮+轴承部件驱动,内置的电位计可以检测驱动轴的转动角度,并转化为电信号反馈给驱动模组,从而控制手指的弯曲角度。
因时机器人官方公众号文章则介绍,因时机器人打造的灵巧手,内部集成了6个力控微型伺服电缸进行直线驱动,连杆传动方式可以提升灵巧手抓取强度和精准度。同时,由于因时灵巧手采用了电子皮肤等技术,从外观上看,它与人手更加相似。
两种技术路线增速都很快,芯谋数据显示,预计中国惯性传感器市场将以10.2%的增速快速增长,至2027年达125.7亿元。QY Research 数据显示,预计2029 年全球机器人触觉传感系统市场规模将达到 4.3 亿美元。
算力、算法依旧是瓶颈
人形机器人正从实验室走向产业化,不仅是科技企业的“必争之地”,也为核心零部件灵巧手带来需求增量。根据头豹研究院预测,保守情况下,2030年全球人形机器人灵巧手市场规模为320.6亿元,年复合增长率为 81.2%,乐观情况下达879.7亿元,年复合增长率为 109.3%。
尽管需求日益旺盛,但技术与产品仍然面临诸多挑战。
王涛介绍,以抓取动作为例,大致可以分为解析法和数据驱动法两类,解析法是灵巧手通过数学解算、物理计算等方式形成抓取方案,但实际情况是,许多参数无法被准确解析,如抓取摩擦系数、正压力、接触点位姿等。因此目前最常用的还是数据驱动法,即通过现有标注好的数据进行训练学习。
从硬件来看,类似Shadow Hand灵巧手的自由度已经十分接近人手结构,但自主性还不够,大多动作还是依靠人类遥控操作的方式实现,自主性还未能实现。
“如果每0.1毫米都有一个全面抓取数据,不用传感器,仅靠算力调动就能完成。”杨正叶也表示,目前人形机器人的抓取功能,是针对某一特定物体或材质进行训练而实现,想要像人类一样通过视觉、触觉等多种感知,判断不同物体材质,从而决定抓取力度,目前人形机器人还做不到。
尽管将多种感知模态的传感器集合,可以解决单一传感器的局限性,并获得更加丰富的环境信息,但这也意味着需要更多的算法,将不同模态的信息构建为统一的特征表示和关联关系,同时使用算力进行信息调度使用,这都意味着巨大的成本和投入。
本文来自微信公众号“IT时报”(ID:vittimes),作者:沈毅斌,编辑:郝俊慧 孙妍,aigpt6经授权发布。