没有什么其他的人造物像人形机器人这样,包含了人类的敬畏、赞赏和恐惧:我们期待它们让生活更方便和安全,但与此同时,我们却无法信任它们。我们如此细致地按照自己的样子塑造他们,但是与此同时,又如此担心它们会替代我们。
人形机器人曾经长期处于实验室阶段,但是近来有了新的转向——人形机器人开始能在实际环境中执行任务,并且与人类一起执行任务。
7月28日,谷歌DeepMind发布了一款新的机器人模型RoboticsTransformer2(RT-2),它是一个融合了视觉、语言、动作能力的多模态大模型。在超过6000次机器人试验中,研究人员通过将VLM预训练与机器人数据相结合,直接控制机器人。
通过对大量网络知识的预训练,RT-2模型产生的泛化和涌现能力,可以让机器人对从未见过的对象或场景上执行操作任务。
人形机器人的时代即将来临吗?
我们只花了几年时间就接受了iPhone智能手机带来的掌上虚拟世界,我们也会快速接受一个充满机器人的世界吗?
人类正在制造一些
终将代替自身的东西吗
2021年8月,在特斯拉AI日上,马斯克出乎所有人的意料,公布了特斯拉人形机器人(TeslaBot)项目。当时在现场只有一个模型和几页罗列了参数和概念的PPT,马斯克对机器人的市场定位是替代人类去做一些有危险,或重复枯燥的劳动。
在第二年的AI日上,这个PPT中的人形机器人在没有人工辅助和后背连线的情况下就走上了发布会的舞台,代号Optimus(和大家熟悉的变形金刚擎天柱同名)。接下来,马斯克播放了一段Optimus在办公室搬运箱子,给花浇水以及在特斯拉超级工厂中工作的演示视频。
Optimus的工作功耗是500w,配2.3KWh的电池,重73公斤。不包括手的自由度(能够独立运动的关节数)为28,手部有11个自由度,能够抓起9公斤左右的物体。计算设备来自特斯拉FSD自研平台衍生的SOC。
Optimus在研发上沿用了很多特斯拉在电动汽车领域已经取得的优势。机器人用的视觉深度学习模型来自特斯拉汽车;研发汽车所用的硬件仿真平台也为机器人的可靠性与结构设计提供了评估结果与优化支撑。马斯克在现场谈到Optimus的预期售价是2万美元。
今年的特斯拉AI日还没有到,但在5月的股东会上,马斯克再次展示了机器人项目的最新进展。
最新的特斯拉机器人行走的流畅度比Optimus有所提升;也能灵活地抓取放下物体。在技术方面,采用电机扭矩控制,机器人可以做出更轻柔的动作;环境发现与记忆能力被加入到特斯拉机器人中,现在机器人可以对周围的环境进行大致的建模;通过捕捉人类动作,特别是手部,训练机器人动作,使其具备类似人的物品抓取能力。
特斯拉在AI方面的研发投入,以及在自动驾驶领域已经应用的技术,都为人形机器人的研发提供了技术支撑。特斯拉人形机器人从21年的“PPT”到现在原型机能够行走、抓取物品,成长速度可以说是飞快。此外特斯拉充足的研发资金,和自家超级工厂这一应用场景,都让特斯拉人形机器人比过去的前辈们有更好的未来与应用场景。
特斯拉重新勾起了大众和投资领域对人形机器人的兴趣,不光因为特斯拉是这几年科技与电动汽车领域的明星企业,更因为人们对人形机器人有着浓厚的兴趣。
人类对未来的想象无法脱离现实的引力,但未来亦是由过去和现在一步一步循序而来。
人形机器人发展历史
早在1495年,意大利画家、科学家达芬奇就设计出了一个通过皮带滑轮和拉绳操作的机器人,这个穿着中世纪骑士盔甲的机器人能够做出和人类似的站立、坐下、抬起面罩和独立活动的手臂。
到了1860s,瑞士钟表匠皮埃尔雅克-德罗兹父子3人设计制造出3个真人比例的机器人——分别可以写字、绘图和演奏乐器。
这些古老的机器人更像是某种自动机,受限于当时的技术和科技水平,能做的事情也极为有限。但它们的存在意味着人类在技术进步前,就有了制作“人形机械”的想法。
20世纪突飞猛进的技术进步让人形机器人有了质的飞跃。1921年捷克作家卡雷尔·恰佩克在他的戏剧作品《R.U.R.》中创造了“Robot”这个单词,机器人这一概念逐渐走入大众的视野。
1927年,为了推广新研发的Knowlestube电子管,美国西屋电器工程师温斯利制造了一个名为“HerbertTelevox”的人形机器人。它有一个像人的身体,眼睛能够发光。实际功能是通过电话控制家里电器的开关。虽然类人的造型只是噱头,但这一举动吸引了无数目光。
1928年,日本首个机器人诞生,由发明家西村真琴制作,名为學天則。學天則可以通过气压装置改变面部表情,摆动头部和手。
同年,英国的首个机器人Eric也由一战退伍兵理查兹和飞机工程师雷费尔制作出来。Eric由两个人操作,可以站立或坐下,它的声音通过无线电接收,但无法迈腿行走。Eric的胸口印着“R.U.R.”,向捷克作家卡雷尔·恰佩克致意。
1937年,西屋公司推出了第二款机器人Elektro,高2.1米,重达118公斤。庞大的身体也意味着更丰富的功能。Elektro可以通过语音命令行走,能说700个单词,会抽烟,戳爆气球和摆动头部和手臂。它还有一个配套的机器狗Sparko,会叫会坐下还会讨好人。
机器人Alpha在1932年引起来一些争议,这款由发明家哈利·梅制作的机器人,在没有命令的情况下,意外地用手中的手枪朝发明家射击,子弹击中了发明家的手。不过也有人在考证后指出,实际上是机器人漏电烧伤了梅的手,开枪伤人是夺人眼球的夸大。
1939年,瑞典工程师奥古斯丁·哈柏制作了机器人RadioMan,耳朵里的麦克风可以接收语音命令,躯干安装了短波接收器,可以通过无线电波接收命令,进而做出行走、说话、唱歌和用瑞典传统约德尔调唱歌。
1953年,工程师哈维查普曼用废弃飞机零件制造了机器人Garco,一开始只是一个能举起简单物品的噱头产品。但查普曼后来接受采访时认为Garco这样的通用机器人可以替人类做很多危险的工作。Garco后来还和沃尔特·迪士尼一起出现在了迪士尼乐园,成为了一个代表科幻、未来的招牌机器人。
NASA在1967年制作了“articulateddummies(关节假人)”,可以模仿35种人类的动作,用来替代宇航员测试加压宇航服。假人穿上宇航服后,操作人员可以控制其四肢活动,从而测试动作力矩大小。
20世纪前半叶,人形机器人逐渐从草稿和精巧玩偶变成了电力驱动,具有一些具体功能的铁皮庞然大物。除了NASA这样的研究机构有一些实际应用场景,人形机器人仍然只是用来吸引眼球和满足大众对未来的想象好奇心的载体。
人形机器人行业成为一项被认真对待的研究领域,早稻田大学加藤一郎教授领导的WABOT项目功不可没。1973年推出的WABOT-1,这是世界首个全尺寸拟人机器人。拥有肢体控制系统、视觉系统和对话系统。WABOT-1拥有人造嘴,可以用日语与人交流,并用人工眼耳感知环境,测量与物体间的距离和方向。双腿可以静态步态行走,拥有触觉的双手可以抓握物品。其智能程度大概和18个月的婴儿类似。
同时期日本电子制造业和汽车工业的兴起,给人形机器人研究在技术方面提供了很大支持,在接下来的30年中,形形色色的日本人形机器人相继问世,也正式开启了人形机器人这一研究领域。
1984年,WABOT-2推出,这是在WABOT-1的基础上,和多个研发实验室合作开发,更智能化的音乐演奏机器人。它的头部有摄像头,可以用来读乐谱,灵活的手指可以在键盘上演奏一般难度的曲子,还能给唱歌的人伴奏。WABOT-2是人形智能机器人研发历史上第一个里程碑式的产品。
1986年,汽车制作商本田开发了双足行走机器人E0,这个只有两条腿的机器人开启了本田在机器人领域长达20年的研发。E0的开发是为了让机器人实现像人一样的双足行走。E0实现了静态步行,每迈出一步,机器都会重新调整重心,稳定后再迈出下一步。
接下来本田很快迭代升级了E0,从1987年到1991年相继推出了E1、E2、E3等原型机,其双足行走的步态越来越稳定,E2的行走速度已经达到了1.2km/h,也拥有类似人类的动态步行(每迈出一步,动态地调整平衡)方式。
在平整道路上实现了快速行走后,本田又在E4、E5、E6上实现了上下台阶,斜坡行走。并且增加了更多传感器,改善了稳定性算法。在拥有了稳定双足行走结构与算法的基础上,本田给原型机加上了上半身,开始致力于人形机器人的研发。
1993年,高1.9米,重175公斤的原型机P1诞生。P1可以做一些简单动作,包括开闭电脑开关,抓住门把手,拾取物品。这一阶段的研究重点是上身与下肢的协调控制。
之后的4年里,原型机P1不断升级。P2是世界上首个自主控制双足人形机器人,高1.8米,重210公斤。躯干中加入了计算机、驱动电机、电池和无线通信装置等必要的设备。P2可以自主完成行走,上下楼梯,推车等任务。
P3则进一步小型化轻量化,通过使用复合材料和分散布局控制系统,P3的体积重量为高1.6米,重130公斤,比前两代能更好地适应在人类环境中使用。
在E系列和P系列的研究成果上,本田在2000年正式推出了名为ASIMO的智能化人形机器人。为了更好地在人类生活环境工作,ASIMO的身高在1.3米左右,重量也降低到了50公斤左右。ASIMO有着灵活稳定的行走系统,并且在接下来的11年中不断升级。
ASIMO的行走速度不断加快,平衡系统也愈加完善,甚至可以以9公里/小时的速度奔跑。智能化系统让ASMO可以理解人类的手势,识别人脸叫出名字,在和人类相处时,更好地响应人类的指令,或自主行动。工作模式也由单一个体,进化到了多机体协同工作。
本田非常努力地让ASIMO更好地适应在人类生活、工作环境中协助人类。在2011年推出的最新一代升级中,ASIMO的自主性达到了最高水平。能分辨三个人同时说话;抓住水瓶,拧开瓶盖将水倒入纸杯;灵活的手部可以打手语等等。
日本研发人形机器人最初的设想是进入人类社会和家庭,成为人类的帮手。遗憾的是在成本、机器人的能力等方面,一直存在缺憾,未能实现这一理想。明星一般的ASIMO在2018宣布宣布“退休”,正式停止了研发。
当日本的人形机器人研发走入平淡时,电子计算机、人工智能等领域的兴起让人形机器人研发有了新的方向。
2009年,欧洲多个高校与意大利技术研究院联合开发了开源人形机器人iCub。这个身高1米,体型近似3岁儿童的机器人拥有视听感知和分析能力。研究人员系统通过赋予机器人感知能力,从而培养机器人的自主意识,主动探索环境,对外界做出反应,这是一个专门用来支持人工智能研究的机器人。
2013年,开源人形机器人项目Poppy上线,电机、处理器和传感器均采用现成产品,躯干零件3D打印,这是一台便宜实惠,可以自行组装的人形机器人。
同年,波士顿动力公司开发的Atlas机器人成为了新的明星,这款动力机器人拥有出色的运动稳定性,可以在布满石块的崎岖路上行走,被外力干扰也能持续保持单脚站立平衡。
2016年,改进后的Atals亮相,拥有了更强的运动平衡能力。在演示视频中,工作人员打掉了Atals手中的搬运箱,还狠狠推了它一把,但Atals向后退了好几步,但依然保持站立。
2017年,Atals在视频演示中展示跳跃能力,可以从一个箱顶跳到另一个箱顶,能够跳上高台,甚至还能从高台后空翻跳下并平稳落地。接下来的几年里,Atals的运动能力持续加强,能够小跑跨越障碍,跃上交错的高台,做出倒立,前空翻等跑酷动作。
算法和机器学习的进步是Atals运动能力变强的推力之一。在2021年的演示中,Atals已经可以识别环境,自主规划路径,寻找动作落点。3D打印降低了成本,也给团队提供了定制化开发部件的可能性。Atals的腿部结构和一些关键零件,均由3D打印技术自行开发制作。
在新技术的帮助下,人形机器人的发展并没有停滞。
当下,人工智能领域的快速发展,为人形机器人提供了新的发展机遇。强大的机器学习和效能不断上升的芯片,让机器人的智能化有了新的可能。新的传感器和相关技术,让机器人能获取更丰富的环境信息,更好地感知外部世界。AGI的成熟,也需要更多落地场景,人形机器人或许有可能和自动驾驶一样,成为与人工智能领域相伴发展的行业。
人形机器人的研发起起伏伏,不断有机构尝试将人形机器人投入到实际场景中,试图找到人形机器人发挥起作用的领域。NASA在2011年向国际空间站发射了Robonaut2太空机器人,希望机器人能和宇航员一起执行危险的太空任务;软银也曾在2014年销售面向社会大众,号称可以交流情感的机器人Pepper。
高盛在最近的一份报告中估计,在未来10到15年内,人形机器人市场规模将达到60亿美元(或更多),到2030年,这样一个市场将能填补美国制造业预计劳动力缺口的4%,到2035年填补全球养老护理需求的2%。而如果能完全克服产品设计、使用案例、技术、经济承受能力和广泛的公众接受度等障碍,高盛预计到2035年,仿人机器人的市场规模将达到1,540亿美元。如此规模的市场可以填补48%到126%的劳动力缺口,以及高达53%的老年护理缺口。
但迄今为止,人形机器人的发展史上,还没有任何成功实现商业化的案例。波士顿动力在视频中呈现的超强性能,也只是实验室项目。
商业市场上最先进的机器人技术之一是自动驾驶汽车,但仿人机器人必须拥有远高于自动驾驶汽车的智能和处理能力。
前人的尝试大都以失败告终,但如今大模型涌现能力已被验证,拥有超强工程能力和数据积累的厂商也许会带来不一样的结果,正如日本在经济和技术都如日中天的年代,坚实的制造业基础投入到人形机器人研发中,取得了和过去相比突破性的进展。
参考资料:
[1]本田ASIMO官网https://www.honda.co.jp/ASIMO/
[2]波士顿动力官方博客https://bostondynamics.com/blog/flipping-the-script-with-atlas/
[3]iCub官网https://icub.iit.it/
[4]早稻田大大学WABOT介绍https://www.humanoid.waseda.ac.jp/booklet/kato_2.html
[5]ASIMO解析,无处不在的小土https://gaoyichao.com/Xiaotu/book=robot_cases&title=asimo
[6]NIPPONIA,机器人专题https://webjapan.org/nipponia/nipponia38/zh/feature/feature05.html