2025中关村论坛年会期间,北京智源人工智能研究院院长王仲远接受媒体采访的内容展开。王仲远对具身智能与人形机器人的关系、人工智能应用的发展趋势等问题进行了解答和分析。
红星资本局于3月29日发布消息,在2025中关村论坛年会期间,北京智源人工智能研究院(以下简称“智源研究院”)院长王仲远接受了包括红星资本局在内的多家媒体的采访。
在采访中,王仲远针对红星资本局的提问给出了一系列重要观点。他表示,各种构型的机器人都能够接入具身智能,具身智能并非是专门为人形机器人设计的一种智能。从长远角度来看,人形机器人具有一定的优势,但在短期内,其在产业落地方面仍面临诸多难点。
王仲远认为,今年人工智能应用预计会迎来大规模的爆发,尤其是在大语言模型的落地应用方面,存在着极大的产业爆发可能性。他着重强调,多模态是大模型必不可少的能力。
(注:王仲远 主办方供图)
具身智能并非“绑定”人形机器人
当下,人形机器人的赛道异常火热,但也有观点指出,大部分工作并非一定要使用“人形机器人”这一构型。那么,该如何理解人形机器人发展的必要性呢?
王仲远在回答红星资本局的提问时表示:“某种程度上我赞同这个观点。”他指出,目前行业里有不少机器人公司已经开始迭代轮式构型的机器人,因为这样能够极大地避免双足机器人本身不稳定所带来的能力局限。
“从长期来看,人形机器人一定有它的优势。”王仲远进一步解释道,“人类是双足行走的,这是大自然选择的结果,整个社会的基础设施也是依据人类的这种构型来建设的。”他认为,“类人”这种构型能够更好地适应社会的基础设施,同时也能从海量的互联网数据中更好地学习人类技能。所以,从长远来看,人形机器人是一个正确的发展方向,有利于具身智能或者具身大脑模型的迭代。
然而,王仲远也指出,从短期来看,聚焦于产业落地,人形机器人确实还面临着很多困难。现在很多机器人仅仅处于“能走”的阶段,正朝着“走得快”“走得稳”的阶段发展。
王仲远强调,单臂、双臂等各种构型的机器人都可以接入具身智能,具身智能并非是为人形机器人单独设计的。
今年人工智能应用预计会出现大爆发
外界有投资人对具身智能产业不太看好,但站在研究机构的角度,王仲远对具身智能的长期发展持非常乐观的态度。他举例说:“就好像10年前我们看待无人驾驶技术一样,具身智能一定会进入应用落地的阶段。”
王仲远指出,今年在人工智能的应用上预计会出现大规模的爆发。“特别是中国存在海量的场景及应用,当基础模型能力达到可用水平时,就能迅速实现落地应用。”他特别提及了大语言模型的落地应用,认为其存在着非常大的产业爆发可能性。
“但我也反复强调过,大语言模型是远远不够的。”王仲远表示,“在真实行业中,数据并非简单的文本,所以‘多模态’是大模型绕不开的一种能力。”
王仲远介绍,现在的多模态大模型,特别是多模态理解大模型还处于相对早期的阶段。2024年智源研究院发布了全球首个原生多模态大模型Emu3,该模型能够将文本、图像、视频从开始就进行原生统一的训练。他认为,这样一种统一原生多模态大模型有望帮助大模型在各行各业更好地落地。
此外,王仲远还提到,外界认为现在的模型,尤其是基础模型的性能提升相对缓慢,一个很重要的原因是在数据、算力上遇到了瓶颈。他强调,整个大模型的技术还远没有到尽头,算力依然是紧缺的。
本文围绕北京智源人工智能研究院院长王仲远在2025中关村论坛年会上的采访内容,探讨了具身智能与人形机器人的关系以及人工智能应用的发展趋势。王仲远认为具身智能并非只适用于人形机器人,人形机器人长期有优势但短期产业落地难;今年人工智能应用尤其是大语言模型落地应用预计会大爆发,多模态是大模型必备能力,同时指出当前模型性能提升慢与数据、算力瓶颈有关,大模型技术仍有很大发展空间。
原创文章,作者:Gaiety,如若转载,请注明出处:https://www.yanghehb.com/7752.html