本文围绕北京通用人工智能研究院发布的全球首个通用智能人“通通”的 2.0 版本展开,介绍了“通通”的发展历程、技术架构、相比 1.0 版本的进化之处以及未来规划等内容。
在科技飞速发展的 21 世纪,人工智能领域不断传来令人振奋的消息。3 月 29 日,在 2025 中关村论坛通用人工智能论坛上,北京通用人工智能研究院对外发布了备受瞩目的全球首个通用智能人“通通”的 2.0 版本。
回顾去年的中关村论坛,“通通”首次在众人面前亮相。它作为首个具身通用人工智能系统原型,具有独特的优势。“通通”实现了基于认知架构,由价值和因果驱动的自主智能,并且能够通过多模态交互达到价值与人类对齐。经过通用人工智能评级标准与测试平台(TongTest)测试,“通通”去年的表现与人类 3 – 4 岁儿童相当。而如今的 2.0 版本,“通通”进一步成长,在语言、认知、动作、学习、情绪、交互等多个方面都实现了进化。
北京通用人工智能研究院院长,同时也是北京大学人工智能研究院、智能学院院长的朱松纯对人工智能的科技创新有着深刻的见解。他表示,人工智能的科技创新分为五个层次,这五个层级如同冰山结构。“水面以上部分”包括执行层、算法层和模型层,它们是人工智能的外在表现,相对而言也比较容易通过算法创新来改变和发展。而“水面以下部分”包括理论层和哲学层,这是智能内在的、难以测量的部分。朱松纯解释道:“理论层即人工智能的数理框架,哲学层则关乎智能的本质。它们不太容易通过表层的影响而得到改变,但却对智能的发展起着关键性的作用。”
在朱松纯看来,“通通”是由价值、因果驱动的通用人工智能系统原型,其突破性就在于实现了由底层哲学层与理论层到顶层的全栈式创新架构。
当前,国内外诸多大语言模型通过指令微调和强化学习下的人机价值对齐等技术手段,虽然能够较好地完成人机多轮对话任务,但此类对话更多的是围绕用户的需求及观点进行,本质上缺乏自身相对连贯的价值观、世界观以及据此演绎出来的对话内容。而“通通”2.0 版本却与众不同,它就像是一个有自身价值观、世界观的小女孩。在理解对话目标意图的基础上,她能遵循自身价值和人格,利用对话策略来引导对话的走向,从而达到自身的目的。这意味着“通通”2.0 在价值调控对话生成、消除模型幻觉、保持对话前后连贯性以及“言行一致”等方面取得了突破。
为了更好地理解“通通”2.0 的独特之处,我们可以看一个例子。当妈妈要求“通通”睡觉,或者吃她不喜欢的食物时,“通通”不会直接服从,而是可以向妈妈耍赖,找理由磨蹭,并试图要求妈妈给予奖励,在多轮协商达成一致后才会实施对应任务。
此外,1.0 版本的“通通”在任务执行过程中,如果周围环境时刻发生变化,会导致她原本规划的任务无法顺利完成。而“通通”2.0 则展现出了更强的适应性,它可以实时响应外界场景的变化,进行反思和重新规划,对已有任务进行挂起、恢复、修改或取消等处理,同时动态生成新的任务规划。
不仅如此,不同于当前大语言模型普遍采用的离线数据驱动的学习模式,“通通”2.0 能动态更新自身的知识库、价值函数和技能,使得它初步具备类人的持续反思和成长的能力。在现场演示中,当“通通”想打开空调时,研究人员利用 VR 手多次改变遥控器位置,让她无法轻易拿到,“通通”则进行了一系列尝试:先是脱鞋上沙发,然后再利用沙发上的靠垫,增加自身高度后最终拿到放在墙架上的遥控器。
据介绍,研究人员正利用认知心理学定义的 5 – 6 岁儿童应掌握的经典任务对她进行测试,目前“通通”已经通过了多项综合性强、复杂度高的任务考核。
北京通用人工智能研究院表示,预计在今年年底,就会将“通通”对大众开放。未来,“通通”则将成为通用底座支撑各类垂直应用场景。
本文介绍了通用智能人“通通”2.0 版本的发布,回顾了其 1.0 版本的特点,阐述了人工智能科技创新的层次及“通通”的全栈式创新架构。同时对比了“通通”2.0 与大语言模型的差异,展示了“通通”2.0 在多方面的进化和突破,最后提到了其测试情况和未来规划,“通通”2.0 的出现为通用人工智能的发展带来了新的活力和方向。
原创文章,作者:Weaver,如若转载,请注明出处:https://www.yanghehb.com/7726.html