惊!通用智能人“通通”2.0带来多方面能力大升级!

本文围绕2025中关村论坛年会通用人工智能论坛上发布的全球首个通用智能人“通通”2.0展开,详细介绍了其相较于1.0版本在多种核心能力上的升级,以及在不同场景中的表现和应用前景。

在2025年3月29日举办的中关村论坛年会通用人工智能论坛上,一场科技盛宴拉开帷幕。会上,北京通用人工智能研究院重磅发布了令人瞩目的研究成果——全球首个通用智能人“通通”2.0正式完成升级迭代,惊艳亮相。

惊!通用智能人“通通”2.0带来多方面能力大升级!

3月29日,“通通”2.0在2025中关村论坛年会通用人工智能论坛上发布。

当下,国内外众多的大语言模型借助指令微调和强化学习下的人机价值对齐等技术手段,在人机多轮对话任务方面表现良好。然而,这些对话大多只是围绕着用户的需求和观点展开,本质上缺乏自身连贯的价值观、世界观,以及基于此演绎出来的对话内容。

“通通”2.0版本则别具一格,它仿佛“塑造”了一个拥有自身价值观和世界观的小女孩。在理解对话目标意图的基础上,“通通”2.0能够遵循自身的价值和人格,巧妙地运用对话策略来引导对话的走向,进而达成自身目的。在价值调控对话生成、消除模型幻觉、保持对话前后连贯性以及“言行一致”等方面,“通通”2.0取得了显著的突破。就像生活中,当妈妈要求“通通”睡觉,或者让她吃自己不喜欢的食物时,“通通”会向妈妈耍赖,找各种理由磨蹭,还会试图要求妈妈给予奖励,只有在经过多轮协商达成一致后,才会去执行相应的任务。

“通通”生活在高度仿真的复杂、动态三维虚拟场景中。在1.0版本时,如果周围环境时刻发生变化,“通通”原本规划的任务就很难顺利完成。但“通通”2.0展现出了强大的应变能力,它可以实时响应外界场景的变化,进行反思和重新规划。对于已有任务,它能够进行挂起、恢复、修改或取消等处理,同时动态生成新的任务规划,以更加灵活、智能、多变的方式完成指令。

值得一提的是,与当前大语言模型普遍采用的离线数据驱动的学习模式不同,“通通”在与场景交互(自主学)以及与人类的多模态对话(他人教)过程中,能够动态更新自身的知识库、价值函数和技能,初步具备了类人的持续反思和成长能力。

为了更直观地展示“通通”的学习能力,研究人员设置了一个有趣的场景。当“通通”想打开空调时,研究人员利用VR手多次改变遥控器的位置,让她难以轻易拿到。“通通”并没有放弃,而是进行了一系列尝试,先是脱鞋上沙发,然后利用沙发上的靠垫增加自身高度,最终成功拿到放在墙架上的遥控器。当按下遥控器空调仍未打开时,研究人员教导她“电器需要插上插头才能使用”,“通通”遵循教导,成功打开空调的同时,还更新了自己的技能库,将这项技能和知识长期存储下来。

研究人员还为“通通”打造了幼儿园、六口之家等多智能体场景。在这些场景中,设置了多个各自独立、具备自身价值、能力、人设和状态的智能体,让“通通”拥有了自己的家人和朋友。

在多智能体场景中,“通通”面临着更为复杂的挑战。它不仅需要理解周围的环境,还需要理解环境中其他智能体的各种信息,包括他们的身份、性格、与自身的关系、彼此之间的关系、与物品的关系,以及当前的动作、意图、气氛等。在此基础上,“通通”进行自身的任务规划,发起和响应对话,实施帮助、捣乱等复杂的行为交互。例如,当“通通”在做任务遇到困难时,会主动开口寻求帮助,并详细解释自己的困难;在和弟弟一起打扫房间时,她会实时观察弟弟的行为,并根据弟弟的表现来调整自己的任务规划,从而顺利完成合作。

随着“通通”的持续迭代,她的能力也在不断稳步提升。目前,研究人员正运用认知心理学定义的5 – 6岁儿童应掌握的经典任务对她进行测试,“通通”已经顺利通过了多项综合性强、复杂度高的任务考核。

展望未来,“通通”的发展前景十分广阔。她将成为通用底座,支撑各类垂直应用场景,进一步学习行业特定的知识和技能,形成千万个“通用智能人”,为千行百业赋能。同时,“通通”还将与具身智能机器人相结合,为智能制造、智慧城市、养老陪护、数字助理、家用机器人等领域带来革命性的变化,更好地服务居民的日常生活。

本文介绍了通用智能人“通通”2.0在中关村论坛年会通用人工智能论坛上的发布,阐述了其相较于1.0版本在语言、认知等多方面的能力升级,包括独特的对话策略、强大的应变和学习能力,以及在多智能体场景中的表现。“通通”通过多项复杂任务考核,未来将为各行业带来变革,服务居民生活。

原创文章,作者:Nerita,如若转载,请注明出处:https://www.yanghehb.com/7353.html

(0)
NeritaNerita
上一篇 2025年3月29日
下一篇 2025年3月29日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注