黄仁勋GTC演讲释放信号,英伟达在AI推理时代能否领先?,英伟达GTC大会:黄仁勋畅谈AI愿景,股价却难挽颓势

本文围绕英伟达举办的GTC大会展开,详细介绍了英伟达创始人黄仁勋在大会上对AI的畅想、公司在AI基础设施的布局、对推理计算需求的观点、芯片路线图的更新等内容,同时也提及了市场对英伟达的反应,即股价下跌。

黄仁勋GTC演讲释放信号,英伟达在AI推理时代能否领先?,英伟达GTC大会:黄仁勋畅谈AI愿景,股价却难挽颓势

图片来源:视觉中国

据蓝鲸新闻3月19日消息(记者 朱俊熹),在DeepSeek引发市场对GPU需求的担忧之后,英伟达创始人兼首席执行官黄仁勋一直积极寻找各种亮相机会,大力阐述其对于AI的畅想,试图以此来提振投资者对英伟达的信心。此次他选择的舞台,便是3月17日起在美国加州举办的英伟达GTC大会。

近年来,随着英伟达在AI浪潮中的地位不断攀升,GTC大会已从最初单纯的开发者活动,逐渐演变成全球瞩目的科技盛会。当地时间3月18日,黄仁勋在主题演讲中,将今年的GTC大会形容为“AI的超级碗”。他兴奋地表示,与传统超级碗不同的是,在这场“AI超级碗”中,每个人都能够成为赢家,“每个人都是赢家”。他进一步解释道,AI具有强大的能力,能够为更多的行业和公司解决实际问题,所以每年都吸引着越来越多的人参与其中。

AI芯片路线图的更新,依旧是本届GTC大会的核心看点。然而,英伟达的野心远不止于此。该公司将目标瞄准了AI时代基础设施层的大一统,其布局横跨软件和硬件两个领域,旨在为更多企业提供以英伟达为核心的数据中心解决方案。

正如黄仁勋在演讲中所提到的,AI起源于云端,云数据中心的基础设施为AI的蓬勃发展提供了必要的环境。今年以来,英伟达已经向美国四大云巨头出货360万块Blackwell芯片。不过,黄仁勋认为AI的发展不会仅仅局限于云端,它将无处不在。事实上,英伟达正在积极构建三类AI基础设施,分别是面向云端的、面向企业的以及面向机器人的。

黄仁勋GTC演讲释放信号,英伟达在AI推理时代能否领先?,英伟达GTC大会:黄仁勋畅谈AI愿景,股价却难挽颓势

图片来源:英伟达

推理将成未来十年核心工作负载

在DeepSeek爆火并一度重创英伟达股价之后,黄仁勋多次公开回应称,投资者对DeepSeek取得的进展存在误解。他强调,这并不意味着AI公司不再需要计算资源,相反,推理模型仍然高度依赖大量的计算资源。

在GTC演讲中,黄仁勋再次直言不讳地指出:“在过去一年里,几乎全世界在这个问题上都犯了错误。AI的计算需求及其扩展定律实际上更具韧性,甚至呈现出超加速的趋势。由于代理型AI(Agentic AI)和推理能力的发展,目前所需的计算量轻松达到了去年同期我们以为所需的100倍。”

为了让大家更好地理解这一论点,黄仁勋给出了更详细的阐释。他表示,具备推理能力的AI会对问题进行逐步拆解,通过各种不同的方式去寻找最佳答案,而不是像传统方式那样一次性随意给出一个结果。随着模型变得更加复杂,生成的token数量显著增加了10倍。为了保证模型的响应速度,使其具备良好的交互性,避免用户在等待思考的过程中失去耐心,计算速度也必须提高10倍。“因此,最终所需的计算量轻松达到原来的100倍。”

另一家芯片巨头AMD也表达了类似的态度。3月18日,AMD董事会主席兼CEO苏姿丰亮相在北京举办的AMD AI PC创新峰会。她在发言中表示,AMD最新发布的Ryzen AI Max处理器能够高效运行推理模型,有望解决更复杂的问题,实现更深入的理解以及更自然的交互。苏姿丰还称:“AMD的软件开发人员一直专注于优化DeepSeek,每隔几天就能看到性能的提升,这充分说明了推理技术还处于非常早期的阶段。”

在黄仁勋看来,随着人工智能的不断扩展,推理将成为未来十年最重要的工作负载之一。他认为很多人忽视了推理背后的计算问题:一方面,人们希望AI能够生成更多的token,使其变得更加智能;另一方面,又要平衡回答问题的时间,防止用户因等待过长而离开。黄仁勋将新时代的计算机比作AI工厂,是token的生成器。他强调,这个工厂必须以极高的效率和性能运作,因为一切都将直接影响AI服务质量、收入和盈利能力。

芯片路线图再更新,却带不动股价

黄仁勋有一套经典的计算理论,即在AI和加速计算领域,“买得越多,省得越多”,因为采用英伟达的技术能够帮助企业节省成本。当推理成为模型进化的新范式时,黄仁勋在最新演讲中又添上了后半句,“现在甚至更好,买得越多,赚得越多”。

以此次预告将在今年下半年推出的下一代Blackwell Ultra芯片为例,英伟达明确表示该系列产品是为了AI推理时代铺平道路。据介绍,集成了Blackwell Ultra的GB300服务器在运行DeepSeek – R1模型时,每秒可以处理1000个tokens,而使用Hopper芯片的前一代服务器每秒仅能处理100个tokens。由于Blackwell Ultra单位时间内能够生成更多内容,这让AI工厂的收入机会也增加了50倍。

黄仁勋GTC演讲释放信号,英伟达在AI推理时代能否领先?,英伟达GTC大会:黄仁勋畅谈AI愿景,股价却难挽颓势

图片来源:英伟达

在GTC大会上,黄仁勋还披露了更多未来几代GPU的性能细节。其中,以暗物质发现先驱、天文学家命名的Vera Rubin芯片将在2026年下半年发布。Vera Rubin由名为Vera的CPU和名为Rubin的GPU组成,而Rubin又是由两块GPU组成的单独GPU。当和Vera搭配使用时,Rubin可以在运行模型时处理每秒50千万亿次浮点运算,比当前Blackwell芯片每秒20千万亿次浮点运算的速度要高出1.5倍。

根据英伟达路线图,2027年下半年将继续推出下一代Vera Rubin Ultra芯片。该芯片实际将包含两个连接在一起的Rubin GPU,性能翻倍提升至每秒100千万亿次浮点运算。黄仁勋还首次公开了Vera Rubin之后的下一代架构Feynman,计划将在2028年面世,但未给出关于Feynman的更多技术细节。

黄仁勋GTC演讲释放信号,英伟达在AI推理时代能否领先?,英伟达GTC大会:黄仁勋畅谈AI愿景,股价却难挽颓势

图片来源:英伟达

为了进一步证明在后DeepSeek的推理模型时代,英伟达也将占据领先地位,在GTC上还释出了一款开源的推理服务软件Dynamo。黄仁勋表示,这个名字象征着工业革命时代的“发电机”,希望在推理成为AI主流的背景下,该软件能用最低的成本和最高的效率加速AI推理模型,为部署此类模型的AI工厂最大程度地创造收入。英伟达举例称,在GB200上运行DeepSeek推理模型时,Dynamo可以帮助将每个GPU生成的token数量提高30倍。

然而,尽管黄仁勋在近两小时的演讲中畅谈了英伟达的未来,但受累于对关税、经济衰退等不利因素的担忧,他的演讲还是没能挽回投资者的信心。英伟达当日股票收报115.43美元/股,较前一日下跌3.43%。今年以来,该股已累跌16.54%。

这样的市场反应或许也在黄仁勋的意料之中。他在演讲中介绍芯片路线图时提到,大家的常见反应都是,“嗯好的,接下来呢?”他强调,对AI基础设施的建设不像买一台笔记本电脑那样简单,这涉及到土地、电力、资本支出、工程团队等多个方面,需要多年的规划和布局。因此,英伟达会对外公布未来两三年内的路线图,而不是突然给市场一个惊喜。

本文围绕英伟达GTC大会展开,介绍了黄仁勋对AI的展望、公司在AI基础设施的布局以及芯片路线图的更新等内容。黄仁勋强调推理将成为未来十年核心工作负载,英伟达也推出了相关芯片和软件来应对。然而,受关税、经济衰退等因素影响,英伟达股价下跌,市场反应未达预期。但黄仁勋认为AI基础设施建设需长期规划,不能一蹴而就。

原创文章,作者:Ambitious,如若转载,请注明出处:https://www.yanghehb.com/865.html

(0)
AmbitiousAmbitious
上一篇 2025年3月19日
下一篇 2025年3月19日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注