本文聚焦于英伟达GB300芯片的相关情况,介绍了其预计推出时间、供应链动态、出货情况、规格更新、功耗与散热设计等内容,同时分析了GB200和GB300 Rack方案放量可能受到的影响因素。
据智通财经APP消息,TrendForce集邦咨询通过最新的AI Server供应链调查发现,英伟达(NVDA.US)将会提前至2025年第二季推出GB300芯片。从整柜式Server系统的角度来看,GB300在计算性能、存储器容量、网络连接以及电源管理等多个方面的性能都比GB200有显著提升。正因如此,ODM需要花费更多的时间来进行测试和完成客户验证工作。
我们来观察一下供应链近期的动态。GB300相关的供应商会在今年第二季陆续开展规划设计工作。具体而言,预估GB300芯片及Compute Tray(运算匣)等将在5月开始投入生产,ODM厂也会同步进行初期ES(Engineering Sample)阶段的样机设计。预计到第三季,机柜系统、电源规格设计、SOCAMM等陆续确定方案并实现量产之后,GB300系统的出货规模有望逐步扩大。
接下来分析一下NVIDIA今年的出货情况。目前,HOPPER平台依旧是出货的主要产品。而新平台Blackwell从第一季开始逐步增加出货量,预计到第三季,整柜系统的出货量将以GB200为主。另外,受DeepSeek效应的影响,近期中国市场对特规版产品H20的需求有明显的提升。
即将登场的GB300有多项规格进行了更新。为了与机柜系统更好地适配,GB300 NVL72的网通设计规格得到了升级,这样可以满足更高频宽的需求,从而提升整体的运算效能。虽然BBU(battery backup unit,电池备份单元)并不是GB300的标准配置,但是随着Server机柜功耗的持续增加,预计客户会更多地采用BBU配置。
在TDP(热设计功耗)方面,2024年NVIDIA的主流机种是HGX AI Server,其TDP处于60KW与80KW之间。目前主推的GB200 NVL72机柜由于运算密度大幅提高,每柜TDP达到了125KW至130KW。TrendForce集邦咨询预估,GB300机柜系统的功耗将会进一步提升至135KW与140KW之间,大多数业者会继续采用Liquid – to – Air(液冷散热)的方式,以此来确保散热效果。
关于散热零部件的设计,目前GB200的Cold Plate(水冷板)采用的是搭配一颗CPU和两颗GPU的整合模块形态。到了GB300,将从整合模块改为各芯片独立搭载Cold Plate,这会提高Cold Plate在Compute Tray(运算匣)中的价值。在QD(水冷快接头)方面,由于Cold Plate模块变为各自独立,QD的用量将会大量增加。GB200的QD供应商主要是欧美业者,预计到GB300推出后,会有更多的厂商加入到供应行列中来。
TrendForce集邦咨询指出,预计今年GB200和GB300 Rack方案的放量情况会受到几个因素的影响。一方面,DeepSeek效应仍在持续,AI Server的主要客户CSP会更加注重AI投入的成本与效益,有可能会转向自研ASIC或者设计相对简易、成本较低的AI Server方案。另一方面,GB200和GB300 Rack供应链能否按时完成准备工作也存在不确定性,后续的实际供应进度以及客户需求的变化都还有待进一步观察。
本文围绕英伟达GB300芯片展开,介绍了其预计推出时间、供应链动态、出货情况、规格更新、功耗与散热设计等多方面内容,同时指出GB200和GB300 Rack方案放量可能受客户成本考量和供应链准备情况等因素影响,未来AI服务器市场发展态势充满变数。
原创文章,作者:Delilah,如若转载,请注明出处:https://www.yanghehb.com/560.html