(原标题:一周市值涨超1个高通近10个惠普 英伟达凭什么赢麻了?)
英伟达(NVDA)涨疯了。
距离英伟达财报发布才过一周,英伟达股价已经涨了15.85%,总市值飙升了3718亿美元,超过一个高通(QCOM,截至5月30日市值2286亿美元)相当于10个惠普(HPQ,截至5月30日375亿美元)。
截至发稿,英伟达总市值为2.72万亿美元,在美股市值中排名第三,离苹果的2.93万亿美元市值只差2000亿美元,还有3600亿美元就能追上微软3.08万亿美元的市值登顶美股。
从财报来看,2025财年的第一季度,英伟达营收达260.4亿美元,同比增长262%;净利润148.8亿美元,同比上涨628%,预计第二季度营收在280亿美元左右。在占比最高的数据中心板块,英伟达第一季度营收、创纪录达到226亿美元,环比增长23%,同比增长427%。英伟达一季度整体毛利润率高达78.9%,预计全年毛利率预计在70%左右。
同时,英伟达宣布“1拆10”的拆股计划将在6月7日生效,当天盘后英伟达股价跳涨6%,首次突破每股1000美元,创下历史新高。
然而,在中国市场,英伟达却不如财报表现的“硬气”。在此次财报释出的第二天,有外媒爆料称为应对更为激烈的竞争,英伟达已经下调了专门面向中国市场的H20系列芯片的价格,搭载八组芯片的服务器每台售价约介于110万元-130万元。
随后时代周报记者就此消息同步向英伟达方面核实,截至发稿尚未得到具体回应。
不过据时代周报记者向多家人工智能、芯片制造相关企业了解,让英伟达“强的可怕”的不仅是顶级的GPU,更关键的因素是生态。目前大部分企业还是用之囤积的H100和A800,因为性能问题多家企业并没有采购H20,但有企业坦言,英伟达花几十年时间积累而来的芯片生态可能是目前绕不开的道。
“一片芯片算力不足,大不了就多花钱多买几片。”有业内人士提到,尽管供应中国市场的英伟达芯片在性能上大打折扣,但有部分企业仍愿意冲着生态购买。
而目前国内芯片厂商正在尝试从优化算法、升级服务、探索开源架构等多个方向突围。
在中国市场“尽力而为”
“We'll do our best.”
在一季度的财报电话会议上,黄仁勋谈及中国市场。他表示,由于技术出口的限制,且中国市场的竞争也正在变得更加激烈,英伟达在中国市场的业务相较于过去有所下降。英伟达仍承诺尽最大努力服务客户和市场,并尽其所能提供最佳服务。
自年初英伟达面向中国市场推出H20以来,关于此的争议就一直未平复。
H20是英伟达在海外售卖的H100的“阉割版”,算力约只有H100的不到15%。路透社此前报道称,H20在部分特定场景下的性能表现逊于国产AI芯片华为昇腾910B,定价却与910B几乎一致。
这也使H20在国内的销量遇冷。据此前《华尔街日报》援引知情人士消息,阿里巴巴、腾讯、百度、字节跳动等中国大客户今年向英伟达订购的芯片数量将远远少于此前原计划购买的英伟达高性能芯片。
英伟达似乎也在寻求改变。近日路透社独家报道称,在某些情况下,英伟达H20芯片的价格将比华为昇腾910B低10%以上。
尽管英伟达方面并未向时代周报记者核实这一消息,但英伟达公开向外传达的信息还是想积极争取中国这块蛋糕。
在2022财年、2023财年,中国市场(含大陆、香港和台湾)营收占英伟达全球营收的比例分别高达58%和47%。到了2024财年,这一年是生成式AI的爆发年,中国市场的比例反而下降到39%。
图源:截图自英伟达财报
黄仁勋曾不止一次在公开采访中强调中国市场的重要性。2024年他更是到访了英伟达在深圳、上海和北京的办公室,并与员工共庆新年。
5月26日,据中国台湾媒体报道,黄仁勋携夫人抵达中国台湾,准备参加台北国际计算机展(COMPUTEX 2024),同时将访问包括鸿海、广达、台积电在内的供应链公司。他此前受访时谈到,英伟达芯片中有大量的零部件产自中国,而供应链的全球化很难被打破。
英伟达十分注重培养中国的生态“朋友圈”。在近日于澳门举办的BEYOND Expo 2024上,英伟达便设了专场宣讲其初创加速计划。
据了解,OpenAI在6年前还是英伟达初创加速计划的一员,而如今,由OpenAI带来的AI红利正在大力反哺这家公司。
据英伟达初创生态中国区总监娄明介绍,截至2023年底,全球共有19000多家公司加入该计划,中国有超2000家公司成为英伟达初创加速计划会员,在全球范围内排名第二。
图源:时代周报记者摄
在这场宣讲中,英伟达还多次提到了新一代 AI 芯片架构Blackwell。这是今年3月在GTC大会上公布的产品,相较于前代产品H100有着惊人的提升,是Hopper的30倍。
不过,关于Blackwell在中国市场的发布计划尚未披露。有接近英伟达人士向时代周报记者表示,根据出口管制的规定,目前Blackwell暂时还不适用于国内。
绕不开的英伟达?
英伟达曾在中国市场占据极高的市场份额。今年初,调研机构TrendForce分析师FrankKung表示,中国云计算企业目前约80%的高端人工智能芯片来自英伟达。
随着美国芯片管制的收紧,这一占比将降低。但FrankKung预估,未来五年这一比例仍达50%-60%。
可是为什么面对性能大幅下降的英伟达H20,仍有企业愿意买单?
时代周报记者在采访了国内多家人工智能相关企业及芯片制造商后,得到了几乎一致的回答:生态。
这里的生态指的是CUDA(Compute Unified Device Architecture),即英伟达提供给开发人员的编程工具。
2006年,英伟达推出了CUDA的第一个版本,标志着GPU被正式引入通用计算领域。在诞生之初,CUDA提供了一种新的编程模型,允许开发者利用英伟达的GPU进行高性能计算,这在当时是一项革命性的技术,因为它使得GPU不再仅限于图形渲染,而是扩展到了更广泛的计算任务。
但当时,业界还没有看到CUDA的价值。黄仁勋力排众议,投资,开发、维护并推广CUDA,直到6年后才看到了曙光。
2012年,多伦多大学的 Alex Krizhevsky 在2012年的 ImageNet 计算机图像辨别比赛上夺得冠军,这让NVIDIA GPU 一炮而红。
此后,CUDA生态快速迭代壮大,据华泰证券研报数据,截至2020年,全球CUDA开发者数量已经达到了200万,到2023年,该人数已达400万,包括Adobe等大型企业客户。
截图自英伟达官方网站
这也成为英伟达最强的护城河。一位做AIGC视觉研究的科技公司主理人告诉时代周报记者,用户很难有动力迁移出CUDA,迁移意味着要重新写代码,这需要花费很多的时间和金钱。
某机器人公司负责人也坦言,CUDA由于英伟达多年的研发调整和优化,且已经过广泛开发者的试验,目前生态最为稳定。
有芯片行业内人士告诉时代周报记者,前几年,业内有人尝试将CUDA上的代码转译出来,运行在自己的芯片上。例如,一部分海外开发者尝试在英特尔、AMD硬件上运行CUDA应用的软件项目,构建了ZLUDA项目。该项目尝试打破英伟达的CUDA生态壁垒,允许CUDA应用无需修改源代码即可在第三方硬件上运行,并一度得到英特尔、AMD的支持。
但这种做法容易引发版权和知识产权的问题。早在2021年,英伟达就禁止其他硬件平台使用模拟层运行CUDA软件。今年2月,一名德国工程师在安装CUDA 11.6时发现,英伟达在最终用户许可协议 (EULA) 的限制类目中新增了条款:“不得对使用SDK元素生成的任何输出部分进行逆向工程、反编译或拆解,以将此类输出工件转换为非NVIDIA平台。”而那时,ZLUDA项目运转已举步维艰,并于年初开源。
上述芯片行业内人士进一步表示,也有一部分企业选择使用开源架构,例如英特尔的oneAPI、AMD的ROCm等,但是开源架构通常比不上CUDA的性能。
如今,英伟达更欲进一步扩大其在软件层的野心。黄仁勋曾在过去的采访中反复重申,英伟达是一家平台公司,它区别于任何一家仅提供芯片的厂商。
“英伟达不仅仅是做硬件,我们是一个全栈式的平台供应商。”英伟达中国区高级技术市场经理施澄秋在BEYOND Expo 2024活动上表示。在他的描述中,英伟达构建了从芯片、传输到软件的算力系统或解决方案,基于此,创业者只需关注如何训练好自己的算法即可。此外,英伟达也尽可能地提供算法层面的支持,例如针对不同合作伙伴在不同细分的垂直应用市场,英伟达提供了各式各样的预训练模型。
在CUDA之外,英伟达还在着手培养另一个新的生态。2020年,英伟达宣布推出一款新型处理器DPU,及以为DPU量身定做的软件框架DOCA。DOCA 是一种新型的数据中心基础架构处理器体系结构,可实现具有突破性的网络、存储、安全性能。
在AI应用领域,GPU和CUDA的价值已经得到市场验证,DPU和DOCA或将成为英伟达又一新增长点。NVIDIA全球副总裁,中国企业营销负责人刘念宁曾公开表示,在生成式 AI 时代,DPU 是企业构建加速计算平台、AI 工厂的关键。
据英伟达方面公布数据,2022年全球DOCA开发者中将近一半来自中国,而截至目前中国CUDA和DOCA的开发者数量已经超过100万了。
“DOCA现在还是小baby,可是今天的DOCA就跟20年前的CUDA一样。”英伟达网络市场部相关负责人表示,如果将企业购买CPU、GPU等比喻为买赛车,那么CUDA、DOCA就如同赛车的轮子,只有赛车的轮子够强够壮,才能承载起赛车在不同路面和更远距离上奔跑。
国产芯片加速跑
“中国和美国(发展AI)最大的差距在于算力,基本上是10倍左右的差距。”在BEYOND Expo 2024上,商汤科技联合创始人徐冰如是说道。
他认为,美国拥有绝大多数最尖端的、高性能英伟达GPU,全球大量国家和企业争相购入,在过往10年人工智能创造了超过2万亿美金的价值,对应的也是英伟达目前的市值。
但徐冰认为,中美之间的算力差距在大量资金投入之下是可以弥补的。一方面,国产芯片在快速发展,另一方面,算力本质上是一种商品,自有的融资属性也较强,它已经出现了房地产类的投资属性,可以通过资金周转、杠杆等,放大投资规模。
同时,中国拥有强大的AI土壤。“中国是全世界唯一一个有可能实现智慧涌现第二级的。”科大讯飞董事长刘庆峰表示。
而需求在哪里,市场就在哪里。事实上,目前国产芯片突围已经看到了一些成效。在时代周报的走访中,部分企业通过“曲线救国”满足自己的算力需求。
例如云天励飞(688343.SH)的自研芯片就是走“算法芯片化”路线,着眼于具体场景。由场景定义算法,再由算法定义芯片,通过自定义指令集、处理器架构及工具链的协同设计,实现算法芯片化。
也有科大讯飞(002230.SZ)这样的企业,通过算法上的调优达到能效的最大化。此前,科大讯飞宣布大模型降价,科大讯飞副总裁王玮接受时代周报等记者采访时,谈到了如何优化成本。
王玮表示,目前讯飞大模型是完全构架在国内自主算力基座之上。今年1月,科大讯飞组建了万卡集群,用的是华为昇腾。
“使用国产算力时,最开始的效率只能达到英伟达的30%~40%,后来在算法、算力、算子库上面不断训练,现在的能效提升很多。当然(成本优化)也包括国家对AI产业提供的电费优惠,利用好这些,然后把整个模型进行调优。”王玮说。
芯片设计服务商,珠海凌烟阁芯片科技有限公司(下称“凌烟阁”)走的是另外的路子。凌烟阁相关业务人员告诉时代周报记者,“在解决算力问题上,我们使用为客户开发的AI芯片,把它做成整机的AI PC box。结合了整机、AI 板卡、软件的算法,推出面向行业的应用,开发出一整套解决方案以提供更多的客户服务,客户可即插即用,降低使用难度。例如,凌烟阁开发的高精度AI-PC伺服器——玄冥一号。”
广东赛昉科技(下称“赛昉科技”)有限公司相关负责人则提供了另一种思路。赛昉科技希望通过基于RISC-V架构的AI芯片,打破现有的市场格局。
据了解,RISC-V是一个开源、免费的指令集架构,是芯片架构在×86和ARM之外的一个新选择。赛昉科技认为,对于国内企业来说,RISC-V是实现中国芯、提升自主创新能力的绝佳契机。就发展趋势及市场前景来看,RISC-V相对于其它的处理器IP都更具有活力及潜力。
当然,通用芯片的研发也刻不容缓,但目前国内能啃这块“硬骨头”的厂商暂时还不太多。