卓财商 要闻
热点推荐 DeepSeek没能让算力焦虑消失,硅谷四巨头全在加钱买算力
投稿:一路孤行
2025-02-11 12:52 69 阅读
导读:春节期间,国产大模型DeepSeek-R1横空出世,证明了用更低的成本、更少的算力需求,就可以实现世界一流的模型性能水平。R1的出现似乎打破了大模型“烧更多的钱买更强的芯片,换来更优性能产品”的传统路径。1月27日,英伟达股价单日下跌近17%。

春节期间,国产大模型DeepSeek-R1横空出世,证明了用更低的成本、更少的算力需求,就可以实现世界一流的模型性能水平。
 
R1的出现似乎打破了大模型“烧更多的钱买更强的芯片,换来更优性能产品”的传统路径。1月27日,英伟达股价单日下跌近17%。
 
不过,在人类通往AGI的路上,算力真的没那么重要了吗?
 
谷歌、微软、meta和亚马逊这硅谷四个科技巨头可能并不这么想。
 
从1月30日起至今,这四家公司接连发布了自己的财报,而在最新的财报中,他们都不约而同的提到:2025年,要花更多的钱来布局算力。
 
谷歌母公司Alphabet对2025年的资本开支目标为750亿美元,相比2024年增加了42%。谷歌表示,在2024年四季度,他们发现人们对AI产品有非常强劲的需求,以至于需求超过了他们的可用容量。因此,他们将努力解决这一问题,确保他们有更多容量——也就是花钱搞更多算力。
 
微软则提到2025财年(财年截至6月份)将在人工智能数据中心上投入800亿美元,原因也与谷歌相同——市场需求持续高于他们的可用容量,需要扩充。
 
微软还在电话会中表示,这样的投入他们甚至还是保守了的,因为“不能一次买太多,因为摩尔定律使硬件每年都会有性能提升,一下子买太多会亏,要把握好节奏。”
 
meta方面,2025年的资本开支预算是650亿美元,相较于2024年增长了66%,扎克伯格表示:“我仍然认为,从长远来看,大力投资资本支出和基础设施上将是一种战略优势。也许我们会在某个时刻得出不同的结论,但现在还为时过早。此时此刻,我会赌注于,能够构建出这种基础设施将成为我们的一大优势。”
 
亚马逊则是在最新一季的电话会中提到2025年的资本开支将达到约1000-1050亿美元,比去年的830亿美元增加了24%,亚马逊首席财务官Brian Olsavsky在财报电话会上表示,这笔资本支出的“绝大部分”将用于AI和云服务AWS。
 
四巨头都在算力上继续增加投入,并不是因为看不上DeepSeek,反而是非常认同DeepSeek。
 
亚马逊首席执行官Andy Jassy表示,推理成本的减少,不意味着总支出会下降,“实际情况并非如此,我们在云计算领域经历过类似情形”。
 
而微软的CEO此前也在X上发博转发了维基百科的“杰文斯悖论”词条来表示他的态度。
 
杰文斯悖论的核心逻辑是:技术提高资源使用效率后,可能会因人类行为的改变或市场反馈,导致总消耗量不降反升。
 
举一个非常简单的例子:随着汽车技术的不断提升,发动机的热效率不断提高,变得越来越省油,但由于效率提高使得用车成本降低,人们会买更多的车、开更远的路,最后反而使得石油的消耗量变大。
 
同理,在AI世界里,DeepSeek就是那台效率更高的发动机,而算力就是汽油,单辆车的耗油量变低了,整个市场的汽油用量却会增多。
 
要知道,DeepSeek-R1虽然训练成本低,但也是遵循Scaling Law(规模扩展法则)的。
 
在Scaling Law之下,我们可以简单粗暴地把模型表现和算力需求看成一个y=ax的正相关函数,过去的模型的斜率a相对较小(效率相对较低),模型表现虽然会随着算力的加大而变得更好,但是增长较慢。DeepSeek的斜率a则相对较大(效率相对较高),模型表现随算力加大而表现变得更好的速度会更快。
 
在这种情况下,你会因为效率更高而减少投入吗?你大概率会因为效率更高而加大投入。
 
所以,与其担心算力过剩,我们似乎更应该关心的是算力和效率我们都有,但是已经没有优质数据可以用来训练了。
 
同样还是拿汽车来举例子,当汽车的油耗(模型效率)和汽油(算力)都充沛的情况下,大家都买了车,最后却发现出行速度没办法进一步提升了,因为路(优质训练数据)不够了,堵车了。

显示全部内容...

优秀品牌推荐