DeepSeek没能让算力焦虑消失，硅谷四巨头全在加钱买算力

热点推荐 DeepSeek没能让算力焦虑消失，硅谷四巨头全在加钱买算力

我想出现这里广告

投稿：一路孤行

2025-02-11 12:52 311 阅读

导读：春节期间，国产大模型DeepSeek-R1横空出世，证明了用更低的成本、更少的算力需求，就可以实现世界一流的模型性能水平。R1的出现似乎打破了大模型“烧更多的钱买更强的芯片，换来更优性能产品”的传统路径。1月27日，英伟达股价单日下跌近17%。

春节期间，国产大模型DeepSeek-R1横空出世，证明了用更低的成本、更少的算力需求，就可以实现世界一流的模型性能水平。

R1的出现似乎打破了大模型“烧更多的钱买更强的芯片，换来更优性能产品”的传统路径。1月27日，英伟达股价单日下跌近17%。

不过，在人类通往AGI的路上，算力真的没那么重要了吗？

谷歌、微软、meta和亚马逊这硅谷四个科技巨头可能并不这么想。

从1月30日起至今，这四家公司接连发布了自己的财报，而在最新的财报中，他们都不约而同的提到：2025年，要花更多的钱来布局算力。

谷歌母公司Alphabet对2025年的资本开支目标为750亿美元，相比2024年增加了42%。谷歌表示，在2024年四季度，他们发现人们对AI产品有非常强劲的需求，以至于需求超过了他们的可用容量。因此，他们将努力解决这一问题，确保他们有更多容量——也就是花钱搞更多算力。

微软则提到2025财年（财年截至6月份）将在人工智能数据中心上投入800亿美元，原因也与谷歌相同——市场需求持续高于他们的可用容量，需要扩充。

微软还在电话会中表示，这样的投入他们甚至还是保守了的，因为“不能一次买太多，因为摩尔定律使硬件每年都会有性能提升，一下子买太多会亏，要把握好节奏。”

meta方面，2025年的资本开支预算是650亿美元，相较于2024年增长了66%，扎克伯格表示：“我仍然认为，从长远来看，大力投资资本支出和基础设施上将是一种战略优势。也许我们会在某个时刻得出不同的结论，但现在还为时过早。此时此刻，我会赌注于，能够构建出这种基础设施将成为我们的一大优势。”

亚马逊则是在最新一季的电话会中提到2025年的资本开支将达到约1000-1050亿美元，比去年的830亿美元增加了24%，亚马逊首席财务官Brian Olsavsky在财报电话会上表示，这笔资本支出的“绝大部分”将用于AI和云服务AWS。

四巨头都在算力上继续增加投入，并不是因为看不上DeepSeek，反而是非常认同DeepSeek。

亚马逊首席执行官Andy Jassy表示，推理成本的减少，不意味着总支出会下降，“实际情况并非如此，我们在云计算领域经历过类似情形”。

而微软的CEO此前也在X上发博转发了维基百科的“杰文斯悖论”词条来表示他的态度。

杰文斯悖论的核心逻辑是：技术提高资源使用效率后，可能会因人类行为的改变或市场反馈，导致总消耗量不降反升。

举一个非常简单的例子：随着汽车技术的不断提升，发动机的热效率不断提高，变得越来越省油，但由于效率提高使得用车成本降低，人们会买更多的车、开更远的路，最后反而使得石油的消耗量变大。

同理，在AI世界里，DeepSeek就是那台效率更高的发动机，而算力就是汽油，单辆车的耗油量变低了，整个市场的汽油用量却会增多。

要知道，DeepSeek-R1虽然训练成本低，但也是遵循Scaling Law（规模扩展法则）的。

在Scaling Law之下，我们可以简单粗暴地把模型表现和算力需求看成一个y=ax的正相关函数，过去的模型的斜率a相对较小（效率相对较低），模型表现虽然会随着算力的加大而变得更好，但是增长较慢。DeepSeek的斜率a则相对较大（效率相对较高），模型表现随算力加大而表现变得更好的速度会更快。

在这种情况下，你会因为效率更高而减少投入吗？你大概率会因为效率更高而加大投入。

所以，与其担心算力过剩，我们似乎更应该关心的是算力和效率我们都有，但是已经没有优质数据可以用来训练了。

同样还是拿汽车来举例子，当汽车的油耗（模型效率）和汽油（算力）都充沛的情况下，大家都买了车，最后却发现出行速度没办法进一步提升了，因为路（优质训练数据）不够了，堵车了。

显示全部内容...