史上最大泡沫正在失控?

10月底,有168年历史的美国《大西洋月刊》发布了一篇文章,题为《人工智能的崩盘将如何发生》,作者为Matteo Wong和Charlie Warzel。

首先,是美国正在成为一个“英伟达国家”,近些年美国经济的繁荣,有92%都是由注入人工智能的巨额资金驱动的。

要么是一个不需要人类的未来,人类失去工资,仅靠银行里的余额生活。要么是一个史无前例的巨大泡沫。

人工智能,是近几年来全球经济最大的“宏大叙事”,算力成本的疯涨,数据中心建设的巨额投资,为人类是上最大规模的资金空转提供了信用背书。

半个世界的资本在下注,如滚雪球一般的扩大这个叙事,为了规模而追求规模,如同一场21世纪的。

与此同时,巴菲特的持仓降到了历史低点,日本首富孙正义清空了英伟达的股票。近年来风头极劲的“硅谷风投教父”彼得·蒂尔也在7-9月卖光了英伟达的全部持股。

11月6日,月之暗面发布了新一代模型“Kimi K2 Thinking”。除了它的性能,可以比肩一众美国前沿的AI模型,引发了热议外,还因为同时曝出的这款新模型的训练成本——460万美元,更是掀起了新的讨论热潮。这比年初DeepSeekV3披露的训练成本560万美元,还要更低。

在美国,一个大型AI大语言模型的训练成本,动辄要花几千万美元、几亿算力小时,与中国最成功的AI大语言模型相比,成本往往能相差近10倍左右。

虽然,月之暗面创始团队最近有出面回应:“460万美元不是官方数据。训练成本很难计算,因为其中很大一部分用于研究和实验。”但这依然没有否认一个事实,中国最好的AI大语言模型训练成本,相比美国要低出一个数量级。

就在Kimi K2 Thinking发布后两天,甲骨文宣布达成了一笔高达180亿美元的数据中心融资交易。而在今年8月,OpenAI的CEO奥特曼则宣布,未来公司将投入数万亿美元夯实AI基建。

CNBC预计,到2027年,美国将在数据中心上投入近7000亿美元,而相比之下,中国一众AI玩家,包括阿里巴巴、腾讯、字节跳动和百度,合计预期投入不到800亿美元。——两者相差距近10倍,这和我们前面说到的中美两国AI模型训练成本的差距相当。

DeepSeekV3出现时,包括马斯克、奥特曼在内,美国的AI界基本是不相信的,要么认为中国的团队在训练成本数据上造了假,要么认为DeepSeekV3玩“蒸馏”,或者技术上剽窃了美国,从而降低了成本。

直到DeepSeekV3团队,将一篇又一篇的原创论文共享出来,并逐步分享自己的训练方法,才逐渐让美国那边的专家和CEO们一个个哑口无言、目瞪口呆。

这次,Kimi K2 Thinking的发布,被认为是又一次“DeepSeek时刻”。它也某种程度上,进一步坐实了中美在生产同等性能的大语言模型时的成本差距。

所以Kimi K2 Thinking发布后,优秀的性能得到迅速认可的同时,已没有人再去质疑它的数据是否造假,以及技术上是否投机取巧了。

相反,大部分美国AI界从业者、投资者,已经直接或间接承认,美国AI大语言模型训练成本虚高。也就是说,现在美国AI界已有共识,是自己的成本控制有问题。

只不过,这问题是怎么形成的,又该如何解决,目前还没有个统一的答案,但显然,靠诋毁和污蔑中国这个对手,是行不通了。

比如,Hugging Face联合创始人Thomas Wolf 发出灵魂拷问:“我们是否每隔几个月就要经历一次‘DeepSeek 时刻’?”他也坦诚:“Kimi K2 Thinking发布后,已成为该平台上最受开发者欢迎的模型。”

那么,如果承认美国AI模型训练成本确实过高,那就有必要搞清楚,那些多出来的钱都花在哪了?我们来简单捋一捋吧。

首先,美国AI模型训练成本,最大的一块支出,明眼人都看得出来,就是GPU/TPU集群、服务器、网络设备等硬件的巨额投入。

以英伟达A100 GPU为例,单块售价约0.6-1.1万美元,而训练GPT-4模型用了超过2.5万块GPU,如果全部采用采购而非租赁模式,光GPU采购成本就超过2.5亿美元。

这还没算配套服务器,一般每台服务器搭载8块A100 GPU,每台服务器成本约20万到30万美元,我们取个中位数25万美元/台,训练GPT-4就需要3125台服务器,约7.81亿美元。

另外为了连接3125台服务器进行协同计算,需要超高速的InfiniBand网络设备(交换机、线缆等)。这部分成本可能达到数千万至一亿美元,训练GPT-4估算为 $7500万美元。

所以训练GPT-4总的硬件成本是GPU成本+服务器成本+网络成本,简单算一下吧:2.5亿美元+7.81亿美元+0.75亿美元=11.06 亿美元。

当然,OpenAI的GPT-4采用云服务租赁模式,硬件购买成本主要由微软承担,截至目前,微软持有OpenAI约27%股份。

Meta为了训练Llama 4,采购了35万枚H100芯片,即使考虑大宗购买优惠,这也是一笔数十亿美元的支出。H100芯片比A100芯片更优,当然也更贵,大约为2.5万到4.5万美元/张。

更要命的,是现在硬件更新迭代非常快。AI芯片的生命周期仅2-3年(如V100→A100→H100),而大模型训练周期常常跨越硬件换代周期,导致设备提前报废率超过40%。

最近就连微软的CEO纳德拉也抱怨,公司现在囤积了成堆的GPU芯片,却因为缺电、缺空间,只能闲置在机房里。所以很有可能,大量GPU芯片还没来得用,就过时了。

要知道,微软是OpenAI的金主,主打一个不差钱。可现在,面对像流水一样狂泄不止的训练成本,也开始有点肉疼了。

大模型训练是名副其实的耗电巨兽。以GPT-4类模型为例,其完整训练周期的能耗约为700-1000 MWh,相当于约10000户美国家庭一个月的用电量,直接电力成本约10-15万美元。

耗电意味着发热,所以又要冷却,而冷却系统能耗同样惊人。实际上,冷却系统能耗,占整个数据中心总电费的约40%。冷却需要淡水,微软数据中心训练GPT-3直接耗水约70万升,相当于40000人一天的饮水量。

为了冷却,Meta将数据中心设在北极圈附近,微软尝试过海底数据中心。——我们国家现在有“东数西算”工程,就是将数据中心布局在气候凉爽、清洁能源丰富的西部地区,比如贵州。总之,一冷一热都是钱。

训练AI模型,需要大量“投喂”内容数据。可数据,并不是免费的,尤其是优质内容数据。而这也就是为何,像《华盛顿邮报》《纽约时报》都说要告包括OpenAI在内的一众AI公司,原因就是他们偷了人家记者辛辛苦苦花了巨大成本撰写的优质内容。

而且,英文互联网上高质量、无重复、合规可用的文本数据总量约为3-5万亿词元,而当前AI大模型的训练已使用了其中大部分。这就又出现了数据枯竭现象,导致每增加一单位优质数据的边际成本呈指数级增长,高质量专业领域数据的获取成本已从2020年的每百万词元5-10美元上升至2024年的50-100美元,增幅达10倍。

数据成本,还有一块是数据标注成本。数据标注就像是教AI认世界的“家庭教师”。它通过给原始数据贴上各种标签,让AI模型能够理解和学习这些数据,从而变得“聪明”起来,通常包括数据集设计、数据清洗、标注、质量检验等多个环节。

以人类反馈强化学习(RLHF)为例,高质量的偏好对比数据集构建,通常需要专业知识和严格质控,平均标注成本为每条对比数据2-5美元。

ChatGPT训练过程中使用的人类反馈数据集成本,估计超过700万美元,占其初期训练总成本的12-15%。不便宜了。

OpenAI顶级研究员年薪达200-300万美元,超过华尔街投行MD薪资水平。谷歌DeepMind团队人均研发成本120万美元/年。

就这么贵了,AI界的人才,各大公司还频频开出天价工资抢着要。而这种军备竞赛式的人才储备,更进一步推高了人才成本。

比如,为了得到24岁AI研究员马特·戴特克,Meta开出4年2.5亿美元的薪酬包,其中首年1亿美元。还有苹果基础模型负责人庞若鸣,也被Meta开出的2亿美元的薪酬包挖走。2025年6-7月,Meta还从OpenAI挖走至少11名核心研究人员,包括多名华人科学家,并为部分研究员提供1亿美元签约奖金,并提出可达3亿美元的四年总薪酬包。

除了上述显而易见的成本外,其实AI模型训练,试错成本也不容忽视,据说大模型训练失败率约为35-50%,单次超参数调优实验消耗可达50-100万美元。

另外,现在全球范围内对于模型训练数据都很敏感,所以要获取的话,还得符合当地的法律法规,为合理合法获取、存储和处理数据,就需要花费额外成本,而且并以为这是小数目,据麦肯锡全球研究院估计,完整的数据合规体系建设与维护成本已占大型AI项目总成本的8-12%,且这一比例仍在上升。

目前来看,AI模型昂贵的训练成本,一时半会下不来就算了,在未来可见的范围内,甚至还会呈几何数增长。

比如Anthropic CEO就预测,他们公司目前正在训练的模型成本接近10亿美元,但到2026年,这一成本可能飙升至50亿或100亿美元。未来三年内,AI模型的训练成本可能达到1000亿美元。

——前段时间,黄仁勋跑去韩国推销AI芯片,而韩国人也很兴奋,各种欧巴、拍照又喝交杯酒啥的。但很多人给他算过,就按目前AI大语言训练所需要的电力规模来看,如果真要搞,得花掉韩国整个国家1/10的电力。而且我们都知道,电力系统建了就要用,否则就浪费了。而AI训练的电力系统可不是一直开着的。换句话说,电力系统的沉没成本非常高。所以总的来说,韩国人除非日子不想过了,才会去搞这玩意。

黄仁勋为啥老是忧心忡忡丢掉中国市场?因为老黄心里明白,AI这东西,大概率,未来也就中美两国玩得起。

前段时间,他的一些话,弄得特朗普政府某些人有点不高兴了。因为英国《金融时报》AI未来峰会上,他说中国将赢得人工智能竞赛。

他为什么要说这话?他的说法,是西方现行的技术封锁,只会“刺激中国的创新和规模”。当然更重要的理由,他还是担心美国的政策,阻碍他获取中国市场。

不过他的话对特朗普政府没啥用。他过去用了各种夸张的语言赞美特朗普,也没用。特朗普就相信禁止最先进芯片对华出口,就能拖住中国AI产业的发展。

美国是个资本主义国家,有非常成熟的市场竞争机制,按理,成本高了,就一定会降下来的,但为什么AI大模型训练成本迟迟降不下来呢?

以OpenAI为例,上半年营收43亿美元,比2024年全年高出约16%,预计全年营收将达130亿美元,但预计的净亏损却将超过200-250亿美元。现在不赚钱倒没事。据说他们内部算过,到2029年,OpenAI实现盈亏平衡,2030年起产生正向现金流,届时年收入目标2000亿美元。

但就这点收入,奥特曼却承诺,OpenAI的目标是到2033年确保250吉瓦的电力供应,总投资额约1.4万亿美元。为什么要这么承诺呢?因为没电,就没法训练AI大模型,而没法训练AI大模型,未来的收入预期就没法实现。

——奥特曼这个承诺,相当于在8年内将美国能源需求提升125倍,而这将超过印度目前的电力消耗量。

所以中美电力差距不是缩小,是不断拉大的。而奥特曼也急,OpenAI向白宫科技政策办公室提交的一份长达11页的文件就鼓励美国政府每年建设100吉瓦的能源产能,也就是说将现在每年新增电力提高一倍。

根据美国能源信息署数据,10吉瓦大约相当于800万美国家庭一年的用电量。所以如果按奥特曼那种电力提升速度的搞法,这算不算我们经常说的“”呢?大家可以自己去判断。

但电力基础设施跟不上,因为规模太大,本就一身债的美国政府必然有心无力,尤其像特朗普政府还不乐意去增加风、太阳能等新能源投资,依赖石化能源,那这块成本也就只能私企自己去承担了。

——为什么AI大模型训练成本如此之高,可私企总是没办法降下来,其实电力基础设施是最为核心的一点。

根据国家能源局发布的数据,2025年上半年中国新增发电装机容量达2.93亿千瓦,其中可再生能源新增装机2.68亿千瓦,同比增长99.3%,约占新增装机的91.5%。这是什么概念呢?根据最新数据,日本的总发电装机容量约为3亿多千瓦。所以中国2025年上半年新增的装机容量,几乎就相当于新增了一个日本规模的电力系统。充足的电力基础设施,可以充分满足企业用电,这块成本将大大降低。

除了基础设施成本外,美国AI私企成本降不下来,还有一个原因,是他们的AI市场,还真不是传统意义上的充分竞争市场,其实现在,也就头部那几家企业在玩。

尤其是AI芯片,英伟达具有绝对主导地位,在全球AI芯片市场的份额超过80%,在高端AI训练芯片领域更是达到90%以上。

而且,英伟达通过CUDA软件生态,积累超过400万开发者、2000个合作伙伴及1.5万个优化应用,形成了开发者-软件-硬件的闭环。

这也就是为何,AI企业的GPU/TPU集群的投入会居高不下。根据哈佛商学院的研究,这块的市场垄断导致了高达40-60%的超额利润,这部分利润实质上是从AI创新主体向硬件供应商的价值转移。

而且,AI芯片贵了,用的起的企业就少了,这又创造出一道只有巨头才能跨越的算力鸿沟。所以目前,美国也就只有谷歌、微软、OpenAI等少数几家公司拥有足够的资金与技术实力开发前沿大模型,这导致市场进一步呈现高度集中态势。

初创企业难以与巨头竞争,被迫转向应用层或细分市场,未来或有突破的,但目前是没看到可以与上述原本就是互联网“寡头”对着干的。所以你说AI是一次技术革命,这可能不假,但大家也发现了,并没有什么新玩家出现。——这跟当年互联网百花齐放的态势,是完全不一样的。

基础设施、垄断,导致企业成本下不来,这都是客观上,还有一个主观原因,是现在美国AI研发,还有一种“军备竞赛”的风气。这是因为,大家都怕落在别人后面,都怕错过一个时代。

像我们上面提到的AI企业在抢夺人才时的投入上的竞赛,就是这方面的表现。其实各大企业不止抢人才,还抢着囤积英伟达的芯片呢?微软CEO为何说有限芯片放仓库里吃灰呢?有一部分原因,就是大家抢性能最好的芯片,就跟某些人抢拉布布一样。

美国科技巨头在AI领域的投入已经达到了万亿美元级别。2025年,仅微软、亚马逊、谷歌和Meta这四家公司的AI资本支出就预计达到近4000亿美元。

就这样投入,各大科技公司还觉得不够呢。现在美国这些企业的共识是,更大的风险不是过度投资,是支出不足。扎克伯格就说过:如果为实现AI AGI而投入的资金数额上判断失误,所要做的也无非就是进行调整。

可以预料,未来各大AI企业的投入是会越来越高的,而且“越高就越光荣”的氛围也有了。就像某些贵妇去时尚名品店购物,只买贵的,越贵越好。

所以现在的情况是这样的,美国在干AI,而AI也在干美国。未来,谁把谁干倒,还说不准。国运之战。

阅读剩余
THE END