Scaling Laws 的物理边界与新摩尔定律:AI 规模化的终极推演

行业观察封面
行业观察封面

前言
OpenAI 的 Scaling Laws(缩放定律)是过去五年 AI 发展的圣经:数据越多、算力越大、参数越多,模型越强。
但到了 2025 年,这本圣经似乎遇到了挑战。
随着万亿参数模型的普及,我们撞上了三堵墙:能源墙数据墙认知墙

AI 的规模化之路是否已到尽头?还是我们正在酝酿下一场更伟大的跃迁?本文将从物理学、信息论和经济学三个维度,对 AI 的终极未来进行推演。


第一章 能源墙:当 AI 喝干了电网

Sam Altman 曾说:“未来的货币是算力,而算力的本质是能源。” 2025 年,这句话变成了现实的危机。

1.1 焦耳/Token 的极限

  • 现状:训练一个 GPT-5 级别的模型,消耗的电力相当于一个小城市一年的用电量。
  • 瓶颈:变压器的容量跟不上 GPU 的部署速度。很多数据中心因为申请不到足够的电力配额,只能让 H100 闲置。

1.2 核聚变与 AI 的双向奔赴

这听起来像科幻,但正在发生。

  • Helion Energy:OpenAI 投资的核聚变公司,承诺在 2028 年为数据中心提供无限清洁能源。
  • AI 优化核聚变:DeepMind 的强化学习算法成功控制了托卡马克装置中的等离子体磁场,让核聚变反应的时间延长了 30%。
  • 结论:AI 制造能源危机,AI 也解决能源危机。这是技术发展的辩证法。

第二章 数据墙:当互联网被“吃空”了

人类历史上产生的所有高质量文本(书籍、论文、代码、新闻),大约有 10-20 万亿 Token。
2024 年底,最先进的模型已经把这些数据学了一遍。
Data Exhaustion(数据枯竭) 是 2025 年最大的恐慌。

2.1 合成数据(Synthetic Data)的拯救

如果人类数据不够,就让 AI 自己造。

  • 教科书级数据生成:让一个强大的 Teacher 模型(如 GPT-5),根据教学大纲,编写高质量的物理题、编程题、逻辑推理题。
  • 自博弈(Self-Play):类似 AlphaZero 下围棋。让模型自己和自己辩论、自己写代码自己测。通过这种内部循环,模型可以在没有外部新数据的情况下,自我进化。

2.2 多模态数据的降维

文字虽然枯竭了,但视频数据几乎是无限的。

  • Video-to-Text:未来的模型训练,将更多依赖 YouTube、TikTok 上的视频。通过让模型“看”视频学习物理规律、人类行为和社会常识,其信息密度远高于纯文本。

第三章 认知墙:逼近人类智能的渐近线

堆参数真的能堆出 AGI(通用人工智能)吗?
2025 年的学术界出现了分歧。

3.1 边际效应递减

实验表明,从 100B 到 1T 参数,模型能力提升显著;但从 1T 到 10T,提升幅度开始变缓。
这像极了芯片领域的摩尔定律后期。我们投入了指数级增长的成本,只换来了线性的性能提升。

3.2 System 2 思维的缺失

目前的 LLM,本质上是 System 1(快思考):基于直觉的概率预测。
它缺乏 System 2(慢思考):基于逻辑的、多步推演的规划能力。

  • 下一代架构:不再是单纯的 Transformer,而是 LLM + Search + Planning
  • Q / AlphaZero 范式*:在推理阶段引入搜索树(Tree of Search),让模型在回答问题前,先在脑子里“模拟”各种可能路径,选择最优解。这不再是 Scaling Laws 的范畴,而是算法范式的革新。

第四章 终局推演:硅基智能的未来形态

基于上述分析,我们对 2030 年的 AI 形态做出终极推演:

  1. 分层智能网络

    • 顶层是少数几个 Super Intelligence(消耗核能、万亿参数、具备 System 2 能力),负责科学发现和战略决策。
    • 底层是无数个 Utility Models(端侧运行、几十亿参数、极低能耗),负责处理人类的日常琐事。
  2. 人机共生进化

    • AI 不会取代人类,而是成为人类的外脑。
    • 脑机接口(BCI)的突破,将把人脑与云端 AI 直接互连,实现带宽的百万倍提升。

结语

Scaling Laws 也许有物理边界,但智能的进化没有边界。
当我们撞上墙的时候,往往意味着新的门就在旁边。
从大航海时代到电气时代,再到如今的智能时代,人类总是在资源匮乏的焦虑中,通过技术爆炸找到新的出路。
这次,也不会例外。


本文档由 Augmunt 前沿技术研究院战略规划组撰写。