Google DeepMind最近发布了一项突破性技术——AlphaEvolve,这是一种全新的AI编码智能体,它不仅可以自动编写和优化算法,还能进行重要的科学发现。本文将深入探讨这一革命性技术的工作原理、关键特性及其在多个领域的实际应用。
AlphaEvolve: 自进化的算法发现平台
AlphaEvolve的核心定位是一个基于大语言模型(LLMs)、进化算法和自动评估器的通用算法发现与优化平台。与传统AI编码工具不同,AlphaEvolve不仅能生成代码,还能自动评估这些代码的表现,然后根据评估结果调整策略、迭代生成更好的方案,本质上模拟了”算法自然进化”的过程。
AlphaEvolve 与以往 AI 系统的根本区别:
能力特性 | AlphaCode (2022) | AlphaTensor (2022) | AlphaEvolve (2025) |
---|---|---|---|
输入输出 | 自然语言→程序代码 | 结构化任务→乘法算法 | 通用问题→可验证算法 |
执行逻辑 | 一次性生成 | 结构搜索+模型拟合 | LLM生成+自动评估+进化优化 |
评估机制 | 人类评测或静态评估 | 模拟器性能指标 | 自动动态运行+评分反馈 |
适用范围 | 编程竞赛题目等 | 矩阵乘法优化 | 编程、算法、数学、系统优化 |
它的独特之处在于:
- 无需人类逐步编写优化方案,它可以自主提出改进方法、自测、自我改进
- 能够修改整段程序代码,而不仅限于小函数的调整
- 会学习在不同问题下应用不同策略,如复杂问题使用搜索算法,结构化问题采用构造法
- 已经实际应用于Google的大规模生产环境,而非仅仅是实验室概念验证
AlphaEvolve的工作机制与技术架构
AlphaEvolve是一个多组件、多阶段联动的复杂系统,包含以下核心模块和工作流程:

系统组成与流程
AlphaEvolve的整体工作流程由多个模块协同构建:
- 输入阶段:用户提供初始程序代码、需优化的问题定义、以及自动化评估函数(衡量代码性能、输出正确性等)。
- 核心模块构成:
- 提示构建器(Prompt Sampler):组合历史优秀方案与问题上下文,构建复杂prompt,支持人类提供的背景知识、公式、代码片段。
- LLM集成(LLM Ensemble):使用Gemini Flash快速生成大量候选程序,并用Gemini Pro深度优化关键建议,协同驱动”进化”过程。
- 自动评估器(Evaluators):自动运行并评估每个程序的表现,支持多指标优化、级联评估、并行分布式执行。
- 程序数据库(Program Database):储存历史方案、评估分数和修改记录,用于构建新一代Prompt,实现类似”遗传记忆”的演化。
- 进化算法循环:
- 从数据库中选择一个”父程序”,提取其最优结构
- 通过Prompt构建当前任务和上下文
- LLM生成新的代码差异(diff)
- 应用差异形成”子程序”
- 评估器运行并打分
- 若子程序优于父程序,则加入数据库,继续下一轮进化
这一过程不仅演化代码本身,还可以演化prompt和评价指标,实现高度自适应的搜索优化。
突破数学极限:AlphaEvolve的科学成就
AlphaEvolve在数学和算法发现领域已经取得了多项突破性成果,解决了一些长期未解决的开放性问题:
矩阵乘法算法革新
AlphaEvolve最引人注目的成就之一是发现了比1969年Strassen算法更高效的4×4复数矩阵乘法算法。Strassen算法此前被认为是这一领域的最优解,需要49次乘法运算,而AlphaEvolve将其降低到了48次,打破了56年来未被改进的记录。
300年几何难题取得进展
在著名的”接吻数问题”(Kissing Number Problem)上,AlphaEvolve也取得了重大突破。这个问题探讨在n维空间中,有多少个单位球体可以同时与一个中心单位球体相切而彼此不相交。在11维空间中,AlphaEvolve发现了由593个外球组成的结构,提高了此前的下界592,接近已知上界868。

此外,在多个数学领域的开放性问题上也有突破:
- 分析学领域:改进了多个自相关不等式问题的已知最优界值;通过优化傅里叶分析中的不确定性原理构造,略微提高了上界。
- 组合数学与数论:为Erdős最小重叠问题建立了新的上界,超越了此前记录。
- 几何与堆积问题:在多个问题上取得突破,包括优化最大与最小距离比、多边形最优嵌套填充等。
在DeepMind团队测试的50多个开放性数学问题中,AlphaEvolve在约75%的问题上重新发现了最先进的解决方案,在20%的问题上改进了已知的最佳解决方案。
值得一提的是,菲尔兹奖得主陶哲轩也直接参与了AlphaEvolve的数学应用探索工作。


提升Google生态效率:实际应用与成果
AlphaEvolve已经从理论研究走向实际应用,在Google的多个关键系统中产生了显著的效益提升:
数据中心优化
为Google的Borg集群管理系统设计了一种调度启发式算法,已经投入生产使用超过一年,持续回收约0.7%的计算资源。这个算法解决了”搁浅资源”问题(例如内存耗尽但CPU仍可用),生成的代码简单且可读,便于工程师调试和部署。

AI芯片设计协同
AlphaEvolve为Google TPU中的矩阵乘法电路提供了Verilog级别的重写方案,去除了冗余位同时保持功能正确性。这一建议已被采纳进入未来一代芯片设计流程中,预计将显著节省芯片面积与能耗。

AI模型训练加速
在AI训练方面,AlphaEvolve也展现了惊人的优化能力:
- 优化了Gemini模型训练中的矩阵乘法内核,加速23%,整体训练时间缩短1%
- 对FlashAttention内核的低级GPU指令进行重构,速度提升达32.5%
这些优化不仅提高了性能,还大大减少了内核优化所需的工程时间,从专家数周的努力缩短到自动实验的数天,使研究人员能够更快地进行创新。
AlphaEvolve的未来展望与影响
作为一个通用算法发现与优化平台,AlphaEvolve的应用前景远不止于当前已实现的成果。它代表了AI辅助科学发现和算法设计的新范式,未来有望在更多领域产生深远影响:
- 扩展到更广泛的科学领域:虽然目前主要应用于数学和计算机科学,但其通用性意味着它可以应用于任何能够被描述为算法并自动验证的问题解决方案,包括材料科学、药物发现等。
- AI与人类专家的协作新模式:AlphaEvolve提供了一种AI和专家协作的新模式,AI负责探索大量可能性并提出创新方案,人类专家则负责验证和理解这些方案。
- 算法优化的民主化:随着这类技术的发展,高级算法优化可能不再局限于少数专家,更多开发者和研究人员能够利用这些工具提升自己工作的效率。
- 潜在的经济与环境影响:仅在Google数据中心的应用已显示出0.7%资源回收率,如果这种技术被广泛采用,将为全球数据中心节省大量能源和资源。
AlphaEvolve目前已开放早期测试邀请,不仅限于学术界,对希望在算法优化领域探索的各行业用户都开放申请,预示着其将在更广泛的应用场景中发挥作用。
它标志着计算机科学中的一个新里程碑——AI系统不再仅仅是被人类程序员编程的工具,而是能够自主发现和改进算法的合作伙伴,这种转变或将如同AlphaGo之于围棋那样,在编程领域引发一场革命性的变革。