谷歌新算法有多强?数学界“铁律”能被打破吗?

2025-10-21 08:35:34 作者:Vali编辑部

AlphaEvolve的数学能力让科研圈炸开了锅,有人甚至将其比作围棋界传说中的“神之一手”。

这项由谷歌DeepMind团队联合陶哲轩等顶尖科学家开发的通用科学人工智能,直接刷新了矩阵乘法领域的效率纪录。56年来一直保持在49次标量乘法的基准值,现在被改写为48次。这个看似微小的数字变化,背后却是算法效率的重大突破。

在谷歌内部测试中,这项技术成功将Gemini架构的大型矩阵乘法运算加速了23%,使训练时间缩短1%,同时还将FlashAttention提速32.5%。这些数据背后,是AlphaEvolve对传统算法范式的颠覆。

那么这项技术到底有多牛?它又是如何做到的?让我们从科研人员的实战经验出发,看看这项AI技术如何改写数学计算的规则。

让AI自由探索数学世界

AlphaEvolve的核心优势在于打破了传统算法设计的思维定式。它不再依赖人类工程师的经验法则,而是像探险家一样在数学领域自由探索。

这项技术的诞生源于谷歌两年前开发的Alpha Tensor项目。这个强化学习系统虽然能发现更快的算法,但仅限于布尔矩阵领域。为了突破这个限制,研究团队在Alpha Tensor基础上引入了进化算法,让AI在更广阔的数学空间中寻找最优解。

传统算法设计往往受制于对称性陷阱,把搜索空间局限在局部最优解。而AlphaEvolve通过完全放开限制,让AI在复数矩阵乘法领域展开探索,意外发现复数算法在实数域同样有效。这种突破性发现,让算法效率实现了质的飞跃。

不过,这项技术也存在局限。当面对更大规模的矩阵运算时,AlphaEvolve的通用性反而成为短板。研究人员指出,这可能是因为更大矩阵需要特定的归纳偏置来缩小搜索空间,而AlphaEvolve的泛化能力在此处表现出不足。

但不可否认的是,这项技术的开箱即用特性,让科研人员看到了全新的可能性。它不仅能发现数学规律,还能直接应用于谷歌的计算堆栈,为实际应用提供直接价值。

核心技术原理揭秘

AlphaEvolve的创新之处在于它像“生成生成器”的机制。这个系统不仅能设计算法,还能优化算法的设计过程。研究人员透露,这项技术的高级架构是一种进化算法,它能自动评估代码段的优劣并持续迭代优化。

在具体应用中,系统会将生成的代码片段交给大语言模型进行深度分析。这种人机协作模式,让算法优化既保持了灵活性,又具备了深度理解能力。

这项技术的实现离不开Gemini大模型的支持。Gemini Flash负责快速处理大量数据,Gemini Pro则负责深入挖掘潜在规律。这种双模型协作机制,让AlphaEvolve在算法设计和优化中实现了效率与深度的平衡。

进化算法框架是这项技术的核心。借鉴“适者生存”理念,系统会对生成的代码进行适应度评估,保留表现优异的代码并持续优化。这种迭代机制让算法种群的整体性能不断提升,逐渐逼近最优解。

研究人员特别提到,进化算法不仅用于筛选算法,还应用于优化提示词。在改进特定问题前,系统会先对提示词进行优化建议,再从中挑选最合适的版本。这种闭环优化机制,让算法设计更加精准高效。

自动化评估系统是这项技术的重要组成部分。通过多维度指标设定和自动化测试,系统能全面量化评估算法性能。研究人员举了一个具体例子:在问题定义中内置时间约束,只关注能在10分钟内取得进展的搜索算法,这种精准的筛选机制大大提升了效率。

异步分布式运行架构让这项技术具备了强大的计算能力。在进化算法框架中,不同算法可以在异步分布式架构下并行进化。每个计算节点负责种群中的一部分个体,这种分工协作模式让计算效率大幅提升。

从算法到模型的闭环优化

两位核心研究人员在总结中指出,AlphaEvolve的性能直接受益于基础语言模型的提升。当前采用的混合模型策略,让算法发现效率与模型性能形成正相关。未来通过进一步提升基础模型能力,这项技术的潜力将被充分释放。

当前已初步实现递归自我改进。当改进后的算法应用到基础模型中,将形成一个自我优化的闭环。这种自我增强能力,让AI系统具备了持续进化的能力。

系统在资源消耗方面也表现出高度灵活性。简单问题能即时解决,复杂问题如矩阵乘法则需要数百小时计算。这种智能匹配机制,让资源投入与问题难度完美契合。

未来发展方向是保持人机协作的同时提升自动化水平。通过优化算法设计流程,逐步减少人类主导的环节,让AI系统在更多领域发挥主导作用。

这项技术的出现,让科研人员看到了新的曙光。它不仅改写了数学计算的规则,更预示着人工智能将在更多领域催生新技术。正如一位网友所说,我们正在开发一项能够催生真正新技术的技术。