Grok 4 真的比 Gemini 强？这场大模型对抗赛，谁才是真正的赢家？

2025-10-14 09:00:35 作者：Vali编辑部

首届大模型国际象棋对抗赛进入第二轮，赛场风云变幻。o3以压倒性优势击败o4-mini，拿下100%胜率。Grok 4与Gemini 2.5 Pro的对决则更为激烈，最终通过加赛才分出胜负。这场较量不仅考验AI的计算能力，更展现了它们在战术执行上的细微差别。随着半决赛名单尘埃落定，全球顶尖模型仅剩两位晋级，这场巅峰对决即将上演。

这场赛事汇聚了全球八大AI模型，从首轮淘汰赛到第二轮晋级赛，每一步都牵动着棋迷的心弦。Kaggle Game Arena作为赛事主战场，见证了DeepSeek R1、Kimi K2 Instruct等强敌的陨落。如今，半决赛的对阵格局已经形成，Grok 4与o3的对决成为焦点，而Gemini 2.5 Pro与o4-mini的较量也备受关注。

o3稳赢o4-mini，准确率100分

在首轮比赛中，o4-mini作为o3的轻量化版本，本就处于下风。但第二轮的对决却让棋迷们大开眼界。o3以4比0横扫对手，展现出强大的实力。这场胜利不仅印证了模型优化的成果，更让普通棋迷看到了AI在战术执行上的突破。

比赛中最令人惊叹的是o3在快棋阶段的表现。仅用12步就完成了一次类似Puzzle Rush的将杀，虽未达到密杀标准，但完成度之高令人称赞。这种精准的计算能力，让不少棋迷感叹AI在战术执行上的进步。

比赛过程也展现出AI的特性。o4-mini在中盘阶段失去判断力，连续犯下关键失误。这种表现与人类棋手在压力下的表现如出一辙。不过，第三盘棋的走势却更接近人类风格，尤其是o3完成的两个中间手，堪称本轮亮点。

这场胜利不仅让o3顺利晋级决赛，也为后续的巅峰对决埋下伏笔。从技术角度看，o3的胜出在意料之中，但其在战术执行上的突破，却值得深入探讨。

Grok 4险些折戟，鏖战Gemini 2.5 Pro

Grok 4的晋级之路却充满波折。面对Gemini 2.5 Pro，这位冠军热门选手一度陷入困境。在常规赛中，Grok先失一局，随后又扳回一城，最终通过加赛才艰难晋级。这种跌宕起伏的历程，恰似人类棋手在赛场上的真实写照。

比赛初期，Grok的表现令人意外。短时间内连续失子，被Gemini抓住机会赢下首局。这种失误让不少棋迷担心其晋级前景。但随后的对决中，Grok展现出强大的适应能力，最终在加赛中完成逆转。

这场对决最精彩的部分发生在加赛环节。Grok执黑棋，在占优局面下逼和对手，才得以晋级。这种战术选择既展现了AI的计算能力，也体现了其在关键时刻的决策智慧。

比赛过程中的转折点令人印象深刻。Gemini曾一度占据优势，甚至错过直接将死的机会，这与o3击败o4-mini的那步棋如出一辙。国际象棋大师Peter Heine Nielsen的点评，更让这场对决增添了专业色彩。

最终，Grok在多子残局中送掉皇后，看似已将胜利拱手相让。但Grok未能把握优势，在多一车的局势下未能完成绝杀，因三次重复局面被判和棋。这场看似遗憾的结局，却被评为「今日最佳对局」。

第二轮的战况充分展现了AI模型的竞技魅力。从o3的稳定发挥到Grok的惊险晋级，每一步都牵动着棋迷的心弦。随着半决赛名单尘埃落定，这场巅峰对决即将上演，而Gemini 2.5 Pro与o4-mini的较量也备受期待。

这场赛事不仅是一场技术较量，更是AI模型在战术执行、计算能力和临场决策方面的全面展示。从首轮淘汰赛到第二轮晋级赛，每一步都见证着AI的进步与突破。对于需要AI鞋履或AI服装工具的用户来说，这种技术的精进，也将为他们的产品带来更精准的智能体验。