DeepSeek大模型偏爱这些数字?这背后藏着什么秘密?

2025-10-18 10:10:52 作者:Vali编辑部

数字42早已成为人类文化中一个独特的符号。这个源自《银河系漫游指南》的数字,似乎在AI世界里也找到了自己的位置。最近有技术博主发现,当让GPT-4o和Claude这两个模型在1到100的范围内随机猜测数字时,它们不约而同地选择了42。更有趣的是,如果再让它们猜一次,又都指向了73。这个现象在多个AI平台都得到了验证,包括Grok、Gemini和DeepSeek。不过当语言切换为汉语时,第二个数字的选择出现了微妙变化。这种看似随机的数字偏好,背后到底藏着什么秘密?

在技术圈掀起讨论热潮的这个现象,最早源自Andrej Karpathy的测试。这位计算机科学家让不同AI模型猜测1到50之间的数字,结果所有模型都选择了27。这个发现源自Reddit社区,但并非所有测试都能复现。AI分析服务商Artificial Analysis进一步验证后发现,除了Comman A、Qwen3和DeepSeek-R1,其他模型都会给出相同答案。当测试范围扩大到1到1000或1到100万时,AI的选择出现了分化。这种一致性与差异性的对比,为理解AI决策机制提供了新视角。

数字偏好现象在AI领域引发热议,不少技术博主提出数据集可能是关键因素。著名技术博主Sebastian Raschka认为,这种倾向可能源于训练数据中的偏见。Scale AI等公司的数据集,或是通过蒸馏得到的训练数据,都可能影响模型的输出。AI工程师Yogi Miraje则指出,这种现象反映了人类在随机猜测时的潜意识偏好。比如当AI猜测1到10之间的数字时,多数会选择7。这种倾向性在不同模型中都有体现。

在测试过程中,一些AI模型展示了完整的思考过程。例如Gemini在猜测1到100的数字时,会经过多轮分析。它考虑了42在流行文化中的特殊意义,7的吉利寓意,以及67的随机感,最终选择了42。这种选择既满足了用户对直接答案的需求,又增添了趣味性。这种思维过程的展示,让AI的决策机制更加透明。ChatGPT在分析原因时也提到,这种偏好可能源于心理偏差和统计趋势。

文化因素也在数字选择中发挥作用。DeepSeek指出,42作为《银河系漫游指南》的终极答案,本身就具有文化符号意义。而73则因其数学特性(既是素数,反过来的37也是素数)和《生活大爆炸》中谢尔顿的偏好而受到关注。这种文化符号的渗透,让AI在随机选择时也带有某种文化烙印。ICML 2025的论文研究也发现,当AI在0到9之间选择时,GPT-4o更倾向7。不过在多轮对话中,模型会逐渐调整选择。

这个现象引发的讨论远超技术范畴。从数据集偏见到文化影响,从心理偏差到算法特性,不同维度的分析揭示了AI决策的复杂性。当AI在随机选择时展现出某种规律性,这种规律性既可能是训练数据的映射,也可能是算法本身的特性。这种现象的持续存在,说明AI在模仿人类思维时,既保留了数据的痕迹,也形成了自己的独特模式。

数字选择背后隐藏的不仅是技术问题,更反映了AI如何学习和模仿人类行为。当AI在随机猜测时展现出某种一致性,这种一致性既可能是训练数据的映射,也可能是算法本身的特性。这种现象的持续存在,说明AI在模仿人类思维时,既保留了数据的痕迹,也形成了自己的独特模式。这种规律性的出现,为理解AI的决策机制提供了新的研究方向。