DeepSeek大模型偏爱这些数字？这背后藏着什么秘密？

2025-10-18 10:10:52 作者：Vali编辑部

数字42早已成为人类文化中一个独特的符号。这个源自《银河系漫游指南》的数字，似乎在AI世界里也找到了自己的位置。最近有技术博主发现，当让GPT-4o和Claude这两个模型在1到100的范围内随机猜测数字时，它们不约而同地选择了42。更有趣的是，如果再让它们猜一次，又都指向了73。这个现象在多个AI平台都得到了验证，包括Grok、Gemini和DeepSeek。不过当语言切换为汉语时，第二个数字的选择出现了微妙变化。这种看似随机的数字偏好，背后到底藏着什么秘密？

在技术圈掀起讨论热潮的这个现象，最早源自Andrej Karpathy的测试。这位计算机科学家让不同AI模型猜测1到50之间的数字，结果所有模型都选择了27。这个发现源自Reddit社区，但并非所有测试都能复现。AI分析服务商Artificial Analysis进一步验证后发现，除了Comman A、Qwen3和DeepSeek-R1，其他模型都会给出相同答案。当测试范围扩大到1到1000或1到100万时，AI的选择出现了分化。这种一致性与差异性的对比，为理解AI决策机制提供了新视角。

数字偏好现象在AI领域引发热议，不少技术博主提出数据集可能是关键因素。著名技术博主Sebastian Raschka认为，这种倾向可能源于训练数据中的偏见。Scale AI等公司的数据集，或是通过蒸馏得到的训练数据，都可能影响模型的输出。AI工程师Yogi Miraje则指出，这种现象反映了人类在随机猜测时的潜意识偏好。比如当AI猜测1到10之间的数字时，多数会选择7。这种倾向性在不同模型中都有体现。

在测试过程中，一些AI模型展示了完整的思考过程。例如Gemini在猜测1到100的数字时，会经过多轮分析。它考虑了42在流行文化中的特殊意义，7的吉利寓意，以及67的随机感，最终选择了42。这种选择既满足了用户对直接答案的需求，又增添了趣味性。这种思维过程的展示，让AI的决策机制更加透明。ChatGPT在分析原因时也提到，这种偏好可能源于心理偏差和统计趋势。

文化因素也在数字选择中发挥作用。DeepSeek指出，42作为《银河系漫游指南》的终极答案，本身就具有文化符号意义。而73则因其数学特性（既是素数，反过来的37也是素数）和《生活大爆炸》中谢尔顿的偏好而受到关注。这种文化符号的渗透，让AI在随机选择时也带有某种文化烙印。ICML 2025的论文研究也发现，当AI在0到9之间选择时，GPT-4o更倾向7。不过在多轮对话中，模型会逐渐调整选择。

这个现象引发的讨论远超技术范畴。从数据集偏见到文化影响，从心理偏差到算法特性，不同维度的分析揭示了AI决策的复杂性。当AI在随机选择时展现出某种规律性，这种规律性既可能是训练数据的映射，也可能是算法本身的特性。这种现象的持续存在，说明AI在模仿人类思维时，既保留了数据的痕迹，也形成了自己的独特模式。

数字选择背后隐藏的不仅是技术问题，更反映了AI如何学习和模仿人类行为。当AI在随机猜测时展现出某种一致性，这种一致性既可能是训练数据的映射，也可能是算法本身的特性。这种现象的持续存在，说明AI在模仿人类思维时，既保留了数据的痕迹，也形成了自己的独特模式。这种规律性的出现，为理解AI的决策机制提供了新的研究方向。