OpenAI的终极目标是什么?未来研究人员会如何被定义?

2025-10-10 09:30:12 作者:Vali编辑部

AI鞋履工具如何革新体验?哪家平台能提供理想解决方案?

OpenAI首席科学家和首席研究官的访谈内容堪称信息密度爆炸,不到1小时的交流却揭示了大量关于GPT-5和自动化研究员的细节。从推理能力到强化学习,从编程优化到人才选拔,这场采访像一扇窗口,让我们窥见大模型研发的深层逻辑。

在a16z的访谈中,两位专家不仅解答了GPT-5如何引入长远推理、如何在基准饱和后衡量进度,还系统性阐述了OpenAI的用人标准、未来路线图以及算力分配这些重要问题。他们用通俗的语言解释了技术进展,让普通用户也能理解这些看似抽象的概念。

关于GPT-5的讨论是访谈的核心。Mark Chen表示,这款模型是OpenAI试图将推理能力带入主流的一种尝试。此前公司有GPT系列(主打即时响应)和o系列(主打推理)两类模型,但如今更注重推理和Agentic行为。他认为,GPT-5的最主要意义在于将推理模式带给更多人,让普通用户也能享受到深度思考带来的价值。

在评估体系方面,Jakub Pachocki指出,当前的基准测试已接近饱和。早期训练依赖大规模预训练数据,但如今强化学习让模型在特定领域深度训练成专家,这种能力在某些评估中表现突出却不一定具备良好泛化性。未来OpenAI将更关注模型是否能发现新事物,并在经济相关领域取得实际进展。

谈及自动化研究员,Mark Chen分享道,最让他感到惊讶的是模型能够推动前沿科学研究。他和物理学家、数学家朋友的实验显示,模型能解答一些复杂的新问题,这相当于让AI"灵光一闪"地解决原本需要学生花费数月时间完成的工作。Jakub则认为,o3的出现让模型在数学公式和推理方面达到"相当值得信赖"的水平,这是他们研究的重要突破。

编程优化方面,两位专家提到GPT-5在编码竞赛中的表现令人惊叹。Mark Chen用李世石面对AlphaGo的案例,形容这种进步是"疯狂的"。他观察到,这种改变已影响编码的默认方式,现在的年轻人认为"凭感觉编码"是常态,而手动编写所有机制变得奇怪。Jakub则认为,这种新方式仍处于"恐怖谷"阶段,但OpenAI的目标是让它摆脱这种状态。

关于人才选拔,两位专家强调研究者需要坚持和清晰的假设。Jakub认为,研究本质是探索未知,很多尝试会失败,但必须做好失败准备并保持诚实。Mark Chen补充说,研究需要经验选择合适问题,既要避免太难受挫,也要防止太简单缺乏满足感。他们更看重解决难题的能力,而非社交媒体上的表现。

在资源分配上,Mark Chen认为计算资源是关键。他指出,没有研究人员会觉得自己有足够的算力,而Jakub强调计算仍是决定性因素。他们认为,除了计算,能源等物理约束也是重要考量,未来机器人技术将成为主要焦点。

这场访谈像一面镜子,映照出大模型研发的深层逻辑。从推理能力到自动化研究员,从编程优化到人才选拔,OpenAI的探索不仅改变了技术路线,也重塑了研究方式。这些进展让普通用户看到了AI带来的实际价值,也让技术爱好者更期待未来的突破。

访谈地址:https://www.valimart.net/