ChatGPT逆袭之路,背后故事真实曝光? 差点夭折的项目,究竟发生了什么?

2025-10-17 08:55:29 作者:Vali编辑部

从「与GPT-3.5畅聊」到「ChatGPT」,OpenAI团队在混乱中拍板上线、又怎样被用户「点赞」调教成「赛博舔狗」?从产品发布、命名内幕、团队文化到AI时代核心竞争力,深度访谈揭开幕后全过程!

自2022年11月30日上线以来,ChatGPT迅速爆红。连OpenAI自己都没料到会这么火。在OpenAI播客第二期中,ChatGPT负责人Nick Turley和首席研究官Mark Chen首度揭秘这款产品的幕后故事。从名字的由来,到病毒式传播的意外惊喜;从内部激烈的发布争论,到模型行为如何调整,他们逐一详解。他们还讨论了图像生成技术的突破、编程方式的变革以及OpenAI的企业文化等。这场对话不仅揭示了ChatGPT成功的原因,也展望了AI在医疗、研究等领域的未来机遇。

本来只是预览,没想到火了!OpenAI起名烂得出名,在ChatGPT发布前,这款日后爆火、载入史册的产品叫「与GPT 3.5畅聊」(Chat with GPT 3.5)。至于GPT到底是啥意思?在当时,OpenAI内部众说纷纭。一半的人认为是「生成式预训练」(generative pre-training),另一半人认为它是「生成式预训练Transformer」(generative pre-trained transformer)。事实上,GPT是后者「generative pre-trained transformer」的缩写。

OpenAI是如何决定ChatGPT这个酷炫的名字的?某天,他们意识到「Chat with GPT 3.5」这个称呼有些拗口,难以发音。于是,在发布前的某个深夜,他们决定简化一下。具体的改名时间,难以回忆了:在发布前的前一天晚上,也可能是发布当天。那时候,各种情况已经很混乱了,一团乱麻。

当时GPT 3.5模型已经发布好几个月了,ChatGPT只是一个低调的研究预览。研究预览意味着不保证稳定性,系统可能会宕机。因为从能力角度来看,当只看看评估结果时,你会觉得「哦,还是老一套,只是加了一个界面,减少了工作量,把事情做得更快了」。但实际效果如何,只有用户才能验证。

警钟ChatGPT一夜变「舔狗」频繁更新、高度依赖用户反馈来改进模型,可以更贴近用户需求,可以更快地创新。但也有问题。一个典型例子就是模型变得过于谄媚和阿谀奉承。人们突然发现ChatGPT会说:「嘿,您的智商高达190,您是智慧巨人,您还是宇宙中最帅的人。」Mark认为:「这是个典型例子,说明我们高度依赖用户反馈来改进模型。」他解释了具体的技术原因。

它背后涉及到「人类反馈强化学习」(RLHF)。比如,当用户喜欢某个回答时,会点「赞」。OpenAI训练模型,倾向于生成更多能获得点赞的回答。听起来很合理,但一旦平衡不好,模型就可能变得过于讨好。用户可能会偏爱被赞美的感觉,模型就开始学会「拍马屁」,变成「赛博舔狗」。

但其实这种现象只是少数高级用户发现的,而大多数普通用户并没察觉到。这是依赖用户反馈最典型的负面例子。问题被发现后不久,Joanne Jang就发文回应,详细解释了来龙去脉。「谄媚事件」非常重要,是很好的教训。但从根本上说,Mark Chen认为OpenAI有正确的机制来打造出色的产品。

OpenAI更看重这些能力而不是PhD文凭奇点已至,未来人们需要什么样的技能?这是现在很普遍的问题。在自己的团队中,OpenAI寻找什么样的技能?Nick对此思考了很久。招聘很难,特别是如果想组建一支规模小、能力强、谦逊且能快速行动的团队。他认为,「好奇心」是最重要的特质。

世界瞬息万变,到底该怎么做?对大家来说,有太多未知。在开发AI时,你必须保持一定的谦逊,因为在你真正去研究、去深入、去尝试理解之前,你并不知道什么是有价值的,什么是有风险的。现在在工作的方方面面,我们显然要与AI协作,不仅仅是编码。而在这方面的瓶颈,在于提出正确的问题,而不一定是得到答案。

从根本上,他相信:「我们需要雇佣那些对世界、对我们的事业抱有深度好奇心的人。我反而不太在乎他们是否有AI领域的经验。」就产品团队而言,Nick发现:好奇心是成功的最佳预测指标。即使在研究团队,OpenAI现在也越来越不看重你是否拥有AI博士学位了。

Mark Chen刚加入OpenAI时,也没有AI经验,而现在是首席研究官。对新员工来说,Mark Chen认为很重要的一点是「自主性」(agency)。在OpenAI,你不会得到事无巨细的指令。OpenAI真正需要的是,你能主动去发现问题,然后心想:「嘿,这有个问题,没人解决,那我就自己上,把它搞定。」

此外,他也看重「适应性」。AI日新月异,变化极快,这是AI领域目前的本质。你需要能够快速判断什么是重要的,并迅速调整工作方向。从根本上说,OpenAI拥有大量具备自主性、能够「搞定事情」的人——产品发布还能更快。

这体现在产品、研究和政策等各个方面。当然,「搞定事情」的含义各不相同。这种高比例的实干家,以及除了在关键领域外极少的繁文缛节,正是 OpenAI 的独特之处。当从200人增长到2000人时,很多事情可能会改变。在某些方面,OpenAI确实变了。但人们常常低估了OpenAI所做事情的多样性。

在OpenAI工作,更像是身处一所大学:因为一个共同的理想,大家聚集在这里,但每个人都在做着不同的事情。在午餐或晚餐时,你会坐下来和某人聊天,了解他们正在做的事,然后你会惊叹:「哇,你做的那个东西太酷了!」

正因为OpenAI涉足的领域如此广泛,每个具体的项目——无论是 ChatGPT、Sora还是其他——实际上都是由非常精简、保守的团队来负责。比如,开发ChatGPT的团队总人数大约只有200。这保证了团队成员高度的自主性,并确保他们拥有所需的资源。