GPT-5真的要提前发布?这波技术革新,会带来什么惊喜?Minecraft复刻版这么惊艳,背后的技术是如何实现的?
最近AI圈掀起一阵热浪,关于GPT-5的传闻接连不断。从泄露的基准测试到Minecraft实测,再到内部代号Zenith的模型表现,全网都在热议。有爆料称它将在7月31日发布,直接把Grok 4 Heavy甩在身后。OpenAI这次准备够狠,看来是要在AI赛道上再掀波澜。
消息最早是从内部泄露的基准测试开始的。这些测试数据看起来相当扎实,不少业内人士觉得这很可能是真实的。更让人意外的是,有消息说GPT-5将在7月31日发布。这下可把所有GPT-5模型都推到了WebDev竞技场的风口浪尖。
不过也有不同声音,Menlo Ventures投资人Deedy和The Verge、The Information等外媒都表示GPT-5可能在8月亮相。虽然具体时间还没定,但关于它的实测已经铺天盖地。最近一位网友放出的Minecraft实测视频,让不少人直呼过瘾。
视频里GPT-5的表现堪称惊艳,一次性完成游戏任务的流畅度让人眼前一亮。有网友评价道:"真叫人服气,OpenAI这次确实拿出看家本领了。"这种表现让不少玩家都开始期待正式版的上线。
爆料人Jimmy Apple的最新消息更让人心动。他说很多内部评估人员都评价GPT-5比Grok 4 Heavy还要强。这个消息一出,不少业内人士都坐不住了。
现在GPT-5的气息越来越近了。有用户发现,自己在app里选择o3时,意外测试到了某个版本的GPT-5。这种现象越来越普遍,看来离正式发布不远了。
The Verge的说法稍有不同,他们情报显示GPT-5将在8月初发布,包括mini和nano版本。此前有开发者发现,GPT-5在内部被命名为"推理alpha版"。同时一个代号"o3-alpha"的模型,上线12小时就下架,这被业内公认是GPT-5的早期壳。
根据OpenAI惯例,从测试到发布间隔最短仅4天,所以GPT-5真的已经近在眼前。就在昨天,大家已经发现了GPT-5可以在LMArena上使用。同时被发现的还有Zenith模型。
下面这些实例已经引发热议:生成来自遥远未来的星舰控制面板、创建流媒体网站、完美呈现机器人行走SVG动画、史上最好的菠萝防御游戏。这些表现让不少用户直呼期待。
有人觉得GPT-5将是AI领域的重要里程碑,会吸引数百万用户加入AI生态系统。接下来我们梳理这段时间关于GPT-5的各种线索。
在一次OpenAI智能体直播中,GPT-5就被提及。当时透露的关键信息是:这个前沿模型将首次统一两个系列的模型,融合o系列在推理方面的突破和GPT系列在多模态方面的优势。
因为ChatGPT有各种型号的模型,每个都有独特功能。如果GPT-5真的是各个模型的最佳集合,用户体验肯定会有大改观。比如用过o3的人就知道,从GPT-4o到o3的飞跃有多疯狂。
这一点早在今年2月就得到证实。网友问OpenAI是否会制作模型路由器,CPO Kevin Weil表示会更统一。另外还有内部员工爆料,说研究者尝试了路由方法,但产生了很多幻觉。
所以他们在测试一个能规划、推理、可以像扩展一样运用智能体的模型。外媒The Information的爆料也显示,GPT-5在编码方面表现突出。
在自然科学领域推理更深入;浏览器里能自动完成复杂任务;写作更流畅,逻辑更在线;更重要的是在编码上有炸裂提升。有体验者说,GPT-5不仅更擅长解决学术和编程竞赛问题,甚至在处理现实世界工程师面对的实际编程任务时表现更惊艳。
比如那些包含大量屎山遗留代码的庞杂代码库,它都能轻松修改。这种处理复杂场景的能力让OpenAI模型过去始终落后于Anthropic。毕竟在开发者群体中,大家公认Claude才是真正的编程王者。
有体验者亲测后表示,GPT-5在编程上直接胜过Claude Sonnet 4!另外的说法是GPT-5不是一个统一模型,而是一个路由器机制。它会根据问题类型把提问发送给擅长闲聊的GPT大模型或擅长逻辑推理的o系列模型。
最终我们看到的GPT-5表现,就是这两个模型组合拳的效果。甚至有OpenAI高管私下预言:在不换架构的前提下,有信心做到GPT-8。
这意味着OpenAI没有打算卷新架构,而是靠更聪明的调度、更强的推理、更多的后训练数据,把现有技术用到极致。
GPT-5要来,全员屏息等待
现在GPT-5的气息越来越近了。有用户发现,自己在app里选择o3时,意外测试到了某个版本的GPT-5。这种现象越来越普遍,看来离正式发布不远了。
关于它本周上线的消息,也得到了越来越多人的证实。The Verge的说法稍有不同,根据他们情报显示GPT-5将在8月初发布,包括mini和nano版本。
此前曾有开发者发现,GPT-5在内部被命名为"推理alpha版"。同时一个代号"o3-alpha"的模型,上线12小时就下架,被业内公认是GPT-5的早期壳。
根据OpenAI惯例,从测试到发布间隔最短仅4天,所以GPT-5真的已经相当近了。就在昨天,大家已经发现了GPT-5可以在LMArena上使用。同时被发现的还有Zenith模型。
下面这些实例也已经被全网疯转:生成来自遥远未来的星舰控制面板、创建流媒体网站、完美呈现机器人行走SVG动画、史上最好的菠萝防御游戏。这些表现让不少用户直呼期待。
有人觉得GPT-5将是AI领域的重要里程碑,会吸引数百万用户加入AI生态系统。接下来我们梳理这段时间关于GPT-5的各种线索。
在一次OpenAI智能体直播中,GPT-5就被提及。当时透露的关键信息是:这个前沿模型将首次统一两个系列的模型,融合o系列在推理方面的突破和GPT系列在多模态方面的优势。
因为ChatGPT有各种型号的模型,每个都有独特功能。如果GPT-5真的是各个模型的最佳集合,用户体验肯定会有大改观。比如用过o3的人就知道,从GPT-4o到o3的飞跃有多疯狂。
这一点早在今年2月就得到证实。网友问OpenAI是否会制作模型路由器,CPO Kevin Weil表示会更统一。另外还有内部员工爆料,说研究者尝试了路由方法,但产生了很多幻觉。
所以他们在测试一个能规划、推理、可以像扩展一样运用智能体的模型。外媒The Information的爆料也显示,GPT-5在编码方面表现突出。
在自然科学领域推理更深入;浏览器里能自动完成复杂任务;写作更流畅,逻辑更在线;更重要的是在编码上有炸裂提升。有体验者说,GPT-5不仅更擅长解决学术和编程竞赛问题,甚至在处理现实世界工程师面对的实际编程任务时表现更惊艳。
比如那些包含大量屎山遗留代码的庞杂代码库,它都能轻松修改。这种处理复杂场景的能力让OpenAI模型过去始终落后于Anthropic。毕竟在开发者群体中,大家公认Claude才是真正的编程王者。
有体验者亲测后表示,GPT-5在编程上直接胜过Claude Sonnet 4!另外的说法是GPT-5不是一个统一模型,而是一个路由器机制。它会根据问题类型把提问发送给擅长闲聊的GPT大模型或擅长逻辑推理的o系列模型。
最终我们看到的GPT-5表现,就是这两个模型组合拳的效果。甚至有OpenAI高管私下预言:在不换架构的前提下,有信心做到GPT-8。
这意味着OpenAI没有打算卷新架构,而是靠更聪明的调度、更强的推理、更多的后训练数据,把现有技术用到极致。
GPT-5,会给世界带来什么?
最近关于GPT-5的讨论已经蔓延到社会层面。奥特曼在采访中提到,很多人整天和AI聊天,甚至把它当作自己的男友或女友。一些孩子在成长过程中完全靠着滚动屏幕获取多巴胺,这种现象让人担忧。
当主持人问如何防止AI产生与社交媒体相同的负面影响时,奥特曼诚实地承认:"我很害怕这件事,我没有答案。"令人担忧的是,前几天一位OpenAI投资人承认,自己因为整天使用ChatGPT已经出现一些不正常的状况。
也就是说,即使是有钱人也会因为跟AI聊天被诱发精神病。奥特曼甚至表示,自己对给地球上的每个人发放免费运行的GPT-5十分感兴趣。
当这些AI产品和服务以1/100成本被提供时,很显然,某些经济体会迅速转型和瓦解。但是,不管会给世界造成怎样的狂潮,GPT-5要上线的架势,如今已经是无法阻挡了。