o3-pro来了? 这么值80刀? 思考个简单算数要那么久?

2025-10-19 09:10:09 作者:Vali编辑部

近期OpenAI接连推出两款新模型,引发行业广泛关注。O3-Pro作为最新旗舰产品,在数学、科学和编程领域展现出显著优势,而同期推出的O3则通过价格调整吸引普通用户。两款模型的推出不仅改变了市场格局,也让开发者和企业用户面临新的选择。

从第三方评测角度看,O3-Pro的性能提升主要体现在两个方面。首先,其在复杂任务处理上表现更稳定,能够通过四次尝试(而非单次)确保答案正确。这种可靠性对于需要精准输出的场景尤为重要。其次,模型在解决需要抽象推理的问题时展现出更强的逻辑能力,比如构建单词阶梯等任务。不过,这种性能提升也带来了响应时间延长和成本上升的代价。

价格调整是O3系列的另一大亮点。O3的API调用费用相比O1-Pro下降80%,每百万输入tokens仅需2美元,输出tokens费用8美元。这个价格区间与GPT-4o相当,使更多中小企业和开发者能够负担。但降价是否影响模型性能成为热议焦点,部分用户反馈实际使用中发现O3的响应速度和准确度有所下降。

在具体测试中,O3-Pro展现了明显优势。比如宾大教授Ethan Mollick分享的单词阶梯测试,要求模型从"SPACE"到"EARTH"逐步变换字母。这项任务需要严密的逻辑推理,而O3-Pro成功完成挑战且未依赖网络搜索。相比之下,O3在相同任务中表现略逊一筹,这说明新模型在复杂推理方面确实有提升。

开发者实测也印证了这一结论。HyperWriteAI CEO测试发现,O3-Pro处理简单问题时往往需要1分钟以上,部分复杂问题甚至耗时16分钟。虽然响应时间较长,但这种延迟换来的是更精准的输出结果。对于需要高准确度的场景,这种等待是值得的。

价格差异成为用户选择的重要考量。O3-Pro的输入输出费用分别是20美元和80美元,相比之下O3的单价仅为前者的十分之一。这种价格策略让普通用户能够体验更先进的模型能力,同时保持成本可控。但对需要高频调用的开发者而言,O3-Pro的高费用可能成为负担。

在实际应用中,O3-Pro的性能优势在专业领域尤为明显。生物医学科学家分享的案例显示,该模型在开发免疫系统时能提出更多关键限制,指出需要彻底重构的问题。相比之下,O3在相同任务中仅能解决部分问题,说明新模型在深度分析方面有明显提升。

从市场反应看,O3-Pro的推出引发行业震动。不少开发者表示,这种性能提升对需要精准推理的场景极具价值,但价格因素可能影响普及速度。而O3的降价策略则让更多用户能够体验先进模型的潜力,形成"高端模型+大众模型"的双轨发展。

OpenAI CEO奥特曼在推文中提到,2025年将出现能进行认知工作的智能Agent,2026年可能有能产生原创见解的系统。这种预测暗示着AI技术的快速发展,而O3系列的推出正是这一趋势的具体体现。无论是O3-Pro的性能突破,还是O3的普惠策略,都在推动AI技术向更广泛的应用场景延伸。

从第三方评测角度看,O3系列的推出标志着AI技术进入新阶段。模型性能的提升与价格策略的调整,既满足了专业用户的需求,也降低了普通用户的使用门槛。这种双轨发展模式,为AI技术的普及和深化应用提供了更多可能性。未来随着技术进步,这种平衡点有望进一步优化,让更多用户享受到AI带来的便利。