GPT-5.2来了!OpenAI最新发布,生产力大增可以做表格、写PPT!
GPT-5.2来了!OpenAI最新发布,生产力大增可以做表格、写PPT!今天凌晨,OpenAI正式推出新一代大模型GPT-5.2.付费用户端及API同步开放。

GPT-5.2来了!
美国开放人工智能研究中心(OpenAI)11日发布其人工智能模型GPT的最新升级版本GPT-5.2.以应对生成式人工智能领域日趋激烈的竞争。
为回应谷歌公司11月所发布人工智能模型双子座3的出色表现,OpenAI首席执行官萨姆·奥尔特曼近日启动“红色警报”,加快GPT升级版本的发布速度。
OpenAI今年8月推出GPT-5后,11月即发布升级版本GPT-5.1.眼下不到一个月就再次更新。业界认为,此举凸显人工智能行业目前面临的竞争压力。
此举距上一代GPT-5.1发布不足一月,背后是谷歌Gemini 3引发的“红色警报”竞争压力——OpenAI此前紧急叫停广告、资讯等侧项目,将所有资源集中于主模型研发,最终以“职场效率革新”为核心,交出这款号称“迄今最强专业知识工作模型”的答卷。业界认为,此举凸显人工智能行业目前面临的竞争压力。

OpenAI最新发布
简而言之,OpenAI 本次推出:
GPT-5.2 Instant,为日常工作与学习而打造:
与 GPT-5.1 一样温暖、对话自然
更清晰的讲解,把关键信息提前呈现
改进的操作指南与分步骤讲解
更强的技术写作与翻译能力
更好地支持学习与职业规划
GPT-5.2 Thinking,为专业级工作全面提升标准:
业界最先进的长上下文推理能力
在电子表格的生成、分析与排版方面取得重大提升
在演示文稿制作方面已有初步突破
GPT-5.2 Pro,在面对困难问题时最聪明、最值得信赖的模型:
在编程等复杂领域表现更强
最适合帮助并加速科学研究的模型
GPT-5.2 的设计目标,就是为人们创造更多经济价值:它在制作电子表格、构建演示文稿、编写代码、理解图像、处理超长上下文、使用工具,以及执行复杂的多步骤项目方面都有显著提升。
真正的生产力不是空口无凭,让我们来看看数据,GPT-5.2 到底有多强。
在如图所示的众多基准测试中,GPT-5.2 均刷新了最新的 SOTA 水平。
你可以注意到,AIME 2025(数学)的分数是 100%,之前 Gemini 3 Pro 的分数是 95%;ARC-AGI-2(抽象推理)的分数是 52.9%,对比 Gemini 3 Pro 是 31.1 %;此外 SWE-bench pro(编码)的分数是 55.6%,对比 Gemini 3 Pro 是 43.3 %。
GPT-5.2 在 GDPval(知识工作)基准上的分数为 74.1%,OpenAI 声称这是 AI 模型首次达到了「人类专家水平」。
总体来看,GPT-5.2 在通用智能、长上下文理解、自主式工具调用以及视觉能力方面均带来了显著提升,使其比以往任何模型都更擅长端到端地完成复杂的真实世界任务。

生产力大增可以做表格、写PPT
山姆・奥特曼表示,GPT-5.2 是 OpenAI 很长一段时间以来最大的一次升级。
GPT-5.2 Thinking 是迄今为止最适合真实世界专业场景的模型。在 GDPval—— 一个覆盖 44 个职业、针对明确知识工作任务的评估体系中,GPT-5.2 Thinking 刷新了 SOTA 成绩,并成为 OpenAI 首个整体表现达到或超过人类专家水平的模型。
根据专业评审的判断,在 GDPval 的知识工作任务对比中,GPT-5.2 Thinking 在 70.9% 的对比中击败或与顶尖行业专家持平。这些任务包括制作演示文稿、电子表格以及其他专业产出物。
在执行 GDPval 任务时,GPT-5.2 Thinking 生成输出的速度超过专家 11 倍以上,成本却低于 1%。这表明,在配合人工监督时,GPT-5.2 能显著辅助专业工作。
速度和成本估算基于历史数据;ChatGPT 中的实际速度可能有所差异。
在 GDPval 中,模型需要完成覆盖美国 GDP 贡献度最高的 9 大行业中 44 个职业的、明确规定的知识工作任务。这些任务要求生成真实的工作产出,例如:销售演示文稿、会计报表 / 电子表格、急诊排班表、制造流程图,甚至是短视频等。在 ChatGPT 中,GPT-5.2 Thinking 配备了 GPT-5 Thinking 所不具备的新工具。
在评审一份表现尤其出色的输出时,一位 GDPval 评委评论道:
「这是一次令人兴奋且明显的质量飞跃……[它] 看起来就像是由一家专业公司团队完成的,两个交付物的版式设计和建议都出乎意料地优秀,不过其中一个仍有一些小错误需要修正。」
此外,在 OpenAI 内部用于测试初级投行分析师能力的电子表格建模基准中(例如:为一家财富 500 强企业构建包含三张财务报表的模型,并具备正确格式和引用;或为私有化交易构建杠杆收购模型),GPT-5.2 Thinking 的任务平均得分比 GPT-5.1 提升了 9.3%,从 59.1% 上升到 68.4%。
GPT-5.2 Thinking 的幻觉率显著低于 GPT-5.1 Thinking。
在一组来自 ChatGPT 的去标识化真实用户查询上,含错误的回答相对减少了 30%。

GPT-5.2来了!OpenAI最新发布,生产力大增可以做表格、写PPT!对于专业用户而言,这意味着在进行研究、写作、分析和决策支持时,模型犯错更少,从而让日常知识工作更加可靠稳健。