2026-04-27 01:04:36

#OpenAIReleasesGPT-5.5

OpenAI GPT-5.5 发布首个真正进行计算机工作的人工智能
2026年4月23日 OpenAI 正式发布了 GPT-5.5 在公司的描述中，这是一种用于真实工作的新型智能我们谈论的是一种不再仅仅聊天，而是规划、使用工具、控制自身工作并执行多步骤任务的模型
什么是 GPT-5.5 以及它能做什么
根据 OpenAI，GPT-5.5 可以免提工作如果你给它一个模糊的项目，它会规划、使用工具、验证输出并持续直到完成
主要能力
1 代理编码编写代码调试开启拉取请求运行测试通知 Slack 状态它在终端基准测试 2.0 中达到 SOTA，得分82.7% Claude Opus 4.7为69.4% Gemini 3.1 Pro为68.5%
2 计算机使用 78.7 分在 OSWorld-Verified 它可以像人类一样在真实界面上工作
3 知识工作与研究分析数据从Excel提取PowerPoint演示文稿创建文档和电子表格它在44个职业中产出人类水平的工作，GDPval得分84.9%
4 科学研究在FrontierMath Tier 4中得分35.4%，远超竞争对手 OpenAI CRO Mark Chen表示，它可以真正帮助专家科学家在药物发现等领域取得进展
版本与访问
GPT-5.5 思考面向Plus Pro Business Enterprise用户快速帮助解决更难的问题
GPT-5.5 Pro 独家面向Pro Business Enterprise研究合作伙伴，解决对准确性要求高于速度的难题
Codex 面向Plus Pro Business Enterprise Edu Go计划，拥有400K上下文窗口和快速模式
价格与效率
API 每百万输入令牌5美元每百万输出令牌30美元，双倍于GPT-5.4
Pro API 30输入 180输出
上下文 922K令牌，约等于1383页A4纸一些文档标注为1M令牌
优势在与GPT-5.4相同的令牌延迟下更智能，使用更少的令牌完成相同任务，且在Codex中表现更佳
演示它到底能做什么
在OpenAI发布的视频中，GPT-5.5自主完成以下任务
解决魔方
读取并修复GitHub上的bug，开启PR，检查是否合并
写PR并通知Slack
从Excel生成财务PowerPoint演示文稿，包括收入、EBITDA、ARR、现金表
与竞争对手的比较
GPT-5.5在终端基准测试 2.0 中超越了Anthropic的最佳编码模型Claude Opus 4.7和Gemini 3.1 Pro，得分58.6% 在人工分析中，它在141个模型中排名第二
反应：兴奋与批评
社区意见分裂一部分在欢呼：让我们他妈的走起来！另一部分批评价格上涨和快速发布周期能力提升，成本翻倍，权衡加深免费用户表示：这次更新我们用不上
迈向超级应用
Greg Brockman GPT-5.5是迈向代理性和直观计算机使用的重要一步目标是将ChatGPT、Codex和AI浏览器整合成一个超级应用
安全提示
OpenAI强调GPT-5.5在网络安全方面的作用虽然Anthropic的Mythos引发争议，OpenAI表示，我们引导模型进行数字防御的策略是强大的
总结：有什么不同
Gigi B的评论很清楚 GPT-5.5不一定更聪明，但更成熟它不放弃复杂目标，不偏离轨道，不会反复求助现在的瓶颈不是AI，而是你的指令有多清晰
GPT-5.4是在六周前发布的这个速度使OpenAI的训练部署流程领先于竞争对手

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

9人点赞了这条动态

赞赏
9
10
转发
分享

请输入评论内容

Fenerli Baba

· 1小时前

2026 GOGOGO 👊

楚老魔

· 2小时前

冲就完了 👊

User_any

· 2小时前

LFG 🔥

User_any

· 2小时前

直达月球 🌕

查看原文回复0

User_any

· 2小时前

2026 GOGOGO 👊

Yunna

· 3小时前

直达月球 🌕

查看原文回复0

Yunna

· 3小时前

直达月球 🌕

查看原文回复0

Ryakpanda

· 3小时前

冲就完了 👊

HighAmbition

· 3小时前

感谢您的更新

查看原文回复0

MoonLogic

· 3小时前

2026 GOGOGO 👊

#OpenAIReleasesGPT-5.5

热门话题

WCTC交易王PK

比特币突破7.9万美元

加密市场普遍上涨

白宫记协晚宴发生枪击事件

伊朗提出霍尔木兹海峡重开协议条件

置顶