#OpenAIReleasesGPT-5.5


OpenAI GPT-5.5 发布 首个真正进行计算机工作的人工智能
2026年4月23日 OpenAI 正式发布了 GPT-5.5 在公司的描述中,这是一种用于真实工作的新型智能 我们谈论的是一种不再仅仅聊天,而是规划、使用工具、控制自身工作并执行多步骤任务的模型
什么是 GPT-5.5 以及它能做什么
根据 OpenAI,GPT-5.5 可以免提工作 如果你给它一个模糊的项目,它会规划、使用工具、验证输出并持续直到完成
主要能力
1 代理编码 编写代码 调试 开启拉取请求 运行测试 通知 Slack 状态 它在终端基准测试 2.0 中达到 SOTA,得分82.7% Claude Opus 4.7为69.4% Gemini 3.1 Pro为68.5%
2 计算机使用 78.7 分 在 OSWorld-Verified 它可以像人类一样在真实界面上工作
3 知识工作与研究 分析数据 从Excel提取PowerPoint演示文稿 创建文档和电子表格 它在44个职业中产出人类水平的工作,GDPval得分84.9%
4 科学研究 在FrontierMath Tier 4中得分35.4%,远超竞争对手 OpenAI CRO Mark Chen表示,它可以真正帮助专家科学家在药物发现等领域取得进展
版本与访问
GPT-5.5 思考面向Plus Pro Business Enterprise用户快速帮助解决更难的问题
GPT-5.5 Pro 独家面向Pro Business Enterprise研究合作伙伴,解决对准确性要求高于速度的难题
Codex 面向Plus Pro Business Enterprise Edu Go计划,拥有400K上下文窗口和快速模式
价格与效率
API 每百万输入令牌5美元 每百万输出令牌30美元,双倍于GPT-5.4
Pro API 30输入 180输出
上下文 922K令牌,约等于1383页A4纸 一些文档标注为1M令牌
优势 在与GPT-5.4相同的令牌延迟下更智能,使用更少的令牌完成相同任务,且在Codex中表现更佳
演示 它到底能做什么
在OpenAI发布的视频中,GPT-5.5自主完成以下任务
解决魔方
读取并修复GitHub上的bug,开启PR,检查是否合并
写PR并通知Slack
从Excel生成财务PowerPoint演示文稿,包括收入、EBITDA、ARR、现金表
与竞争对手的比较
GPT-5.5在终端基准测试 2.0 中超越了Anthropic的最佳编码模型Claude Opus 4.7和Gemini 3.1 Pro,得分58.6% 在人工分析中,它在141个模型中排名第二
反应:兴奋与批评
社区意见分裂 一部分在欢呼:让我们他妈的走起来!另一部分批评价格上涨和快速发布周期 能力提升,成本翻倍,权衡加深 免费用户表示:这次更新我们用不上
迈向超级应用
Greg Brockman GPT-5.5是迈向代理性和直观计算机使用的重要一步 目标是将ChatGPT、Codex和AI浏览器整合成一个超级应用
安全提示
OpenAI强调GPT-5.5在网络安全方面的作用 虽然Anthropic的Mythos引发争议,OpenAI表示,我们引导模型进行数字防御的策略是强大的
总结:有什么不同
Gigi B的评论很清楚 GPT-5.5不一定更聪明,但更成熟 它不放弃复杂目标,不偏离轨道,不会反复求助 现在的瓶颈不是AI,而是你的指令有多清晰
GPT-5.4是在六周前发布的 这个速度使OpenAI的训练部署流程领先于竞争对手
查看原文
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 10
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
Fenerli Baba
· 1小时前
2026 GOGOGO 👊
回复0
楚老魔
· 2小时前
冲就完了 👊
回复0
User_any
· 2小时前
LFG 🔥
回复0
User_any
· 2小时前
直达月球 🌕
查看原文回复0
User_any
· 2小时前
2026 GOGOGO 👊
回复0
Yunna
· 3小时前
直达月球 🌕
查看原文回复0
Yunna
· 3小时前
直达月球 🌕
查看原文回复0
Ryakpanda
· 3小时前
冲就完了 👊
回复0
HighAmbition
· 3小时前
感谢您的更新
查看原文回复0
MoonLogic
· 3小时前
2026 GOGOGO 👊
回复0
查看更多