#OpenAIReleasesGPT-5.5 OpenAI 发布 GPT-5.5:代理智能开启新时代,“超级应用”野心再度加速



旧金山——在一次出乎意料的举措中,OpenAI 官方正式推出 GPT-5.5,重置了人工智能的竞争格局。

该模型在 GPT-5.4 发布仅六周后释出。新模型——代号“Spud”——不只是一次渐进式升级。OpenAI 总裁 Greg Brockman 将其描述为“用于真实工作的全新一类智能”,这表明其从对话式聊天机器人,转向能够在无需手把手指导的情况下完成复杂、多步骤任务的自主“代理”系统,发生了根本性转变。

聚焦“去做”,而不只是“聊天”

与前辈不同,GPT-5.5 被设计为代理运行时(Agentic Runtime)。它旨在在数字工具之间进行规划、执行、验证与迭代——例如代码解释器、浏览器和办公软件——以最少的监督来把任务完成。

早期测试者指出,“概念清晰度”和持久性都有显著跃升。在一个颇受关注的案例中,该模型仅用一次 20 分钟的尝试,就成功地将一条包含数百项前端变更的复杂分支合并到一个已修改的主分支中——而此前的模型都未能完成这一任务。

基准测试与定价

性能提升立刻显现。在 Terminal-Bench 2.0 上(该基准测试复杂的命令行工作流程),GPT-5.5 得分为 82.7%,超越 Claude Opus 4.7 的 69.4% 。它在 GDPval 的知识工作任务上同样领先,得分为 84.9%。

不过,强大也意味着代价。OpenAI 将成本翻倍:标准版 GPT-5.5 的价格为 **$5 每百万输入令牌** 和 $30 每百万输出令牌;而 GPT-5.5 Pro 用于重负载任务 (,售价为 $30/$180。OpenAI 解释称,这是因为该模型用“显著更少的令牌数”就能完成任务,从而降低总体拥有成本。

“超级应用”战略与安全

此次发布是 CEO Sam Altman 推动打造 AI “超级应用”战略的重要基石:将 ChatGPT、Codex 和 AI 浏览器整合到一个统一的平台上,服务企业级工作。

鉴于其能力,OpenAI 将 GPT-5.5 归入网络安全“高”风险类别,并指出它可能会放大既有的滥用路径。公司在上线前完成了广泛的红队测试与外部安全测试。
查看原文
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
discovery
· 5小时前
直达月球 🌕
查看原文回复0
discovery
· 5小时前
2026 GOGOGO 👊
回复0
Sheen crypto
· 6小时前
LFG 🔥
回复0
Sheen crypto
· 6小时前
2026 加油 👊
查看原文回复0
Sheen crypto
· 6小时前
直达月球 🌕
查看原文回复0