据动察 Beating 监测,Cursor 公开了 Composer 系列模型的一个训练技巧:用上一代模型为下一代的强化学习(RL)自动搭建可运行环境。训练 Composer 2 时,Cursor 用 Composer 1.5 来完成这项工作,称之为 autoinstall。
RL 训练需要可运行的代码环境。环境搭不好,模型把 token 浪费在调 bug 上,学不到东西;极端情况下环境彻底跑不通,整轮训练的算力白烧。autoinstall 分两步解决这个问题:第一步,一个 agent 读代码库的文档和配置,提出 10 条验证命令及预期输出;第二步,另一个 agent 拿到其中 3 条命令,从零开始配环境直到命令跑通。第二步最多重试 5 次,全部失败则丢弃该环境。
配环境的过程中,agent 会主动补齐缺失依赖:伪造数据库表、创建 MinIO 配置替代 S3、启 Docker 容器充当 sidecar 服务,甚至生成占位图片。博文以区块链项目 celo-org/celo-monorepo 为例演示了全流程,agent 在第一轮配环境失败后,第二轮自行创建 mock 用户绕过认证,最终跑通测试。
Composer 2 在 Terminal-Bench(测试模型搭建开发环境能力的基准)上得分 61.7%,比 Composer 1.5 的 47.9% 高出近 14 个百分点。Cursor 表示未来计划让旧版 Composer 参与更多训练环节,包括数据预处理、运行管理和架构调优。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Blitzy 完成由 Northzone 领投的 $200M 融资轮次
据 ChainCatcher,Blitzy,这家由前 Nvidia 架构师 Sid Pardeshi 联合创立的 AI 编程公司,已完成一轮 2 亿美元的融资,领投方为 Northzone。Battery Ventures、Jump Capital 和 Morgan Creek Digital 参与了本轮融资。该平台可以解析复杂系统并
GateNews17 分钟前
欧盟于 5 月 7 日禁止 AI 生成的换脸色情内容
据新华社报道,5 月 7 日,欧盟议会成员及成员国达成共识,禁止人工智能系统生成深度伪造色情内容。该禁令将纳入对 2024 年《人工智能法案》的修订中。欧洲议会
GateNews39 分钟前
Tether 发布 QVAC MedPsy 医疗 AI 模型,在 17B 参数版本上取得 62.62 分
据 Odaily,Tether AI Research Group 发布了 QVAC MedPsy,一种面向医疗的 AI 模型,旨在无需云端依赖、可在智能手机和可穿戴设备上本地运行。该 17 亿参数版本在七项医学基准测试中得分 62.62,较 Google 的 MedGemma-1.5-4B 高出 11.42 poi
GateNews59 分钟前
B.AI API 推出四款新模型,包括 GPT-5.5 Instant,并在 OpenAI 发布后 48 小时内推出
B.AI API 已推出四款新模型:GPT-5.5 Instant、DeepSeek-v3.2、MiniMax-M2.7 和 GLM-5.1。GPT-5.5 Instant 已在 OpenAI 发布后的 48 小时内完成底层适配和接口集成,实现对
GateNews1小时前
Tether 的 1.7B 医疗 AI 模型今日表现优于 16 倍规模更大的竞争对手
根据 Tether 的 AI 研究团队,该公司今天发布了 QVAC MedPsy 系列医疗语言模型,旨在无需云端依赖的情况下在智能手机和可穿戴设备上进行本地部署。1.7B 参数版本在七项医疗基准测试中得分 62.62,超过了 Google MedGemma-4B
GateNews1小时前
Anthropic 估值突破 1.26 万亿美元,首次超过 OpenAI
据 Beating 称,Anthropic 在 Jupiter 的 Pre-IPO 市场上的隐含估值已飙升至 1.26 万亿美元,首次超过 OpenAI。该估值在过去 7 天上涨了 20%,自 2025 年 10 月以来已增长 900%。Polymarket 预测市场数据显示,A 的概率为 86%
GateNews1小时前