Gate 新闻消息,4月22日——谷歌研究发布了 ReasoningBank,这是一个智能体记忆框架,使基于大型语言模型的智能体能够在部署后持续学习。该框架从成功和失败的任务经验中提取通用推理策略,并将其存储在记忆库中,以便在未来相似任务中检索与执行。相关论文发表于 ICLR,代码已在 GitHub 上开源。
ReasoningBank 在两种现有方法的基础上进行了改进:Synapse 会记录完整的行动轨迹,但由于粒度较细,迁移能力有限;Agent Workflow Memory 只从成功案例中学习。ReasoningBank 做出了两项关键改变:存储“推理模式”而不是“行动序列”,并且每条记忆包含用于标题、描述和内容的结构化字段;将失败轨迹纳入学习。该框架使用一个模型对执行轨迹进行自我评估,将失败经验转化为反陷阱规则。例如,规则“看到就点击‘加载更多’按钮”会演化为“先验证当前页面标识符,避免陷入无限滚动循环,然后点击加载更多”。
论文还提出了 Memory-aware Test-time Scaling (MaTTS),它会在推理期间分配额外计算,用于探索多条轨迹并将发现存储到记忆库中。并行扩展会为同一任务运行多个不同的轨迹,通过自我对比来进一步完善更稳健的策略;串行扩展则会对单条轨迹进行迭代细化,并将中间推理存入记忆。
在使用 Gemini 2.5 Flash 作为 ReAct 智能体的 WebArena 浏览任务以及 SWE-Bench-Verified 编码任务中,ReasoningBank 相比没有记忆的基线,在 WebArena 上成功率提高了 8.3%,在 SWE-Bench-Verified 上提高了 4.6%,同时将每个任务的平均步骤数减少了约 3。将 MaTTS 与并行扩展结合((k=5))后,WebArena 的成功率还进一步提升了 3 个百分点,并且步骤数额外减少了 0.4。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Cardano 创始人:AI 代理将于 2035 年超越人类互联网活动,并扰乱以广告驱动的模式
据 CoinDesk 报道,Cardano 创始人 Charles Hoskinson 在 5 月 7 日的 Consensus 大会上预测,AI 代理将在 2035 年前在互联网搜索、商务和交易方面超过人类活动。Hoskinson 表示,由于 AI 代理不会点击广告,也不会表现出品牌偏好,因此他说这将 w
GateNews4 分钟前
Claude Code 负责人 Boris:AI 代理提升人類生产力,改寫软體开发歷史
Claude Code 负责人 Boris Cherny 在 CNBC 访谈指出,AI 代理工具如 Co-Work 能将繁琐任务交给 AI 处理,工程师从操作者转为引导者,能够同时启动多个代理处理除错,显著提升产能。企业须把 AI 当作核心重组流程,AI 在各行各业都展现价值,软件开发将由编写转向以逻辑与对话指引的协作,技术门槛降低,创新创业将出现爆发性增长。
鏈新聞abmedia49 分钟前
里德·霍夫曼:随着 AI 代理需要加密信任,NFT 可能会卷土重来
Reid Hoffman,Greylock 合伙人以及 LinkedIn 联合创始人表示,自主代理将需要基于加密货币的信任系统,才能在开放互联网中进行交易;据他在声明中所说,NFT 可能会卷土重来。
AI 代理与信任基础设施
Hoffman 的言论指向一个潜在的
Crypto Frontier2小时前
IBM 在 Think 2026 上通过新的基于智能体的工具扩展企业 AI 套件
根据 IBM,该公司在波士顿举行的 Think 2026 会议上宣布扩展其企业 AI 能力,推出新的基于智能体的工具,帮助组织将人工智能嵌入日常运营。Context Studio 现已普遍可用,使企业能够
GateNews3小时前
Anthropic 推出 Claude Dreams:Agent 在任务之间自动整理记忆,消除重复与矛盾
Anthropic 在 Code with Claude 大会公布 Dreams,让 Claude Managed Agents 在多场会話间自动整理記憶、消除重複与矛盾、更新陳舊條目,输出可審核的整理后記憶庫;输入上限为 100 个 session 与 4,096 字元,非同步執行,數分鐘至數十分鐘完成,支援串流觀察。研究预覽需申请,暫只支援 claude-opus-4-7 与 claude-sonnet-4-6,正式上市未定。
鏈新聞abmedia6小时前
Cloudflare 携手 Stripe 推出 Agent 自主协议:AI 可自行创建账户、购买域名、部署应用
Cloudflare 与 Stripe 4 月 30 日共同推出新协议,让 AI Agent 可在无人工介入下自行建立 Cloudflare 账户、订阅付费方案、注册域名、获取 API token,并直接部署应用程序。Cloudflare 官方博客说明,整套流程从头到尾不需要人类进入后台、复制粘贴 token、或输入信用卡资料;用户只需先给予许可,并接受 Cloudflare 的使用条款。本周此公告在 Hacker News 取得 548 分,成为 AI Agent 自主执行任务的标志性基础建设新闻之一。
三层协议架构:服务发现、身份授权、付款代币化
Cloudflare-Stripe
鏈新聞abmedia6小时前