Artificial Analysis 今天发布了新的 Coding Agent Index,用于评估当 AI 模型与智能体框架结合时在关键基准测试中的表现,包括 SWE-Bench-Pro-Hard-AA、Terminal-Bench v2 和 SWE-Atlas-QnA。在此次评估中,智谱 GLM-5.1 在开源模型中排名第一,展现了在真实场景下的代码智能体案例中领先的性能。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
SAP 投资 n8n,将工作流自动化平台的估值翻倍至 52 亿美元
据 Bloomberg 报道,SAP 于周二投资 n8n,使工作流自动化平台的估值翻倍至 52 亿美元。根据 SAP 的声明,这家德国软件巨头还与 n8n 签署了一项为期多年的合作协议,以将该平台的工具集成到 SAP 的 Joule Studio AI 代理构建平台中。
GateNews31 分钟前
DAPPOS 推出 xBubble,面向非技术用户的通用 AI 代理,提供 10+ 核心功能
据 ChainCatcher 称,DAPPOS 已正式上线 xBubble,这是一款面向非技术用户的通用 AI 代理产品。该产品会自动推荐专门的代理,以在尽可能少的提示词和更少的调试迭代次数下完成任务。xBubble 提供 10+ 项核心能力,覆盖图像、视频、文档和网站创建,并支持本地部署和云端部署。
GateNews5小时前
Nous Research 推出 Hermes Agent 的 macOS 计算机控制,将代币消耗降低 95%
Nous Research 宣布,其 Hermes Agent 已推出 macOS 电脑控制功能,据 Beating 的监测。该功能使电子邮件搜索和代码编写等后台操作成为可能,同时不会干扰用户输入或窗口焦点。通过四层上下文压缩机制,框架在以 1568×900 分辨率连续执行 20 次操作时,将执行时的代币消耗从约 60 万降低至 3 万 tokens。
GateNews7小时前
SNS 和 PoH 网络使能 Solana 上的 AI 验证
SNS 通过与 PoH Network 的新集成,扩展了其 .sol 域名的用途。根据日期为 2026 年 5 月 11 日的公告,该集成在 Solana 生态系统中引入了增强的链上身份验证功能。此次合作旨在帮助区分链上的真实用户与人工智能实体,同时提升基于区块链身份的可用性以及其语境价值。该集成在 Colosseum Frontier Hackathon 期间开发完成,标志着 .sol 域名所扮演角色的重大扩张。 为 Solana 提供增强的身份基础设施 此前,.sol 域名主要被用作可读的钱包标识。如今,它们正被定位为一种更广泛的身份基础设施层,能够支持面向 AI 的验证系统以及去中心化声誉机制。PoH Network 现在能够解析 .sol 域名,并将所有权数据作为重要信号,用于区分在链上运行的真实个人与自动化 AI 代理。这种做法使区块链应用能够获得更有意义的身份语境,而不是仅依赖钱包地址或匿名交互。 预计该集成将通过为 .sol 域名附加更多与身份相关的信息,提升去中心化应用中的可读性与信任度。在 Solana 生态系统内构建的开发者,可能会从增强的验证工具中受益,这些工具能
Crypto Frontier7小时前
MoonPay 收购 Dawn Labs,并推出用于预测市场交易的 AI 代理工具
据 The Block 称,MoonPay 已收购 Dawn Labs,并推出 Dawn CLI,这是一款由 AI 驱动的工具,旨在帮助非技术用户打造预测市场交易策略。用户可以用纯英文描述交易策略,而系统会自动完成研究、代码生成、仿真以及实时执行。近年来,Polymarket 和 Kalshi 等平台上的预测市场交易活动激增,二者合计的终身交易量在 4 月突破 1500 亿亿美元。
GateNews12小时前
Circle 于 5 月 12 日推出 Agent Stack,使 AI 代理能够自主使用 USDC
据 Decrypt 称,Circle 于 5 月 12 日推出 Agent Stack,这是一个工具包,可让 AI 代理在无需人工干预的情况下独立持有资金、支付费用并使用 USDC 进行交易。该套件包括代理钱包、命令行界面、代理市场以及一个纳米支付协议,支持最小达 $0.000001 的转账且不收取 gas 费用。Circle 联合创始人 Jeremy Allaire 表示,Agent Stack 是首个以 AI 代理本身作为客户来设计的金融服务套件。
GateNews12小时前