阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能

GateNews

Gate News 消息,4月27日——阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”强化学习框架训练,AgenticQwen 在大幅降低推理成本的同时,实现了接近“万亿级参数规模”的模型层级代理能力。

双数据飞轮机制解决了传统合成数据中的同质化问题。推理飞轮会从模型错误中自动生成更难的变体,而代理式飞轮会将简单的线性工作流 (例如单次预订流程)扩展为带约束的多分支行为树,包含拒绝与对抗条件,模拟真实世界的复杂决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准 (TAU-2 和 BFCL-V4) 上得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 参数) 达到 50.2。

该模型已部署在类似 Manus 的内部生产系统中,端到端推理时间方面显著缩小了与 235B 模型的差距。不过,该模型受原生上下文长度 40K tokens 的限制,这会制约其在深度搜索任务上的表现。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

AI 代理 Manfred 组建公司,并在 5 月底前准备好用于交易的加密钱包

AI 代理 Manfred 已成立自己的公司,并获得了一个加密钱包和业务资质,包括雇佣员工和进行付款的能力。该代理计划在年底前开始进行加密交易

GateNews1 分钟前

Tether 首席执行官提议为代理卡支持整合 WDK 和 QVAC

据 Foresight News 报道,Tether 首席执行官 Paolo Ardoino 在 X 上表示,稳定币发行方可能需要推进 WDK 与 QVAC 之间的集成,以支持 Agent Cards 功能。

GateNews3小时前

Particle Network 发布通用账户路线图,推出 Universal Deposit SDK 和 AI 代理账户

据 ChainCatcher 称,Particle Network 今天发布了通用账户(Universal Accounts)的下一阶段路线图,未来几个月将推出两款新产品:Universal Deposit SDK,使开发者能够用大约 10 行代码添加多链存款,以及 Universal Agent Accounts,

GateNews3小时前

OpenAI 允许 ChatGPT 订阅在 Agent 平台 OpenClaw 上生效

根据 OpenAI 首席执行官 Sam Altman 于 5 月 2 日表示,ChatGPT 用户现在可以使用他们的 ChatGPT 账户登录代理平台 OpenClaw,并在该平台上直接使用他们现有的 ChatGPT 订阅。

GateNews5小时前

AI 代理 Manfred 成立公司,并为 5 月底的加密货币交易做准备

AI 代理 Manfred 已成立自己的公司,并获得了一个加密货币钱包以及用于雇佣员工、进行付款和开展业务的凭证。该代理计划在年底之前开始交易加密货币

GateNews6小时前

Bakkt 完成 DTR 收购,伴随营收增长与战略重塑

Bakkt 已完成对 Distributed Technologies Research 的收购,此举旨在将人工智能(AI)原生的稳定币基础设施整合到其核心金融服务中。 现代化全球结算 Bakkt Inc. 已完成对 Distributed Technologies 的收购

Coinpedia10小时前
评论
0/400
暂无评论