Gate News 消息,4 月 10 日,今日全球权威 AI 评测平台 LMArena(百万用户参与盲测的 AI 模型评测平台)更新 Code Arena 专项榜单,GLM-5.1 登顶全球开源模型第一,位列全球模型第三。
GLM-5.1 不仅继承了上一代模型的开源 SOTA 编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:8 小时从零构建 Linux 桌面;655 次迭代打破向量数据库优化瓶颈;1000 轮工具调用优化真实机器学习模型负载。
值得一提的是,在 METR 榜单的同等评估标准下,GLM-5.1 是唯一达到 8 小时级持续工作的开源模型,也是全球范围内除 Claude Opus 4.6 外少数具备这一能力的模型。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
里德·霍夫曼:随着 AI 代理需要加密信任,NFT 可能会卷土重来
Reid Hoffman,Greylock 合伙人以及 LinkedIn 联合创始人表示,自主代理将需要基于加密货币的信任系统,才能在开放互联网中进行交易;据他在声明中所说,NFT 可能会卷土重来。
AI 代理与信任基础设施
Hoffman 的言论指向一个潜在的
Crypto Frontier1小时前
Scale AI 收到 $500M 五角大楼合同,用于 AI 数据处理
据 ChainCatcher 称,美国国防部向由 Meta Platforms 支持的 Scale AI 授予了一份 5 亿美元合同,旨在帮助处理数据并支持军事决策。该奖项规模是这家总部位于旧金山的公司在
GateNews1小时前
埃隆·马斯克的 xAI 将更名为 SpaceXAI,作为独立公司状态终止
据 Odaily,埃隆·马斯克宣布 xAI 将更名为 SpaceXAI,因为该公司将不再以独立实体运营。
GateNews2小时前
IBM 在 Think 2026 上通过新的基于智能体的工具扩展企业 AI 套件
根据 IBM,该公司在波士顿举行的 Think 2026 会议上宣布扩展其企业 AI 能力,推出新的基于智能体的工具,帮助组织将人工智能嵌入日常运营。Context Studio 现已普遍可用,使企业能够
GateNews2小时前
Hut 8 股份因 98 亿美元 AI 数据中心租赁上涨 30%
Hut 8 股价在有关 98 亿美元 AI 数据中心租赁协议的消息公布后飙升超过 30%。这家比特币矿企正借助位于得克萨斯州的长期超大规模合同扩展到 AI 基础设施领域。
AI 基础设施扩张
该合同包含的选项可能会增加总量
Crypto Frontier2小时前