Gate News 消息,4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上获得满分 120/120,与 Axiom 并列第一。
在使用 LeanExplore 和受约束采样的实际模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著优于 Seed-2.0-Prover (35.50)、Gemini 3 Pro (26.50) 和 Seed-1.5-Prover (26.50)。前沿模式的结果显示,V4 在 Seed-1.5-Prover (110/120) 与 Aristotle (100/120) 之前。
V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选自然语言解答,自我验证用于筛选结果,而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展,而实际模式分数更能反映标准部署能力。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
OpenAI 与 AMD、Broadcom、Intel、Microsoft 和 Nvidia 推出 MRC 协议
OpenAI 宣布已与 AMD、Broadcom、Intel、Microsoft 和 Nvidia 合作,推出多路径可靠连接(Multipath Reliable Connection,MRC),这是一种开源网络协议。MRC 旨在加速大规模 AI 训练集群、提升可靠性,并显著减少 GPU 空闲
GateNews1 分钟前
SK 电信的 AI 数据中心收入在 2026 年第一季度增长 89%
据 SK Telecom 称,这家韩国电信运营商的人工智能数据中心业务在 2026 年第一季度实现 1314亿韩元(89.4百万美元)营收,同比增长 89.3%。公司将增长归因于数据中心利用率更高以及
GateNews12 分钟前
Arm 警告智能手机弱点,瞄准 AI 芯片增长以弥补
Arm 控股警告称,智能手机市场疲弱正在压缩该芯片设计公司的一个关键收入来源,不过首席执行官 Rene Haas 在一次财报电话会议上表示,预计 AI 芯片业务的增长将抵消影响。上一季度的手机出货量下滑,亏损主要集中在
Crypto Frontier22 分钟前
DeepSeek 在 AI 竞争之际以 $45B 估值筹集资金
据 TechCrunch 报道,名为 DeepSeek 的中国 AI 实验室正在商谈筹集其首轮融资,估值据称为 450 亿美元。该估值相较数周前的估计 200 亿美元估值出现了显著增长,此前因公司的 AI 模型而引发关注
Crypto Frontier41 分钟前
华为、Cambricon 在国产芯片上集成 DeepSeek V4;计划于 2026 年部署 75 万台 Ascend 950PR 单元
据《南华早报》报道,华为和寒武纪已于 2026 年开始将 DeepSeek V4 与国内芯片平台进行集成。华为表示,V4 现在可在其昇腾 950PR 以及其他昇腾处理器上运行,并计划在今年量产后生产约 75 万枚 950PR 芯片,随后规模生产继续
GateNews1小时前
微软可能推迟 2030 年零碳电力目标,因为 AI 数据中心扩张带动能源需求
据彭博报道,微软可能会推迟或取消其 2030 年目标,以便每小时将所有用电都与零碳电力进行匹配。由于 AI 数据中心扩张带来能源需求和成本上升,该公司正在考虑调整。2021 年公布的 100/100/0 目标比该公司的年度可再生能源匹配目标更严格
GateNews1小时前