"FLASH"的搜索结果
今天
04:49

DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上获得满分 120/120,与 Axiom 并列第一。 在使用 LeanExplore 和受约束采样的实际模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著优于 Seed-2.0-Prover 35.50、Gemini 3 Pro 26.50 和 Seed-1.5-Prover 26.50。前沿模式的结果显示,V4 在 Seed-1.5-Prover 110/120 与 Aristotle 100/120 之前。 V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选自然语言解答,自我验证用于筛选结果,而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展,而实际模式分数更能反映标准部署能力。
展开
03:21

DeepSeek V4 训练数据翻倍至 33T,导致不稳定性并延迟了发布

Gate News 消息,4月24日——DeepSeek 的 V4 技术报告显示,V4-Flash 和 V4-Pro 分别在 32T 和 33T token 上进行了预训练,相较于 V3 使用的约 15T token 翻了一倍。该报告承认在训练过程中遇到了“显著的不稳定性挑战”,损失尖峰反复出现,是由于 Mixture-of-Experts MoE 层中的异常;路由机制本身会加剧这些异常,而简单的回滚也无法解决问题。
展开
11:32

Anker 发布首款计算-存储一体 AI 芯片 Thus,CEO 承诺对先进技术进行无限投资

盖世新闻消息,4月23日——Anker Innovation,这家领先的全球消费电子品牌,于4月22日发布了其首款神经网络 计算-存储一体(Compute-in-Memory)(CIM) AI音频芯片 Thus™。CEO兼创始人杨猛透露,公司在边缘AI领域的三项主要技术举措:Thus™ 芯片、边缘侧大语言模型,以及三阶段具身智能路线图。 Yang Meng 扬猛表示,Anker 的2025年研发支出达到 28.93亿元人民币,同比增加 37.2%。公司计划在未来几年继续保持研发增长显著快于营收增长,投入到先进领域“几乎没有上限”。Thus™ 芯片基于 NOR Flash 技术,并原生支持400万参数模型。其通过将此前浪费的90%以上电力重定向到有效计算,以解决冯·诺依曼架构的能效低下问题。在内部测试中,Thus™ 相比传统蓝牙耳机芯片,AI峰值性能最高提升至150倍,使得在耳机上部署百万参数模型成为可能。 该芯片将率先应用于 Anker 的旗舰耳机,并作为为期三年的芯片技术平台的基础。此外,Anker 还展示了覆盖三阶段家用机器人路线图:从已在量产中的平面运动机器人吸尘器和割草机,到正在开发中的三维移动安防机器人,以及人形机器人在早期研发阶段。根据 Anker 的2025年年报,公司实现营收305.14亿元人民币,同比增长23.49%;净利润25.45亿元人民币,同比增长20.37%。Anker 于2025年12月向香港交易所主板提交上市申请,管理层确认进展正常。
展开
02:27

美团开源560B参数定理证明模型,72次推理通过率97.1%刷新开源SOTA

美团LongCat团队于3月21日开源了LongCat-Flash-Prover,一个5600亿参数的MoE模型,专注于Lean4形式化定理证明。模型分为自动形式化、草图生成和完整证明生成三项能力,结合推理工具与Lean4编译器实现实时验证。训练采用Hybrid-Experts Iteration Framework和HisPO算法,防止奖励作弊。基准测试表明,该模型在自动形式化和定理证明方面刷新了开源权重模型的记录。
展开