据 Abacus.AI 首席执行官 Bindu Reddy 称,Google 计划在 5 月 20 日的 I/O 大会上发布 Gemini 3.2 Flash,其在代码和推理任务上的性能将达到 GPT-5.5 的 92%,同时将推理成本削减至仅为后者的 1/15 到 1/20。大多数查询的延迟将低于 200 毫秒。Reddy 将这一突破归因于 Google 的蒸馏和稀疏性技术,这些技术能在不出现通常在模型优化中所见的性能断崖的情况下,将前沿模型压缩到 Flash 级别。
相关快讯
专家称,Zk 证明为 DePINs 带来优势,随着 AI 信任需求上升
Google 推出首款「AI 笔电」:Googlebook 深度整合 Gemini 成最佳协作伙伴
Google:大型语言模型被用于实际攻击,AI 可绕过双重认证安全机制