DeepSeek 将 V4-Pro 价格下调75%,将 API 缓存成本削减至原来的十分之一

Gate News 消息,4月27日——DeepSeek宣布对其面向开发者的新 V4-Pro 模型提供75%的折扣,并将其 API 产品线中输入缓存命中价格下调至此前水平的十分之一。

V4 模型于4月25日发布,提供 Pro 和 Flash 版本,已针对华为的 Ascend 处理器进行了优化。DeepSeek 表示,V4-Pro 在世界知识基准测试中优于其他开源模型,并仅次于谷歌的闭源 Gemini-Pro-3.1。V4 系列专为 AI 代理而设计,用于处理超出聊天机器人能力范围的复杂任务。

V4-Pro API 成本已经低于主要的西方竞争对手,定价为每百万输出 tokens 3.48 美元,而 $30 对应 OpenAI 的 GPT-4.5。V4-Flash 的定价为每百万输入 tokens 0.14 美元、每百万输出 tokens 0.28 美元,可能使诸如在单次请求中审阅完整代码库或监管文件等具备成本效益的应用成为可能。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

OpenAI 加速 AI 代理手机至 2027 年上半年,联发科将争取独家处理器合作协议

据分析师 Ming-Chi Kuo 最新的行业调查,OpenAI 正加速开发其首款 AI 代理手机,并力争最早在 2027 年上半年实现量产。如今,联发科更有可能拿下独家处理器订单,芯片将基于一款定制版本的

GateNews2 分钟前

Sierra 募资 9.5 亿美元、估值 158 亿美元:Bret Taylor 以 OpenAI 主席身分抢夺 AI 客服龙头

Sierra 由 Bret Taylor 共同创办,宣布完成 9.5 亿美元 Series E、估值 158 亿美元,由 Tiger Global 与 GV 首投。8 季达成 1.5 亿 ARR、Fortune 50 渗透率超过 40%。定位为以 AI agent 为核心的垂直企业客服平台,提供即用型工作流。Taylor 同时为 OpenAI 董事长,治理与利益披露成焦点。

鏈新聞abmedia1小时前

Gemini API 推出 Webhooks:Google 解决长期任务轮询痛点、Batch/Veo 可即时推送

Google Gemini API 于 5 月 4 日推出 Webhooks。长任务完成时会自动将结果推送到 callback URL,替代轮询,降低资源和延迟、简化程序。适用于 Batch API、Veo2 和长 context 推理,特别适合 serverless。相较 OpenAI 偏 SSE、Anthropic 仍使用轮询,Google 强调开发者基础设施。未来关注安全机制与扩展模型。对台湾开发者而言,立即整合可显著降低 quota 和系统负载。

鏈新聞abmedia1小时前

Krutrim 于 5 月 5 日转向 AI 云服务,并发布首份盈利,随着 FY26 营收达到 3160 万美元

据 Press Trust of India 报道,印度 AI 公司 Krutrim 于 5 月 5 日将自身重新定位为本土 AI 云服务提供商,暂停芯片设计工作,并将资本和人才转向云基础设施。 该公司公布的 26 财年收入约为 30 亿卢比(US$31.6 m

GateNews2小时前
评论
0/400
暂无评论