xAI 5 月 2 日于官方博客推出 Grok Custom Voices 功能,用户只需在 xAI 控制台录制约 1 分钟的自然语音,系统会在 2 分钟内处理完成,产出可用于 TTS 与 Voice Agent API 的定制声音模型。同步推出的还有 Grok 4.3 模型,以及汇总全部声音资源的 Voice Library 介面。Custom Voices 还设计双阶段身份验证机制,防止克隆他人声音。
功能:1 分钟录音、2 分钟生成、整合 TTS 与 Voice Agent API
用户在 xAI 控制台录制约 1 分钟的自然语音,后台流程依序完成:(1)身份验证、(2)语音处理、(3)模型产出。整体 2 分钟内可拿到可用的声音模型。Custom Voices 继承所有 TTS 能力,包含 speech tags(语音标签)、多语输出,以及 REST 与 WebSocket 串流;可直接搭配 xAI 的 TTS 端点或 Voice Agent API 用于即时对话 agent。
同步推出的 Voice Library 是 xAI 控制台中统一管理声音资源的介面,可浏览、预览、管理用户自制与预建的所有声音,避免分散在多个介面。预建声音库提供 80 种以上声音,支援 28 种语言。
双阶段身份验证:防止克隆他人声音
Custom Voices 在语音生成前设置两道身份验证关卡:第一道,用户朗读一段验证句,系统即时报文转录该段语音;第二道,系统从验证句与完整录音中分别计算 speaker embedding(说话者特征向量),比对两者是否属于同一人。只有两阶段都通过,才会进入声音模型产出流程。
xAI 明确声明:用户无法用既有录音档克隆声音,也无法克隆他人声音。这套设计排除“拿到他人公开演讲录音直接复制”的使用情境,把克隆声音的范围限缩在“用户本人即时录制”这一一个入口。对于关注 AI 语音生成滥用议题(如电话诈骗、未经授权配音)的观察者而言,这套机制是 xAI 对防伪议题的具体回应。
后续观察:与 Grok 4.3 同步推出、Voice Library 扩增节奏
Custom Voices 与 Grok 4.3 同日推出,xAI 将“模型升级 + 语音工具线完整化”绑在同一波发表。下一个观察点是 Voice Library 预建声音库从 80 种往上扩增的节奏,以及 28 语言版图能否进一步覆盖繁体中文等小语种;另一个观察点是 Voice Agent API 的具体采用案例公开,特别是客服自动化、podcast 录制、多语客户服务等场景的整合示例。
这篇文章 xAI Grok 推 Custom Voices:2 分钟克隆、双阶段身份验证 最早出现在 链新闻 ABMedia。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Hut 8 签 98 亿美元 AI 数据中心 15 年长约、股价盘前飙 36%
Hut 8 宣布与德州 Beacon Point 签署 1GW AI 数据中心首期 352MW 租约,期限 15 年、基期 98 亿美元,包含 3% 年增及三次 5 年续约选项;若全部执行,合约金额可达约 251 亿美元。承租方为高投资等等级客户,名称尚未公开。此案显示 Hut 8 正从矿业转型为 AI 基础建设商;Beacon Point 采用 NVIDIA DSX 架构,初期 352MW,预计 2027 年 Q1 通电、Q3 首期厂房交付,园区具 1GW 扩展能力。
鏈新聞abmedia8小时前
Core Scientific 以 4.21 亿美元收购比特币矿企 Polaris,并扩展 AI 数据中心业务
据 The Block 称,Core Scientific 于今天(5 月 6 日)以约 4.21 亿美元收购 Polaris DS LLC,获得一份 440 兆瓦的电力合同,并与 Oklahoma Gas & Electric 达成协议,以扩展其 AI 及高性能计算托管业务。Polaris 设施位于俄克拉荷马州,
GateNews9小时前
Hut 8 以 168 亿美元锁定 AI 数据中心收入,Q1 释放 3,300 BTC
据 PRNewswire 报道,纳斯达克上市的比特币矿业公司 Hut 8 于 5 月 6 日公布了其 2026 年第一季度财务结果,披露其两个超大型 AI 园区产生了 168 亿美元的租赁收入。该公司通过一项以比特币为抵押的贷款再融资,释放了大约 3,300 BTC(约 2.6 亿美元)
GateNews12小时前
Prophet 今日推出 AI 驱动的预测市场,并开设 10,000 美元的实时交易分档
据 MetaversePost 报道,Prophet 于今日(5 月 6 日)推出了一个由 AI 驱动的预测市场,分配了 10,000 美元的 USDC 用于实时交易。用户可以直接与一个生成基于概率定价的 AI 对手方进行交易;每个市场中有些合约将在 24 小时内结算。
GateNews13小时前
WorldClaw 使用 WLFI 推出 WorldRouter,并以更低 30% 的成本提供 300+ 种 AI 模型
据 WorldClaw 称,该公司与 World Liberty Fi 联合推出 WorldRouter,使用户能够通过单一账户访问 300 多种 AI 模型,相较于直接供应商定价成本约降低 30%。WorldRouter 作为进入 WorldClaw 的 AgentOS 的首个入口,
GateNews13小时前
Kakao Pay 第一季度利润因金融服务增长飙升 141%
Kakao Pay,这家韩国移动支付服务提供商,依据公司财报公告,其第一季度净利润同比增长 141.5% 至 347 亿韩元(2380 万美元)。营业利润从 44 亿韩元(299 万美元)跃升至 322 亿韩元(2190 万美元)
Crypto Frontier14小时前