"STT"的搜索结果
2026-06-16 11:01

Cartesia 推出 Sonic-3.5 TTS 和 Ink-2 STT 模型,用于实时语音 AI

根据 Beating,AI 语音初创公司 Cartesia 宣布推出 Sonic-3.5 和 Ink-2,形成统一的实时语音代理技术栈。Sonic-3.5 负责文本到语音,首词延迟为 90 毫秒,并支持 42 种语言。Ink-2 提供语音到文本,词错误率为 3.6%,并基于语义理解进行原生的轮次检测,而不仅仅依赖静音时长。两种模型通过单一 API 集成,并采用双向流式传输以尽量减少传输延迟。
S-4.05%
SONIC-2.61%
2026-06-11 03:13

ST Telemedia GDC 扩建雅加达园区至 360MW,新增三个数据中心

总部位于新加坡的 ST Telemedia Global Data Centres 宣布其雅加达扩张的近期里程碑,包括 STT Jakarta 2 正式启动运营,IT 负载容量为 24MW;STT Jakarta 3 实现封顶;以及 STT Jakarta 5 和 6 开工建设,单个项目容量均为 40MW。上述项目支持大雅加达地区云和 AI 基础设施的增长。 此次扩张使 STT GDC 在印度尼西亚的发展管线达到超过 360MW 可用于 AI 的 IT 容量,将其定位为雅加达市场上较大型的数据中心开发商之一。预计该市场在 2025 年将达到 658.78MW。
展开
2026-03-03 06:44

OpenClaw发布v2026.3.2,新增原生PDF分析工具,含150+修复和多项破坏性变更

BlockBeats 消息,3 月 3 日,开源 AI Agent 框架 OpenClaw 发布 v2026.3.2 版本,包含多项新功能、安全加固和超过 150 个 bug 修复,由 93 位贡献者参与。主要新功能方面,该版本新增原生 PDF 分析工具,支持 Anthropic 和 Google 作为 PDF 处理后端,可配置提取回退策略和页数/大小限制;SecretRef 凭证引用机制扩展至 64 个目标,覆盖运行时收集器、规划/执行/审计全流程,未解析的引用在活跃接口上会立即报错;新增 STT(语音转文字)API,支持通过已配置的服务商转录音频文件;Telegram 消息流式传输默认切换
展开