16

06月

星期二

19:03

Cartesia发布全新TTS与STT模型Sonic-3.5与Ink-2

据动察 Beating 监测，AI 语音模型初创公司 Cartesia 宣布发布 Sonic-3.5 与 Ink-2，并推出由两款模型组成的统一实时语音智能体技术栈。Sonic-3.5 负责文本转语音（TTS），Ink-2 负责语音转文本（STT）。 Sonic-3.5 偏向于实时低延迟语音生成，首音输出时间缩短至 90 毫秒。出厂支持 42 种语言，无需预处理即可支持英文异音词和字母数字的发音。 Ink-2 的字错率（Word Error Rate）降至 3.6%，同时引入了原生轮次检测（Native Turn-Detection）和噪声处理机制，能基于句意和语义理解判定用户是否发言完毕，而不是仅依赖传统的安静时长。目前 Ink-2 仅提供英文版，多语言版本将在后续推出。开发者可以通过单个 API 同时调用这两款模型。Sonic-3.5 与 Ink-2 在设计上进行双向流式协同，以减少由于「多供应商拼接」带来的传输延迟与系统损耗。
「查看原文」

本内容旨在传递行业动态，不构成投资建议或承诺。

2分钟前

特朗普：美伊关系已正常化，伊朗将承诺不获取核武器

3分钟前

特朗普：我们很快就能对俄罗斯实施更严厉的制裁

4分钟前

晶圆代工厂力积电斥资2亿购买设备扩产

9分钟前

万斯：绝不向伊朗提供一分钱美国资金

9分钟前

特朗普：霍尔木兹海峡将在周五前完全开放

12分钟前

报告：亚太81%企业遭API攻击，AI相关攻击占比升至43%

17分钟前

标普500指数期货转为下跌，抹去早前涨幅

18分钟前

美股光通信板块盘前涨跌互现，AAOI涨2.6%

下载火星财经 APP

以行业热点、实时快讯、视频解读等维度提供全方位的AI和Web3整合服务

24H热门新闻

暂无内容