扫描下载APP
其它方式登录
微软发布自研语音转文字模型MAI-Transcribe-1,支持25种语言,平均词错误率仅3.9%,在FLEURS基准测试中11种核心语言精度第一,性能达Azure Fast产品2.5倍,定价0.36美元/小时,已通过Microsoft Foundry平台向企业与开发者开放。
Cohere公司推出开源语音识别模型Cohere Transcribe,拥有20亿参数,支持14种语言,专为边缘设备优化,性能超越ElevenLabs Scribe和Qwen3,旨在强化AI智能体的语音交互能力,并整合进其North智能体编排平台。