让AI赋能专业,用软件服务网友
全站绿色,Ctrl+D 快捷收藏网站

阿里通义百聆推出语音模型新版本

12月15日,阿里通义实验室宣布开源全新语音合成模型Fun-CosyVoice3-0.5B。该版本搭载零样本音色克隆技术,仅需提供一段超过3秒的参考音频样本,即可快速复刻目标音色并生成新的语音内容,并支持本地化部署与功能扩展开发。与此同时,通义团队同步推出轻量化语音识别模型Fun-ASR-Nano,通过算法优化将总参数量精简至0.8亿,在保持性能的前提下显著降低推理计算成本。目前两个模型均已开放源代码,并提供本地部署方案及定制化微调支持。(广角观察)

赞(0) 打赏
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《阿里通义百聆推出语音模型新版本》
📌文章链接:https://www.fsgameo.com/breaking-news/11843.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

请在浏览器中打开