
Speech 02:MiniMax 推出的新一代语音TTS模型,支持高质量多语种语音合成
MiniMax-Speech-02 是什么? MiniMax-Speech-02 是 MiniMax 推出的新一代高质量、多语种、个性化语音合成TTS模型。该模型基于先进的AR Transformer架构,并结合创新的可学习音色提取器(Le...
MiniMax-Speech-02 是什么? MiniMax-Speech-02 是 MiniMax 推出的新一代高质量、多语种、个性化语音合成TTS模型。该模型基于先进的AR Transformer架构,并结合创新的可学习音色提取器(Le...
通义万相 Wan2.1-VACE 是什么? 通义万相 Wan2.1-VACE 是阿里巴巴推出的强大 AI 视频生成与编辑模型。这款单一的模型即可实现多种功能,包括文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延...
注册邀请码29.9元/个永久使用,本站几乎没有广告,只为了维护服务器运行,更新实属不易,长期稳定更加难得,请您支持一下谢谢!有软件需求可联系站长帮找,限注册用户!
Step1X-3D是什么? Step1X-3D 是由阶跃星辰正式推出并开源的一款具有突破性的 3D 大模型。该模型拥有高达 4.8B 的总参数量,其中几何模块占 1.3B,纹理模块占 3.5B,专为 3D 内容创作而设计,旨在提供一个强大且...
Seed1.5-VL是什么? Seed1.5-VL是字节跳动推出的一款先进的视觉-语言多模态基础模型,它将图像编码器与拥有200亿激活参数的大语言模型相结合,展现出卓越的图像和视频理解及推理能力。在60项基准测试中,Seed1.5-VL凭借...
Matrix-Game是什么? Matrix-Game 是由昆仑万维精心研发并开源的交互式世界基础模型。它拥有生成完整且可交互的游戏世界的能力,能够对人类的各项操作指令作出精准响应,并始终保持着空间结构与物理规律的一致性和稳定性。该模型以庞...
Seed-Coder是什么? Seed-Coder 是字节跳动慷慨开源的 8B(80亿参数)级别代码大模型,其涵盖了 Base、Instruct 以及 Reasoning 三个版本,卓越地展现了代码生成、理解以及推理方面的强大能力。其中最为...
HunyuanCustom是什么? HunyuanCustom是腾讯混元团队精心打造的一款多模态定制化视频生成工具,它依托于强大的混元视频生成大模型(HunyuanVideo),巧妙融合文本、图像、音频、视频等多种模态输入,从而能够创作出高...