11月21日最新消息显示,腾讯混元大模型团队今日正式发布并开源轻量化视频生成模型HunyuanVideo 1.5。该模型采用Diffusion Transformer架构设计,参数量仅为83亿,在性能表现上可生成5-10秒时长的480p/720p高清视频,并可通过超分辨率技术提升至1080p画质。其技术创新主要体现在SSTA稀疏注意力机制与多阶段训练策略的应用上,在动作连贯性和语义一致性等关键指标上已达到商用标准。硬件兼容性方面实现突破性降低——仅需配备14GB显存的消费级显卡即可流畅运行,显著低于同类开源模型普遍需要50GB以上的硬件门槛。
目前该技术已落地腾讯元宝APP应用端口,用户可通过输入文字描述或上传图片并添加提示词来生成视频内容,并支持中英文双语输入及写实/动画等多风格创作模式。开发者还可通过运镜控制、文字指令等高级功能实现精细化创作。该模型代码已同步部署至Hugging Face和GitHub开源社区平台供开发者免费下载使用。(广角观察)












