全站绿色、纯净清爽
发掘好用的软件和AI工具

UniVG-百度开源的统一模态视频生成模型

UniVG 是百度开发的一种统一模态的视频生成系统。这个系统通过处理文本和图像两种方式,能够解决多种视频生成任务。UniVG 主要分为高自由度和低自由度视频生成两个类别,并采用了多条件交叉注意力和偏置高斯噪声等方法来提高生成视频的质量。在公共学术基准 MSR-VTT 上,UniVG 取得了最低的帧间视频差异性度量,不仅在技术性能上超越了当前的开源方法,而且与业界领先的闭源方法 Gen2 相当。

UniVG 引入了“多条件交叉注意力”技术,用于高自由度视频生成,以生成与输入图像或文本语义一致的视频。在低自由度视频生成方面,采用了“偏置高斯噪声”的方法,相较于传统的完全随机高斯噪声更能有效地保留输入条件的原始内容。

总的来说,UniVG 的推出为视频生成模型领域带来了新的可能性,提供了更灵活的输入方式,满足了真实世界多变的应用需求。

UniVG-百度开源的统一模态视频生成模型

UniVG相关链接:

赞(0) 打赏
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《UniVG-百度开源的统一模态视频生成模型》
📌文章链接:https://www.fsgameo.com/ai-tools/video/video-generators/5944.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

请在浏览器中打开