
OmniHuman:字节推出的AI项目,支持单张照片生成逼真全身动态视频
OmniHuman是什么? OmniHuman是由字节跳动团队最新推出的AI技术,能通过单张图像和音频输入生成生动人物视频。它支持肖像、半身和全身图像,生成与音频内容同步的动作视频,并能处理动漫、3D卡通等非真实图像。相比现有技术,Omni...

OmniHuman是什么? OmniHuman是由字节跳动团队最新推出的AI技术,能通过单张图像和音频输入生成生动人物视频。它支持肖像、半身和全身图像,生成与音频内容同步的动作视频,并能处理动漫、3D卡通等非真实图像。相比现有技术,Omni...

NeverEnds是什么? NeverEnds是一个强大的文字转视频创作工具,它将文本内容转换为视频,为你提供一个独特的方式来讲述自己的故事。 NeverEnds平台位于新加坡,由一群有远见的技术专家和创意人才组成,他们致力于创造一个魔法般...

注册邀请码29.9元/个永久使用,本站几乎没有广告,只为了维护服务器运行,更新实属不易,长期稳定更加难得,请您支持一下谢谢!有软件需求可联系站长帮找,限注册用户!

Dream Talk是什么? Dream Talk是一个由字节跳动和德克萨斯大学达拉斯分校的研究人员共同开发的项目,Dream Talk能够从单张图像生成逼真的、带有情感的、能说话的面部动画,支持多种情。 Dream Talk支持各种情感表...

Veo是什么? Veo 是 Google DeepMind 开发的先进视频生成模型,能够生成1080p高分辨率、长时长的高质量视频。它支持广泛的电影和视觉风格,准确捕捉提示的细微差别,并提供创意控制。Veo 旨在使视频制作更易于访问,解锁叙...

Noisee AI 是什么? Noisee AI是一款由月之暗面Moonshot AI旗下Tranquillitatis Inc开发的AI音乐视频生成工具,旨在将用户喜爱的音乐旋律转化为独特的音乐视频。它允许用户上传音频或提供音频链接,AI...

LTXV是什么? LTXV是由Lightricks推出的基于DiT的首个实时AI视频生成开源模型,可以生成 24 FPS 768x512分辨率的视频,比观看它们更快。该模型在包含各种视频的大规模数据集上进行训练,可以生成具有逼真和多样化内容...

Lumiere是什么? Lumiere是一个谷歌发布的文本到视频扩散模型,使用空间-时间U-Net架构一次性生成整个视频时间跨度,实现全局时间一致性。它能够直接生成全帧率、低分辨率视频,适用于多种内容创作和视频编辑应用,如图像到视频、视频修...

AniPortrait是什么? AniPortrait是一款由腾讯研究人员开发的音频驱动的肖像动画合成框架,能够根据音频和静态人脸图片生成逼真的动态视频。它通过提取音频中的3D面部表情和唇动信息,并结合扩散模型,创造出时间上连贯且高质量的肖...

DynamiCrafter是什么? DynamiCrafter是一个利用视频扩散先验技术来为开放域图像制作动画的项目。这个项目由香港中文大学、腾讯AI实验室和北京大学的研究人员共同开发。它能够将静态图像转换为动画,涵盖多种主题和风格,如风景...

寻光是什么? 寻光是由阿里达摩院推出的一站式AI视频创作平台,它旨在通过人工智能技术提供全新的视频创作模式,重塑传统视频制作的全流程。寻光平台集成了剧本创作、分镜图设计、视频素材编辑等步骤,让创作者可以在同一个平台上流畅完成视频创作。 寻光...