蚂蚁灵波开源世界模型LingBot-World,可交互长视频生成能力比肩Genie3

1月29日快讯:蚂蚁灵波科技于今日正式开源其超大规模视觉模型LingBot-World。该模型在视频画质表现、动态生成能力及长序列一致性等核心指标上已比肩Google Genie 3技术水准。其创新性地实现了近10分钟无损连续视频流生成,并有效攻克了长期存在的长时漂移难题。

在交互性能方面展现出显著优势:支持每秒16帧的稳定输出速率,端到端延迟控制在亚秒级(低于1秒)。用户可通过标准输入设备实时操控角色动作与视角切换,并通过自然语言指令即时触发场景变化。尤为突出的是该模型具备零样本泛化能力——仅需单张真实图像或游戏界面截图即可生成可交互式视频流。

这项技术突破为具身智能系统开发、自动驾驶仿真训练等领域提供了高保真度数字孪生环境,特别适用于复杂场景下的长期任务模拟与低成本训练需求。目前该模型权重参数及推理代码已全面开放给开发者社区。(广角观察)

赞(0) 打赏
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《蚂蚁灵波开源世界模型LingBot-World,可交互长视频生成能力比肩Genie3》
📌文章链接:https://www.fsgameo.com/breaking-news/12270.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

请在浏览器中打开