1月29日快讯:蚂蚁灵波科技于今日正式开源其超大规模视觉模型LingBot-World。该模型在视频画质表现、动态生成能力及长序列一致性等核心指标上已比肩Google Genie 3技术水准。其创新性地实现了近10分钟无损连续视频流生成,并有效攻克了长期存在的长时漂移难题。
在交互性能方面展现出显著优势:支持每秒16帧的稳定输出速率,端到端延迟控制在亚秒级(低于1秒)。用户可通过标准输入设备实时操控角色动作与视角切换,并通过自然语言指令即时触发场景变化。尤为突出的是该模型具备零样本泛化能力——仅需单张真实图像或游戏界面截图即可生成可交互式视频流。
这项技术突破为具身智能系统开发、自动驾驶仿真训练等领域提供了高保真度数字孪生环境,特别适用于复杂场景下的长期任务模拟与低成本训练需求。目前该模型权重参数及推理代码已全面开放给开发者社区。(广角观察)












