4月2日,在近日召开的2026中关村论坛年会上,生数科技创始人、清华大学人工智能研究院副院长朱军教授系统阐述了公司在通用世界模型领域的战略布局。该战略以基座世界模型为底层核心,并在此基础上构建贯通数字与物理空间的双轨体系。在数字空间维度上,依托世界生成模型研发出视频大模型产品Vidu;在物理空间维度,则通过世界行动模型打造了统一世界模型产品Motus。
Motus依托UniDiffuser统一建模框架,在技术层面实现了视觉语言知识、视频动态知识与动作技能知识的深度融合。实验数据显示:相比国际领先的VLA模型标准,在包含50项任务的综合测试中,Motus不仅将平均成功率提升了35.1%,数据利用效率更是达到13.55倍的数量级突破,并展现出卓越的跨任务泛化能力。该模型在验证码操作、棋类决策、柔性物体抓取等复杂真实场景任务中表现尤为突出,其决策逻辑与执行稳定性已接近人类水平。(广角观察)













