 

首个为具身智能而生的大规模强化学习框架RLinf重磅开源

2025-09-01 分类：AI快讯评论(0) 赞(0)

9月1日最新消息显示，清华大学联合北京中关村学院、无问芯穹及北京大学、加州大学伯克利分校等科研机构共同推出全球首个面向具身智能的"渲染-训练-推理一体化"大规模强化学习框架RLinf，并正式开源该系统。RLinf架构采用六层模块化设计：用户层（统一编程接口）、任务层（多后端集成方案）、执行层（灵活执行模式）、调度层（自动化资源调度）、通信层（自适应通信机制）和硬件层（异构计算支持）。相较于传统框架的分离式执行方案，在具身智能训练场景中其创新性混合执行模式实现了超过120%的系统性能提升，并使视觉语言模型参数效率提升40%-60%。该框架凭借高度模块化与可扩展特性，已成功将1.5B和7B规模的数学推理大模型在AIME24、AIME25及GPQA-diamond基准测试中推向新高水准。（广角观察）

赞(0)  打赏

📝版权声明：本文采用知识共享署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称：《首个为具身智能而生的大规模强化学习框架RLinf重磅开源》
📌文章链接：https://www.fsgameo.com/breaking-news/10575.html
⚠须知：本站资源仅供个人学习交流，请于下载后24小时内删除，不允许用于商业用途，否则法律问题自行承担。

分享到

首个为具身智能而生的大规模强化学习框架RLinf重磅开源

相关推荐

评论抢沙发

热门软件

热门AI工具

热门标签

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续提供更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫