让AI赋能专业,用软件服务网友
全站绿色,Ctrl+D 快捷收藏网站

首个为具身智能而生的大规模强化学习框架RLinf重磅开源


9月1日最新消息显示,清华大学联合北京中关村学院、无问芯穹及北京大学、加州大学伯克利分校等科研机构共同推出全球首个面向具身智能的"渲染-训练-推理一体化"大规模强化学习框架RLinf,并正式开源该系统。RLinf架构采用六层模块化设计:用户层(统一编程接口)、任务层(多后端集成方案)、执行层(灵活执行模式)、调度层(自动化资源调度)、通信层(自适应通信机制)和硬件层(异构计算支持)。相较于传统框架的分离式执行方案,在具身智能训练场景中其创新性混合执行模式实现了超过120%的系统性能提升,并使视觉语言模型参数效率提升40%-60%。该框架凭借高度模块化与可扩展特性,已成功将1.5B和7B规模的数学推理大模型在AIME24、AIME25及GPQA-diamond基准测试中推向新高水准。(广角观察)

赞(0) 打赏
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《首个为具身智能而生的大规模强化学习框架RLinf重磅开源》
📌文章链接:https://www.fsgameo.com/breaking-news/10575.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

请在浏览器中打开