让AI赋能专业,用软件服务网友
全站绿色,Ctrl+D 快捷收藏网站

Yuan3.0 Ultra多模态基础大模型开源

3月5日快讯:YuanLab.ai团队正式开源推出"源Yuan3.0 Ultra"万亿级多模态大模型。这款旗舰产品作为源3.0系列中首个专为万亿参数量级设计的版本,已跻身全球仅有的三个开源万亿级多模态大模型之列。该模型采用统一架构体系构建,整合视觉编码器、语言主干网络及多模态对齐模块三大核心组件,在视觉与语言信息融合处理方面实现突破性进展。

其核心的语言主干网络采用混合专家(MoE)架构设计包含103层Transformer结构,在初始训练阶段即达到15150亿参数规模。通过创新性的LAEP技术优化方案,在预训练过程中成功将参数量压缩至1010亿级别,并实现预训练算力效率49%的显著提升。值得关注的是该模型具备688亿激活参数规模,在保持高性能的同时有效控制了计算资源消耗。

此外Yuan3.0 Ultra特别引入Localized Filtering Attention(LFA)机制,在语义关系建模方面展现出更强的表达能力。实验数据显示相较于传统注意力机制结构,在多项关键指标上实现了精度提升。(广角观察)

赞(0) 打赏
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《Yuan3.0 Ultra多模态基础大模型开源》
📌文章链接:https://www.fsgameo.com/breaking-news/12712.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

请在浏览器中打开