让AI赋能专业,用软件服务网友
全站绿色,Ctrl+D 快捷收藏网站

字节开源大型语言模型 Seed-OSS-36B


8月21日消息显示,字节跳动旗下Seed团队于人工智能代码共享平台Hugging Face正式推出全新开源大模型Seed-OSS-36B。该模型架构融合了多项前沿技术设计元素,包括因果语言建模机制、分组查询注意力(Grouped Query Attention)模块、SwiGLU激活函数以及RMSNorm标准化方法,并采用RoPE旋转位置编码方案。每个模型单元包含360亿参数量级,构建于深度达64层的神经网络架构之上,并配备15.5万维度的词汇表体系。值得关注的是,该模型的最大上下文长度可达512K tokens,在保持性能稳定的同时能够高效处理超长文档及复杂推理任务。(广角观察)

赞(0) 打赏
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《字节开源大型语言模型 Seed-OSS-36B》
📌文章链接:https://www.fsgameo.com/breaking-news/10439.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

请在浏览器中打开