让AI赋能专业,用软件服务网友
全站绿色,Ctrl+D 快捷收藏网站

DeepSeek AI新模型:搭载 MODEL1 全新架构,最快2月上线

1月21日最新消息显示,DeepSeek公司计划于今年2月中旬正式发布新一代旗舰级AI模型DeepSeek V4。该模型将采用全新技术架构,在代码生成能力方面预计将迎来大幅提升。通过分析其官方GitHub仓库近期更新的FlashMLA代码库(涵盖114个文件类型包括Python脚本、文档及源代码等),研究人员发现了一项此前未公开的模型架构标识符"MODEL 1"。该标识在代码中被提及31次。

作为DeepSeek自主研发的技术成果,FlashMLA是一款针对英伟达Hopper架构GPU深度优化的专用软件工具,旨在显著提升大模型推理生成阶段的运算效率。目前确认"MODEL 1"是DeepSeek FlashMLA支持的两大核心模型架构之一,另一款为现有的DeepSeek-V3.2版本。(广角观察)

赞(0) 打赏
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《DeepSeek AI新模型:搭载 MODEL1 全新架构,最快2月上线》
📌文章链接:https://www.fsgameo.com/breaking-news/12202.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

请在浏览器中打开