1月21日最新消息显示,DeepSeek公司计划于今年2月中旬正式发布新一代旗舰级AI模型DeepSeek V4。该模型将采用全新技术架构,在代码生成能力方面预计将迎来大幅提升。通过分析其官方GitHub仓库近期更新的FlashMLA代码库(涵盖114个文件类型包括Python脚本、文档及源代码等),研究人员发现了一项此前未公开的模型架构标识符"MODEL 1"。该标识在代码中被提及31次。
作为DeepSeek自主研发的技术成果,FlashMLA是一款针对英伟达Hopper架构GPU深度优化的专用软件工具,旨在显著提升大模型推理生成阶段的运算效率。目前确认"MODEL 1"是DeepSeek FlashMLA支持的两大核心模型架构之一,另一款为现有的DeepSeek-V3.2版本。(广角观察)












