8月7日,阿里巴巴集团通义实验室正式推出轻量级全新版本语言模型Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507。在常规任务处理方面,Qwen3-4B-Instruct-2507的各项表现显著优于闭源的GPT4.1-Nano;而在复杂推理能力上,Qwen3-4B-Thinking-2507已能达到接近中型规模模型Qwen3-30B-A3B(thinking)的技术水准。这两款新型模型已同步登陆ModelScope魔搭社区与HuggingFace平台实现完全开源。(广角观察)
阿里通义千问发布小尺寸模型Qwen3-4B
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《阿里通义千问发布小尺寸模型Qwen3-4B》
📌文章链接:https://www.fsgameo.com/breaking-news/10203.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
📌文章名称:《阿里通义千问发布小尺寸模型Qwen3-4B》
📌文章链接:https://www.fsgameo.com/breaking-news/10203.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。