10月14日最新消息显示,蚂蚁集团于当日凌晨正式发布具备万亿参数规模的推理模型Ring-1T,并同步开放模型权重与训练配方。该模型在9月30日发布的预览版Ring-1T-preview基础上持续优化,通过扩展大规模可验证奖励强化学习(RLVR)训练范式,显著提升了万亿级参数基座的自然语言推理能力。同时借助强化学习与人类反馈结合(RLHF)技术体系,在多模态任务评估榜单中实现了性能均衡性突破。
作为专业级推理模型,Ring-1T在"人类偏好对齐"基准测试Arena-Hard V2中表现尤为突出:其81.59%的成功率不仅位列开源模型首位,在技术指标上已接近GPT-5-Thinking(High) 82.91%的行业标杆水平。(广角观察)