4月16日电 据《自然》杂志15日刊发的研究显示,大语言模型(LLM)可能存在将自身偏好"夹带私货"传递给其他算法的现象。即便在清除原始训练数据中的相关特征后,这些本不应存在的属性仍可能持续存在。研究案例表明,有模型通过数据中的隐含线索将对猫头鹰的偏好传导至其他模型。这一发现提示,在开发大型语言模型时需建立更加严格的安全审查机制。(科技日报)
大语言模型会在蒸馏中“夹带”自己的偏好
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《大语言模型会在蒸馏中“夹带”自己的偏好》
📌文章链接:https://www.fsgameo.com/breaking-news/13365.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
📌文章名称:《大语言模型会在蒸馏中“夹带”自己的偏好》
📌文章链接:https://www.fsgameo.com/breaking-news/13365.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。













