让AI赋能专业,用软件服务网友
全站绿色,Ctrl+D 快捷收藏网站

大语言模型会在蒸馏中“夹带”自己的偏好

4月16日电 据《自然》杂志15日刊发的研究显示,大语言模型(LLM)可能存在将自身偏好"夹带私货"传递给其他算法的现象。即便在清除原始训练数据中的相关特征后,这些本不应存在的属性仍可能持续存在。研究案例表明,有模型通过数据中的隐含线索将对猫头鹰的偏好传导至其他模型。这一发现提示,在开发大型语言模型时需建立更加严格的安全审查机制。(科技日报)

    赞(0) 打赏
    📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
    📌文章名称:《大语言模型会在蒸馏中“夹带”自己的偏好》
    📌文章链接:https://www.fsgameo.com/breaking-news/13365.html
    ⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

    评论 抢沙发

    觉得文章有用就打赏一下文章作者

    非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

    支付宝扫一扫

    微信扫一扫

    请在浏览器中打开