专栏名称: 新机器视觉
最前沿的机器视觉与计算机视觉技术
今天看啥  ›  专栏  ›  新机器视觉

DeepSeek使用的蒸馏技术有可能用来“偷窃”吗?一文读懂 “知识蒸馏”

新机器视觉  · 公众号  ·  · 2025-02-08 11:45
    

文章预览

老蝉按:  DeepSeek一路高歌猛进之时,美国从克制性赞美突然变脸为进攻性指责,说DeepSeek“偷窃”了诸大模型的东西。这其中必然牵涉众多技术问题,而“蒸馏技术”是一个核心点,下面让我们先分别使用DeepSeek和ChatGPT来回答标题中的问题,然后再看后面的科普“蒸馏技术”的文章。孰是孰非只能让子弹再飞一会儿,但不可否认的是,DeepSeek的表现是让人惊艳的,梁文峰是个有思想的企业家和金融家,中国太缺少这样的人才: 问:DeepSeek使用的蒸馏技术有可能用来“偷窃”吗?一文读懂 “知识蒸馏” DeepSeek回答: 好的,用户问的是DeepSeek使用的知识蒸馏技术是否可能被用来“偷窃”。首先,我需要理解知识蒸馏的基本原理以及它在实际应用中的情况。知识蒸馏是一种模型压缩技术,通常是将大模型(教师模型)的知识迁移到小模型(学生模型)中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览