文章预览
老蝉按: DeepSeek一路高歌猛进之时,美国从克制性赞美突然变脸为进攻性指责,说DeepSeek“偷窃”了诸大模型的东西。这其中必然牵涉众多技术问题,而“蒸馏技术”是一个核心点,下面让我们先分别使用DeepSeek和ChatGPT来回答标题中的问题,然后再看后面的科普“蒸馏技术”的文章。孰是孰非只能让子弹再飞一会儿,但不可否认的是,DeepSeek的表现是让人惊艳的,梁文峰是个有思想的企业家和金融家,中国太缺少这样的人才 ( 中国的西蒙斯震惊全球AI圈,这才是中国AI大模型该有的样子! ) : 问:DeepSeek使用的蒸馏技术有可能用来“偷窃”吗?一文读懂 “知识蒸馏” DeepSeek回答: 好的,用户问的是DeepSeek使用的知识蒸馏技术是否可能被用来“偷窃”。首先,我需要理解知识蒸馏的基本原理以及它在实际应用中的情况。知识蒸馏是一种模型压缩技术
………………………………