今天看啥  ›  专栏  ›  李rumor

deepseek-R1自测效果分析和选择建议

李rumor  · 公众号  ·  · 2025-03-10 09:18
    

文章预览

DeepSeek网上这么火,肯定是要直接上手试试的,我在实践中进行了尝试,有关这里面的体验和感受,今天这篇文章会和大家聊一聊。 具体场景问题不方便讨论,这里忽略了大量实验细节,只给出结论性描述,篇幅比较短,希望对大家有用吧。 集中讲优点 优点应该挺多人都会聊到,这里我集中先说一下自己场景下发现的优点细节。 对于需要强推理或者分析的任务,往往具有比较好的效果,例如某些数据的分析、推导、多信息或者复杂信息的总结和抽取。 和第一条类似,数学类、代码类的问题效果提升明显,应该和这方面的专项训练和数据有强关系。 长文本的处理和总结能力,效果会更好些,或者更严谨地说,长文本任务效果的衰减似乎会比其他模型要更慢。 通用任务的整体效果是有提升的,主要集中在一些曾经被认为是hard case的部分。 DS的think ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览