文章预览
DeepClaude 是一个有趣的项目,它将 DeepSeek-R1 的推理过程传递给 Claude 3.5 Sonnet 来使用,利用两种模型各自的优势,输出更高质量的内容。@Appinn 大致思路是这样的: 使用 标签包裹 DeepSeek 的推理过程 将推理内容作为 assistant 消息附加到对话历史中 同时支持流式和非流式两种处理模式 在流式处理中严格保持标签的完整性(先发起始标签,再发内容,最后结束标签) 在组合响应时,将 thinking 内容放在 Anthropic 响应之前这种设计使得 Claude 3.5 Sonnet 能够将 DeepSeek 的推理过程作为上下文的一部分进行处理,从而实现协同工作。 为什么是 R1 + Claude 3.5 Sonnet? 开发者这样描述: DeepSeek R1 的 Cot Trace 展示了深层的推理 LLM 体验“元认知” – 纠正自己,思考边缘案例并以自然语言进行准蒙特卡洛树搜索。 但是,R1 缺乏代码生成,创造力和对话技能。Claude 3.5 Sonnet
………………………………