专栏名称: AI前沿观察网
专注 CV\x26amp;NLP,功能:每日AI类文章汇总;支持通过发送私信实现基于关键词的文章检索(仅限关注者);个人博客:https://firrice.github.io
目录
相关文章推荐
今天看啥  ›  专栏  ›  AI前沿观察网

2025-2-17 AI热点速览

AI前沿观察网  · 公众号  ·  · 2025-02-17 09:17
    

文章预览

今日AI领域最新热点新闻: DeepSeek-R1 : 论文深入探讨了DeepSeek-R1的训练流程,展示了如何通过强化学习提升大型语言模型的推理能力。 DeepSeek Math : 该项目旨在提升大型语言模型在数学推理和符号处理方面的能力,专注于解决复杂的数学问题。 DeepSeek V3 : DeepSeek V3是DeepSeek系列的一个重要版本,拥有6710亿参数,通过稀疏MoE架构优化了计算效率。 DeepSeek-R1-Zero : 该模型是通过纯强化学习训练的,验证了RL在提升模型推理能力方面的有效性,但存在可读性和语言混杂问题。 DeepSeek-R1-Distill : 通过蒸馏技术,将DeepSeek-R1的能力迁移到较小的模型中,如Qwen和Llama,使得这些模型在推理任务上表现更佳。 KTransformers : 这是由清华大学开发的开源框架,支持在单卡24GB VRAM的GPU上高效运行满血版DeepSeek-R1,显著提升了推理速度。 EMO2 : EMO2是阿里巴巴通义实验室 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览