文章预览
最近o1圈很忙,国内先是 DeepSeek-R1-Lite上线, 阿里国际开源Marco-o1 ,没几天,阿里千问系列又开源了 QwQ-32B-Preview : 专注于增强 AI 推理能力。 具体表现如下: 强大的数学问题解决能力 ,在AIME、MATH-500数学评测上,超过了OpenAI o1-preview 优秀的编码能力 , LiveCodeBench接近OpenAI o1-preview 其他方面还有很大的提升空间,比如科学推理能力GPQA 数学推理case,超长推理过程 https: / /qwenlm.github.io/zh /blog/qwq - 32 b-preview/ model https: / /huggingface.co/ Qwen/QwQ- 32 B-Preview demo https: / /huggingface.co/spaces /Qwen/ QwQ- 32 B-preview 推荐阅读 • 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO • 2024:ToB、Agent、多模态 • RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG! • Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图) 欢迎关注我的
………………………………