注册登录

专栏名称: PaperAgent

日更，解读AI前沿技术热点Paper

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

有方空间 · 新作｜虚张声势之家 - 废土乐园 / 察社办公室 · 2 天前

何夕 · 中国古代的所谓“彩礼” —— ... · 2 天前

何夕 · 以上几条，就是A股的基本生态。不在市场长期呆 ... · 4 天前

何夕 · 没被打脸查看图片-20241119150853 · 6 天前

今天看啥 › 专栏 › PaperAgent

Open LLM集中爆发的一周，卷疯了！

PaperAgent · 公众号 · · 2024-09-07 15:01

文章预览

开源大模型领域热闹非凡的一周，各种开源，PaperAgent进行了概括：端侧、Code、RAG、Agent、Reflection（反思纠正）、MoE ，你关注的都在这里了 Reflection Llama-3.1-70B 开源 Reflection Llama -3.1 70B 是世界上顶尖的Open LLM ，通过反思微调技术（ Reflection-Tuning ）训练，能够检测并纠正推理错误，具有很高的热度， Hugging Face热门排行Top1。 Agent中需要LLM具有很强的推理规划能力，这种反思技术训练的模型是否很契合Agent尼？有待进一步验证该模型使用Glaive生成的合成数据进行训练，Glaive是一个强大的模型训练工具。模型可以通过特定的代码和管道进行采样，使用与标准 Llama 3.1相同的聊天模板格式。采样时，模型会先在标签内输出推理过程，然后使用标签修正错误，最后在标签内提供最终答案。这种设计使得模型能够区分内部思考和最终答案，提升用户体验。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

有方空间 · 新作｜虚张声势之家 - 废土乐园 / 察社办公室

2 天前

何夕 · 中国古代的所谓“彩礼” —— 女性在嫁人之后，一是几乎没有离婚自-20241123112053

2 天前

何夕 · 以上几条，就是A股的基本生态。不在市场长期呆着，根本就看不懂。不-20241121134323

4 天前

何夕 · 没被打脸查看图片-20241119150853

6 天前

sven_shi · 今年主基调还是止损。 2024的房地产：艰难的止损 -20240804140808

3 月前

中国国家地理 · 发现“植物庞贝城”，3亿年前的森林长这样！

3 月前

洞见 · 一个人最顶级的社交格局：一半装傻，一半扮哑

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号