注册登录

专栏名称: 孔某人的低维认知

孔某人低维认知中世界的投影，世界很复杂，但人的认知总是过于简单。 ####关注领域：LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

北京吃货小分队 · 北京冬日顶流，去这里散步吧 · 5 小时前

微观三农 · 10部门发布意见进一步加强农民工服务保障 · 昨天

CFC商品策略研究 · 【建投黑金】铁矿周报：自身矛盾有限，矿价跟随 ... · 5 天前

今天看啥 › 专栏 › 孔某人的低维认知

论文解读：Physics of Language Models（面向应用层读者）【2024.7】

孔某人的低维认知 · 公众号 · · 2024-07-28 18:24

文章预览

全文共约8k字。本专栏的论文选读是面向那些不从0训练LLM的读者，例如中间件层、应用层的从业者等。 1、论文及链接本次推荐的《Physics of Language Models》实际上是一个系列，目前公开的文章如下： Part 1, Learning Hierarchical Language Structures https://arxiv.org/abs/2305.13673 Part 2，文章会于近期发布。 Part 3.1, Knowledge Storage and Extraction https://arxiv.org/abs/2309.14316 Part 3.2, Knowledge Manipulation https://arxiv.org/abs/2309.14402 Part 3.3, Knowledge Capacity Scaling Laws https://arxiv.org/abs/2404.05405 作者的其他文章可以通过以下链接查看： https://arxiv.org/search/cs?searchtype=author =Allen-Zhu,+Z 作者之前也对该系列进行了分享，并在最近的ICML 2024会议上做了一个整合报告，其中包括了Part 2的内容。考虑到读者的时间，我推荐观看该整合报告的视频即可，链接如下： https://www.bilibili.com/video/BV1Yw4m1k7nH/ 2 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

北京吃货小分队 · 北京冬日顶流，去这里散步吧

5 小时前

微观三农 · 10部门发布意见进一步加强农民工服务保障

昨天

CFC商品策略研究 · 【建投黑金】铁矿周报：自身矛盾有限，矿价跟随钢材波动

5 天前

工信微报 · 以设备更新推动传统产业升级

4 月前

宇宙解码 · 冥王星到底有多可怕？为何有人说它被踢出行星行列，一点也不冤？

3 月前

全国城市农贸中心联合会 · 一叶知秋意夏尽待丰收

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号