专栏名称: 孔某人的低维认知
孔某人低维认知中世界的投影,世界很复杂,但人的认知总是过于简单。 ####关注领域:LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。
今天看啥  ›  专栏  ›  孔某人的低维认知

论文解读:Physics of Language Models(面向应用层读者)【2024.7】

孔某人的低维认知  · 公众号  ·  · 2024-07-28 18:24

文章预览

全文共约8k字。 本专栏的论文选读是 面向那些不从0训练LLM的读者 , 例如中间件层、应用层的从业者等。 1、论文及链接 本次推荐的《Physics of Language Models》实际上是一个系列,目前公开的文章如下: Part 1, Learning Hierarchical Language Structures  https://arxiv.org/abs/2305.13673 Part 2,文章会于近期发布。 Part 3.1, Knowledge Storage and Extraction  https://arxiv.org/abs/2309.14316 Part 3.2, Knowledge Manipulation  https://arxiv.org/abs/2309.14402 Part 3.3, Knowledge Capacity Scaling Laws  https://arxiv.org/abs/2404.05405 作者的其他文章可以通过以下链接查看: https://arxiv.org/search/cs?searchtype=author =Allen-Zhu,+Z 作者之前也对该系列进行了分享,并在最近的ICML 2024会议上做了一个整合报告,其中包括了Part 2的内容。考虑到读者的时间,我推荐观看该整合报告的视频即可,链接如下: https://www.bilibili.com/video/BV1Yw4m1k7nH/ 2 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览