文章预览
2025-02-10 12:13
本条微博链接
200页的大模型论文(书?)《Foundations of Large Language Models》 这是一本关于大型语言模型的书。正如书名所示,它主要关注基础概念,而不是全面涵盖所有前沿技术。本书分为四个主要章节,每章探讨一个关键领域:预训练、生成模型、提示技术和对齐方法。 它面向自然语言处理和相关领域的大学生、专业人士和从业者,也可以作为对大型语言模型,包括DeepSeek感兴趣的人的参考。 访问:arxiv.org
………………………………