文章预览
作 者: 胡赟豪 本文 约3000字 ,建议阅读 7分钟 本文介绍了大语言模型的思维链。 导读 在这个信息爆炸的时代,你是否曾幻想过与机器流畅交谈,或是让AI助你笔下生花,创作出惊艳的文章?这一切,都离不开大语言模型的神奇魔力。今天,让我们一起揭开这层神秘的面纱,走进大语言模型的科普奇幻之旅! 一 背景 自大语言模型兴起以来,人们通过不断地增加参数量,使模型的效果得到一次又一次的跃升。但是,单纯的增加参数量只能让模型在阅读理解、事实确认等方面提升显著,在逻辑推理、数学推理等复杂推理问题方面收益却不大。 针对这一问题,一个直观的改良方法就是微调(Finetune),通过引入大量“问题+答案”形式的样本,对模型进行训练迭代参数,从而让模型专门提升这方面的能力。然而,这种方式在复杂推理等问题
………………………………