文章预览
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 大纲 介绍 个人背景:韩迟,伊利诺伊大学厄巴纳-香槟分校(UIUC)四年级博士生 论文成就:ACL2024年杰出论文奖,论文名为LM-Steer 研究方向:语言模型表征的理解 论文LM-Steer 核心观点:理解词向量在语言模型中的作用,提供解释和分析 模型控制:通过词向量视角提供方便灵活的控制原模型输出的方法 合作机构:伊利诺伊大学厄巴纳-香槟分校及斯坦福大学 相关论文LM-Infinite 研究问题:语言模型中长度表征可能出现的问题 分布偏移问题:发现过长长度上可能出现的分布偏移问题及其根源 解决方案:提出LM-Infinite,改变语言模型计算自注意力分数的方式,无需微调,零样本情况下延长模型到非常长长度 相关研究 词向量的类比关系:如Kings与Queens的关系 词向量的矩阵度量空间:探讨不同词之间的
………………………………