专栏名称: 关于NLP那些你不知道的事

整理自然语言处理、推荐系统、搜索引擎等AI领域的入门笔记，论文学习笔记和面试资料（关于NLP那些你不知道的事、关于推荐系统那些你不知道的事、NLP百面百搭、推荐系统百面百搭、搜索引擎百面百搭）

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

避开复数推导，我们还可以怎么理解RoPE？

关于NLP那些你不知道的事 · 公众号 · · 2024-10-17 08:00

文章预览

大家好，今天的这篇文章，我想避开复数的推导，从一些全新的、更好玩、更可视化的角度，来探究RoPE的原理和各种性质。这里所说的“可视化”，不仅仅是大家熟悉的“空间向量的旋转”，而是：具体能让你在调控RoPE的超参时，可以在脑海里快速绘制出一副图，预估你的调参对模型效果的大致影响或者是当你想探寻衰减性和外推性时，你的脑海里不再仅有代表结果的那一副曲线图，你能动态地绘制出这些重要的性质是怎么一步步产生的。诸如此类。而当你看完这篇文章，你就能站在几何的角度去理解复数推导的过程了（复数的运算本身就具有几何意义，本文也会给出一定解读）。【全文目录如下】一、原始Transformer函数式位置编码 1.1 从旋转的角度理解原理 1.2 这个位置编码为什么得不到人们的青睐二、RoPE 2.1 在做一件什么事 2.2 旋转角度 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

凤凰网 · “国足踢得不错，值得往下看看”

昨天

凤凰网 · “国足踢得不错，值得往下看看”

昨天

文刀老湿 · 4种变种！短传/平衡/反击/双边路版 4222战术板应用&球员&起源（附球员推荐表）

昨天

体坛周报 · 火线 | 国足的定位球防守得好好练练了……

2 天前

体坛周报 · 火线 | 国足的定位球防守得好好练练了……

2 天前

一周进步 · 先码住，等到要用PPT才想起来就晚了！

4 月前

中国期货业协会 · 交易者教育优秀案例 | 增强收益，陶谦三让徐州于刘备（下）

3 月前

清华大学智能法治研究院 · 数据空间中是否需要区块链进行同意管理？

1 月前