专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

KAN 会引起大模型的范式转变吗？

AINLP · 公众号 · · 2024-06-05 10:10

文章预览

作者 | 李维高佳 KAN 网络算法，如同在 AI 技术圈投下了一枚重磅炸弹，让 AI 界震荡不减。发布一个月的时间内，FastKAN、 FasterKAN kansformers等基于 KAN 的扩展模型层出不穷。第一作者华人科学家刘子鸣提出新的神经网络结构—— KAN（Kolmogorov-Arnold 网络），这一由数学启发、媲美“Transformer”进阶版的神经网络原型，以其实验表现的优异性能，让业内侧目。它会成为深度学习的下一个范式吗？如所众知，多层感知器（MLP）是深层神经网络的核。如果核上出现变革，说它预示着范式转变，听上去也是 make sense 的。 KAN 就是这种“核变”，它将可学习的激活函数从神经元移到了神经网络的边（权重）上，这样一个创新改变据实验带来了巨大效应——更高的准确性、更少的参数量、更快的收敛速度和更好的可解释性。这里的每一条，都足以令人兴奋， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博