专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

KAN 会引起大模型的范式转变吗?

AINLP  · 公众号  ·  · 2024-06-05 10:10
    

文章预览

作者 | 李维   高佳 KAN 网络算法,如同在 AI 技术圈投下了一枚重磅炸弹,让 AI 界震荡不减。 发布一个月的时间内,FastKAN、 FasterKAN kansformers等基于 KAN 的扩展模型 层出不穷。 第一作者华人科学家刘子鸣提出新的神经网络结构—— KAN(Kolmogorov-Arnold 网络) ,这一由数学启发、媲美“Transformer”进阶版的神经网络原型,以其实验表现的优异性能,让业内侧目。 它会成为深度学习的下一个范式吗? 如所众知,多层感知器(MLP)是深层神经网络的核。如果核上出现变革,说它预示着范式转变,听上去也是 make sense 的。 KAN 就是这种“核变”,它将可学习的激活函数从神经元移到了神经网络的边(权重)上,这样一个创新改变据实验带来了巨大效应——更高的准确性、更少的参数量、更快的收敛速度和更好的可解释性。这里的每一条,都足以令人兴奋, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览