文章预览
KAN is a language model for AI + Science. 最近一周 KAN 的热度逐渐褪去,正好静下心来仔细学习 KAN 的原理,收获颇多。 KAN 是一种全新的神经网络架构,它与传统的 MLP 架构不同,能够用更少的参数量在 Science 领域取得惊人的表现,并且具备可解释性,有望成为深度学习模型发展的一个重要方向。 运用KAN,我们不仅能够在函数拟合、偏微分方程求解(PDE)上取得不错的成果,甚至能够解决拓扑理论中的Knot
Theory、处理凝聚态物理中的Anderson Localization问题。 K AN一经推出便引爆了整个AI圈,短短几天就在github上获得了10k以上的stars。各路大神蜂拥而至,对KAN做出多种改进,提出了EfficientKAN、FourierKAN,甚至Kansformer等全新架构。 那么 KAN 究竟是什么,它有哪些独特价值,它对未来 AI 发展又有哪些启发呢? 近期 KAN 论文的一作 Ziming 做了一场精彩的分享,从数学原理
………………………………