主要观点总结
文章主要讨论了神经网络可解释性的第一性原理,即解释神经网络内在机理的理论。提出了等效交互可解释性理论体系,从三个角度解释神经网络的内在机理,并基于该理论,提出了对神经网络可解释性方向的工程性算法的理论凝练。同时,文章还讨论了神经网络训练过程中的两阶段现象,即神经网络如何逐渐消除中高阶交互,学习低阶交互,然后逐渐建模阶数不断增大的交互,并精确预测出神经网络每一个时间点上所学到的交互概念的数量、复杂度,以及泛化性变化的动力学规律。此外,文章还讨论了神经网络的泛化性问题,认为它是一个混合模型问题,而不是一个高维空间的向量,以及交互的定义和性质。
关键观点总结
关键观点1: 等效交互可解释性理论体系
提出了等效交互可解释性理论体系,从三个角度解释神经网络的内在机理,并基于该理论,提出了对神经网络可解释性方向的工程性算法的理论凝练。
关键观点2: 神经网络训练的两阶段现象
讨论了神经网络训练过程中的两阶段现象,即神经网络如何逐渐消除中高阶交互,学习低阶交互,然后逐渐建模阶数不断增大的交互,并精确预测出神经网络每一个时间点上所学到的交互概念的数量、复杂度,以及泛化性变化的动力学规律。
关键观点3: 神经网络的泛化性问题
讨论了神经网络的泛化性问题,认为它是一个混合模型问题,而不是一个高维空间的向量,以及交互的定义和性质。
文章预览
一、前言 长期以来,我们团队一直在思考可解释性领域的一个终极问题,即 什么才是解释性领域的第一性原理 ?所谓第一性原理,目前没有一个被广泛接受的框架,世上本无路,我们需要逐渐去定义这样一个路。我们 需要在一个新的理论体系中,提出大量的公理性要求,得出一个可以从不同的角度全方位精确严谨解释神经网络内在机理的理论。一套理论系统能严谨解释神经网络的方方面面才叫 “第一性原理” 。 如果你真的在严谨地做 “科学”,那么第一性原理一定不是想象中简单,而是一个复杂的体系,需要研究照顾到深度学习中方方面面纷繁复杂的现象。当然,如果你主观上不愿意或者不信一个理论需要足够严谨,那么研究会变得简单千万倍。就像物理学的标准模型一定比牛顿定律复杂,取决于你希望走哪条路。 沿着这个方向,我们团队
………………………………