Datawhale发顶会了🎉,代码完全开源 《RMIB: Representation Matching Information Bottleneck for Matching Text Representations》 文本表示匹配中的表示匹配信息瓶颈(RMIB) 【作者】:潘海辉,猎户星空算法工程师、谢文睿,Datawhale 【摘要】:最近的研究表明,文本表示的域匹配将有助于提高非对称域文本匹配任务的泛化能力。这就要求文本表示的分布要尽可能的相似,类似于与异构数据域的匹配,才能使得特征提取后的数据不可区分。然而,如何匹配文本表示的分布仍然是一个悬而未决的问题,并且文本表示分布匹配的作用仍不清楚。在本论文中,我们通过将文本表示与相同的先验分布进行匹配来明确缩小文本表示的分布。我们从理论上证明,缩小非对称域文本匹配中文本表示的分布相当于优化信息瓶颈(IB)。由于文本表示之间的交互在非对称域文本匹配中起着重
………………………………