专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
今天看啥  ›  专栏  ›  PaperWeekly

在深度学习中,是否应该打破正负样本1:1的迷信思想?

PaperWeekly  · 公众号  · 科研  · 2024-09-24 13:03
    

文章预览

©PaperWeekly 原创 · 作者 | 刘芷宁 学校 | 伊利诺伊大学香槟分校 研究方向 | 不平衡学习、可信机器学习 在深度学习中,样本不均衡普遍被认为是数据集中不同类别的样本数量不等。特别地,当训练集和测试集的类别分布不匹配时,采用处理样本不均衡的策略显得尤为重要。 然而,当训练集和测试集分布匹配,但是正负样本比例仍然是悬殊的,这种情况下是否有必要再引入处理不平衡样本的策略?例如,在自然科学领域,如预测药物与靶点结合(即正负样本)的场景中,实际情况往往是正负样本本身不均衡的。在这种情况下, 使用过采样等技术人为使训练集中的正负样本比例达到 1:1 是否合理? 笔者做过相当长一段时间的不平衡/长尾问题,上述内容对两个问题答案的假设一对一错。 Q:是否应该打破正负样本 1:1 的迷信思想? A:是的,类别不平 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览