在深度学习中，是否应该打破正负样本1:1的迷信？

机器学习实验室 · 公众号 · · 2024-09-25 16:11

文章预览

作者丨刘芷宁伊利诺伊大学香槟分校来源丨PaperWeekly 在深度学习中，样本不均衡普遍被认为是数据集中不同类别的样本数量不等。特别地，当训练集和测试集的类别分布不匹配时，采用处理样本不均衡的策略显得尤为重要。然而，当训练集和测试集分布匹配，但是正负样本比例仍然是悬殊的，这种情况下是否有必要再引入处理不平衡样本的策略？例如，在自然科学领域，如预测药物与靶点结合（即正负样本）的场景中，实际情况往往是正负样本本身不均衡的。在这种情况下，使用过采样等技术人为使训练集中的正负样本比例达到 1:1 是否合理？笔者做过相当长一段时间的不平衡/长尾问题，上述内容对两个问题答案的假设一对一错。 Q：是否应该打破正负样本 1:1 的迷信思想？ A：是的，类别不平衡的比例只是表象，并非本质。 Q：当训练集和测 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博