专栏名称: CSDN
CSDN精彩内容每日推荐。我们关注IT产品研发背后的那些人、技术和故事。
今天看啥  ›  专栏  ›  CSDN

分分钟带你杀入Kaggle Top 1%

CSDN  · 公众号  · 科技媒体  · 2017-07-10 16:00
    

文章预览

作者:吴晓晖  中山大学(SYSU)数据科学与计算机(硕士) 本文经作者授权转载自吴晓晖知乎专栏 原文:https://zhuanlan.zhihu.com/p/27424282 不知道你有没有这样的感受,在刚刚入门机器学习的时候,我们一般都是从MNIST、CIFAR-10这一类知名公开数据集开始快速上手,复现别人的结果,但总觉得过于简单,给人的感觉太不真实。因为这些数据太“完美”了(干净的输入,均衡的类别,分布基本一致的测试集,还有大量现成的参考模型),要成为真正的数据科学家,光在这些数据集上跑模型却是远远不够的。而现实中你几乎不可能遇到这样的数据(现实数据往往有着残缺的输入,类别严重不均衡,分布不一致甚至随时变动的测试集,几乎没有可以参考的论文),这往往让 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览