文章预览
作者:zhaikun 风控建模屌丝一枚,现居于北京 个人微信公众号:Python数据分析与评分卡建模 看过kaggle比赛,学习过kaggle大神代码,但由于各种各样原因一直未实际参加过kaggle比赛,也算是小萌新吧。相信也有很多小伙伴听说过kaggle,想参加,却一直没时间参加或不知道怎么参加,今天就做次教学吧。 泰坦尼克号是 kaggle 的比赛入门项目之一,网站 https://www.kaggle.com/c/titanic/leaderboard。 不要听书新手比赛就小瞧他,抛开其中的历史含义与其中的代价,这个数据集是个非常经典的数据集。经典道什么程度呢? 1.他基本包含了你建模过程中的所有变量类型和数据处理方法 2.891个训练样本,418个测试样本,那么所有关于模型的想法、组合与测试,都可以在这个数据集
………………………………