专栏名称: 量化研究方法
以量化之思想认识世界,体会量化之美。
今天看啥  ›  专栏  ›  量化研究方法

如何使用 sklearn 优雅地进行数据挖掘?

量化研究方法  · 公众号  ·  · 2024-07-15 17:00
    

文章预览

本文转载自公众号  数据分析与开发 作者:jasonfreak https://www.cnblogs.com/jasonfreak/p/5448462.html 版权说明: 内容仅做学术分享之用,版权归原作者所有,若涉及侵权等行为,请后台联系我们删除,万分感谢! 一、 使用sklearn 数据挖掘 1.数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。 显然 ,这不是巧合,这正是sklearn的设计风格。我们能够更加优雅地使用sklearn进行特征工程和模型训练工作。此时,不妨从一个基本的数据挖掘场景入手: 我们使用sklearn进行虚线框内的工作(sklearn也可以进行文本特征提取)。通过分析sklearn源码,我们可以看到除训练,预测和评估以外,处理其他工作的类都实现了3个方法: fit、transform 和 fit_transform 。从命名中可以看到,fit_transform方法是先调用fit然后调用transform,我们只 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览