文章预览
作者:刘建平Pinard 链接:https://www.cnblogs.com/pinard/p/6047802.html 编辑:石头 在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数 。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能, 我们可以自己生成适合某一种模型的数据,用随机数据来做清洗,归一化,转换,然后选择模型与算法做拟合和预测 。下面对scikit-learn和numpy生成数据样本的方法做一个总结。 完整代码参见github: https://github.com/ljpzzz/machinelearning/blob/master/mathematics/random_data_generation.ipynb 目录 1. numpy随机数据生成API 2. scikit-learn随机数据生成API介绍 3. scikit-learn随机数据生成实例 1. numpy随机数据生成API numpy比较适合用来生产一些简单的抽样数据。API都在random类中,常见的API有: 1)
………………………………