文章预览
线性回归的基本概念 线性回归分析是数据挖掘里一个非常重要的方法,相信大家以前在高中或者大学时都学过一点点线性回归的概念。在统计学中, 线性回归(Linear Regression) 是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。 听着有点复杂,简单来说,就是看一组零散的数据 是否存在相关性 。 直白点说,就是在图像上给你一堆点,你来找一条线,然后让这条线尽可能的在所有点的中间。 这个找直线的过程,就是在做回归了。 如下图所示。 线性回归是 一种预测连续值的统计方法 。它假设因变量(Y)与一个或多个自变量(X)之间存在线性关系。简单线性回归涉及一个自变量和一个因变量,其模型可以表示为 Y = β0 + β1X + ε,其中β0是截距,β1是斜率,ε是误差项。 进一步思考: 为什么
………………………………