Excel数据分析工具库是个很强大的工具,可以满足基本的统计分析,这里介绍用Excel数据分析工具库中的回归做回归分析 。
本节知识点:
- Excel数据分析工具库—回归
- 线性回归和非线性回归
- 简单线性回归和多重线性回归
- 逻辑斯蒂回归
1、定义
确定两种或两种以上变量间相关关系的一种统计分析方法 。通过数据间相关性分析的研究,进一步建立自变量(i=1,2,3,…)与因变量Y之间的回归函数关系,即回归分析模型,从而预测数据的发展趋势 。
2、分类
- 按照涉及的变量的多少,分为一元回归和多元回归分析;
- 按照因变量的多少,可分为简单回归分析和多重回归分析;
- 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析 。
1、简单线性回归
简单线性回归又叫一元线性回归,即回归模型中只有一个自变量和一个因变量,其回归方程可以表示为:
Y=a+bx+

其中,Y表示因变量,x表示自变量,a是 常数,b是斜率,

是随机误差 。
2、最小二乘法:
如何确定参数a和b,则要用最小二乘法来实现 。通过最小化误差的平方和寻找数据的最佳函数匹配,即使得观测点和估计点的距离的平方和最小 。
3、线性回归分析的步骤:
- 确定自变量和因变量
- 绘制散点图,确定回归模型类型
- 估计模型参数,建立回归模型:最小二乘法进行模型参数估计
- 对回归模型进行检验
- 利用回归模型进行预测
定义:一个因变量与多个自变量的线性回归问题,是一元线性回归的推广 。其回归方程可以写为:

多重线性回归方程中回归系数的估计也是用到最小二乘法
三、用Excel做回归分析
我们研究销售额Y和推广费用X1之间的关系,数据如下:

首先我们用数据分析—相关系数分析计算一下自变量和因变量之间的相关系数为0.95157,为强相关 。

绘制散点图如下:

然后,我们用数据分析库里的回归来做分析

注意Y值和X值输入区域,X值是自变量,Y是因变量 。

四、线性回归方程的检验
评价回归拟合程度好坏(重要):

1、 先看回归统计表,Multiple R即相关系数R的值,和我们之前做相关分析得到的值一样,大于0.8表示强正相关 。
2、 回归统计表中的R Square是R平方值,R平方即R的平方,又可以叫判定系数、拟合优度,取值范围是[0,1],R平方值越大,表示模型拟合的越好 。一般大于70%就算拟合的不错,60%以下的就需要修正模型了 。这个案例里R平方0.9054,相当不错 。
3、 Adjusted R是调整后的R方,这个值是用来修正因自变量个数增加而导致模型拟合效果过高的情况,多用于衡量多重线性回归 。
推荐阅读
- 制作excel表中斜线怎么添加 excel表格制作里面的斜线怎么制作方法
- 莱西属于青岛吗 山东省县级市莱西的发展潜力分析
- excel统计某个词出现次数 单元格文本中出现次数函数
- 三星S21值不值得买?不少于2000个字的分析
- 使用EXCEL数据有效性,制作下拉列的有几种方法 ?
- 起亚K3发动机寿命分析
- 经济师职业前景分析 经济师有哪些前景?
- Excel如何制作表格 excel如何制作表格
- 大数据分析平台 有哪些特色?
- 打开excel表出现找不到mypersonnel.xls
