方差分析的基本原理 方差分析是检验什么的

方差分析(Analysis of Variance,简称ANOVA),用于比较多个总体的均值是否想等,由英国统计学家费希尔(Fisher)首先引入 。目前已经广泛应用于分析心理学、生物学、工程和医药的试验数据 。
一个例子消费者与产品生产者、销售者或服务提供者之间经常发生纠纷 。当发生纠纷后,消费者常常会向消费者协会投诉 。为了对几个行业的服务质量进行评价,消费者协会在零售、旅游业、航空公司、家电制造业抽取了不同的企业作为样本 。其中所抽取零售业7家、旅游业6家、航空公司5家、家电制造业5家 。每个行业中抽取的这些企业,服务对象、服务内容、企业规模等方面基本上相同的 。然后统计出最近一年中消费者对总共23家企业投诉的次数,结果如下表:
方差分析的基本原理 方差分析是检验什么的


问题:我们想知道这几个行业之间的服务质量是否有显著差异?一般来说,被投诉次数越多,说明服务质量越差 。要分析这四个行业之间的服务质量是否有显著差异,其实就是要判断行业(自变量)对被投诉次数(因变量)是否有显著影响 。相关术语
  • 因素:检验的对象,在上面的例子中指行业 。
  • 水平:因素的不同表现,在上方的例子中指零售业、旅游业、航空公司、家电制造业 。
  • 观测值:每个因子水平下得到的样本数据,在上方的例子中指每个行业下得到的被投诉次数(样本数据) 。
方差分析的基本原理1、图形描述绘制出被投诉次数和行业的散点图,如下图所示 。
方差分析的基本原理 方差分析是检验什么的


从散点图可以看出,不同行业被投诉的次数是有明显差异的,而且,在同一个行业,不同企业被投诉的次数也明显不同 。例如,家电制造业被投诉次数最多,航空公司被投诉次数较少,表明行业与被投诉次数之间有一定的关系 。说明:上方的图形通过Excel绘制,绘制折线图,然后调整样式 。2、误差分解仅仅从散点图上观察还不能提供充分的证据证明不同行业被投诉次数之间有显著差异,也许这种差异是由抽样的随机性造成的,因此,需要更加准确的方法来检验这种差异是否显著,也就是所谓的方差分析 。在方差分析中,误差通过平方和来表述 。
  • 反应全部数据误差大小的平方和为总平方和,记为SST
  • 反应组内误差大小的平方和称为组内平方和,也称为误差平方和或者残差平方和,记为SSE
  • 反应组间误差大小的平方和称为组间平方和,也称为因素平方和,记为SSA
  • 总误差(SST)=组内误差(SSE) 组间误差(SSA)

方差分析的基本原理 方差分析是检验什么的


单因素方差分析根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析 。当方差分析中只涉及一个分类型自变量时称为单因素方差分析 。单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,例如前面的例子,分析这四个行业之间的服务质量是否有显著差异 。方差分析分为三步:1、提出假设2、构造检验的统计量3、统计决策具体操作如下:第1步:提出假设
方差分析的基本原理 方差分析是检验什么的


第2、3步:构造检验的统计量及统计决策,具体计算公式及相关理论如下:
方差分析的基本原理 方差分析是检验什么的


说明:Excel、SPSS等分析工具可以直接给出分析结果,所以具体计算及理论可不必深究!
用Excel做单因素方差分析下面通过单因素方差来解决前面提出的问题:

推荐阅读