(二)计算水平均值
假定从第i个总体中抽取一个容量为ni的简单随机样本,则有:
?y第i组样本平均数yi?=
j?1niijni (i=1、2、…、m)
式中,ni为第i个总体的样本观察值个数,yij为第i个总体的第j个观察值。
就例2来讲,
配方1的小鸡增重均值y1?=(370 +420+ 450 +490)÷4=432.5克
配方2的小鸡增重均值y2?=(490 +380 +400 +390 +500 +410)÷6=428.33克 配方3的小鸡增重均值y3?=(330 +340 +400 +380 +470)÷5=384克 配方4的小鸡增重均值y4?=(410 +480 +400 +420 +380 +410)÷6=416.6克 (三)计算全部观察值的总均值
??y总的样本平均数y??=
i?1j?1mniijn=
?nyii?1mmi?;
?ni?1i式中,ni为第i组的数据个数,n1+n2+?+nm=n。 就例2来讲,
全部小鸡平均增重y??=8720÷21=415.24克 n=n1+n2+n3+n4=4+6+5+6=21 (四)计算离差平方和
方差分析采用的统计推断方法是计算F统计量,进行F检验。因此,为了构造检验的统计量,需要计算三个离差平方和。
方差分析将观察变量总的离差平方和,记为SST,并将它分解成两个部分:一部分是由控制变量引起的离差,记为SSR,即水平项离差平方和(也称为组间离差平方和Between Groups),;另一部分是由随机变量引起的离差,记为SSE,即误差项离差平方和(也称为组内离差平方和Within Groups)。于是有:
SST=SSR+SSE
式中:总离差平方和SST???(yij?y??)i?1j?1mni2mni2
m2组间离差平方和SSR???(yi??y??)??ni(yi??y??)
i?1j?1i?1SSE???(yij?yi?)
组内离差平方和i?1j?1以上三式中的总样本平均数定义为:
mmni2y???i?1m?niyi?i?1?ni1mni???yijni?1j?1
各组样本平均数定义为:
yi??1nij?1?yijni
ni是各组样本观测值的个数,n为所有样本观测值的个数,m是分组数目。
就例2来讲,(参见表10-2中数据)
总离差平方和SST=??(yij?y??)2
i?1j?1mni2222
=(370-415.24)+(420-415.24)+…+(380-415.24)+(410-415.24)=46923.809
组间离差平方和SSR=??(yi??y??)=?ni(yi??y??)2
2i?1j?1i?1mnim=4 ×(432.5-415.24)2 + 6 ×(428.33-415.24)2 + 5 ×(384-415.24)2 + 6 ×(416.5-415.24)2 =7112.142
{或采用SSR=?niyi??ny??
i?1m2=[4×(432.5)2+6×(428.33)2+5×(384)2+6×(416.6)2]-[21×(415.24)2] =7112.142}
组内离差平方和SSE=??(yij?yi?)2
i?1j?1mni=[(370-432.5)2+(420-432.5)2+(450-432.5)2+(490-432.5)2] +[(490-428.33)2+(380-428.33)2+(400-428.33)2+(390-428.33)2 +(500-428.33)2+(410-428.33)2]
+[(330-384)2+(340-384)2+(400-384)2+(380-384)2+(470-384)2] +[(410-416.6)2+(480-416.6)2+(400-416.6)2+(420-416.6)2 +(380-416.6)2+(410-416.6)2] =39811.667
(或采用SSE=??y??niyi?=3667800-3627988.333=39811.677)
2iji?1j?1i?1mnim(五)构造统计量并计算检验统计量的样本值 F=
2370.714组间方差MSR7112.142/(4?1)SSR/(m?1)=====1.01
2341.863组内方差MSESSE/(n?m)39811.667/(21?4)(六)确定检验规则、列出方差分析表、做出统计决策
P-值规则:
根据算得的检验统计量的样本值(F值)算出P-值=0.411573(见表10-3)。由于P-值=0.411573>显著水平标准
?=0.05,所以不能拒绝H,即没有得到足
0
以表明四种配方的饲料下小鸡增重水平有差异的显著证据。
临界值规则: 根据给定的显著水平
?=0.05,查表得临界值为F0.05(3,17)=3.20。因
为F=1.01<3.20,检验统计量的样本值落入接受域,所以不能拒绝H0,即没有得到足以表明四种配方的饲料下小鸡增重水平有差异的显著证据。
表10-3 方差分析表 变异来源 离差平方和 自由度 组间 组内 总计
例3:由前例1表10-1的“四种颜色饮料销售量在五家超市的销售情况”
7112.143 39811.67 46923.81 3 17 20 均方差 2370.714 2341.863 F值 1.01232 P-值 0.411573 临界值 3.196774 数据,对饮料的颜色是否对销售量产生影响做方差分析。
解:第一步、建立假设
原假设 H0:μ1=μ2=μ3=μ4;即假设颜色对销售量没有影响。
备择假设H1: μ1、μ2、μ3、μ4不全相等;即假设四个配方颜色对销售量有影响。
第二步、计算水平均值
无色饮料销售量均值y1?=136.6÷5=27.32箱 粉色饮料销售量均值y2?=147.8÷5=29.56箱 桔黄色饮料销售量均值y3?=132.2÷5=26.44箱 绿色饮料销售量均值y4?=157.3÷5=31.46箱
第三步、计算全部观察值的总均值 各种颜色饮料销售量总的样本平均数y?? =(136.6+147.8+132.2+157.3)÷20=28.695箱
第四步、计算离差平方和 总离差平方和SST=??(yij?y??)2
i?1j?1mni=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.9295
组间离差平方和SSR=??(yi??y??)=?ni(yi??y??)2
2i?1j?1i?1mnim=5×(27.32-28.695)2 + 5 ×(29.56-28.695)2 + 5 ×(26.44-28.695)2 + 5 ×(31.46-28.695)2 =76.8455
组内离差平方和SSE=??(yij?yi?)2
i?1j?1mni=10.688+8.572+13.1926+6.632=39.084
其中:?(y1j?y1?)2 =(26.5-27.32)2+…+(27.2-27.32)2=10.688
j?1n2ni ?(y2j?y2?)2=(31.2-29.56)2+?+(29.6-29.56)2=8.572
j?1 ?(y3j?y3?)2=(27.9-26.44)2+…+(26.5-26.44)2=13.192
j?1n4n3?(yj?14j?y4?)2=(30.8-31.46)2+…+(32.8-31.46)2=6.632
第五步、构造统计量并计算检验统计量的样本值 F=
25.6152组间方差MSR76.8455/(4?1)SSR/(m?1)=====10.486
2.4428组内方差MSESSE/(n?m)39.0840/(20?4)第六步、确定检验规则、列出方差分析表、做出统计决策 P-值规则:
根据算得的检验统计量的样本值(F值)算出P-值=0.000466(见表10-4)。由于P-值=0.000466<显著水平标准
?=0.05,所以拒绝H,接受备择假设H,
0
1
即通过检验知,μj不全相等,说明饮料的颜色对销售量有显著影响。
临界值规则: 根据给定的显著水平
?=0.05,查表得临界值为F0.05(3,16)=3.24。因
为F=10.486>3.24,检验统计量的样本值落入拒绝域,所以拒绝H0,接受备择假设H1,即通过检验知,μj不全相等,说明饮料的颜色对销售量有显著影响。
表10-4 方差分析表 变异来源 离差平方和 自由度 组间 组内 总计
均方差 25.61517 2.44275 — F值 10.4862 P-值 0.000466 临界值 3.23887 76.8455 39.084 115.9295 3 16 19
百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典综合文库方差分析举例(2)在线全文阅读。
相关推荐: