上机实习五 用Excel进行参数的假设检验
假设检验,就是先对总体的参数或分布形式提出假设,再利用样本数据信息来判断原假设是否合理,从而决定应接受还是拒绝原假设。
进行假设检验的一般步骤: (1)建立原假设H0和备择假设H1;
(2)确定适当的检验统计量及其分布,并由给定样本值计算检验统计量的值; (3)根据显著性水平?,确定检验临界值和拒绝域;
(4) 作出统计判断:由样本值确定概率P值,若P值≤?或者统计量的值落在拒绝域内,则拒绝原假设H0,接受备择假设H1,即差异有统计显著意义;若P值>?或者统计量的值不落在拒绝域内,,就接受原假设H0,即差异无统计显著意义。
我们将正态总体的参数检验的主要步骤和结果汇总于下表。
表5-1 正态总体参数的假设检验简表
原假设H0 ?=?0 (?2已知) ?=?0 (?2未知) 备择假设H1 ?≠?0(双侧) ?>?0(单侧) ?0(单侧) ?≠?0(双侧) ?>?0(单侧) ?0(单侧) 检验统计量 分布 N(0,1) t (n-1) 临界值 z?/2 z? - z? t?/2(n-1) t? (n-1) -t? (n-1) 拒绝域 |z|> z?/2 z> z? z<- z? |t|>t?/2 t>t? t<-t? Z?X??0T??/nX??0Sn?12???2≠?02(双侧) ?2=?02 2(n-1)和(n-1) ?2>?02(单侧) ?202(单侧) (n?1)S22???02S12F?2S2?12n1??2?2(n-1) 2?2???2/2或 ??2(n-1) ?12??(n-1) ?2??12??/2 2?2??? 22???1?? F>F?/2 F>F? ?12=?22 ?12≠?22(双侧) ?12>?22(单侧) F(n1-1,n2-1) (若S12≥S22) F?/2(n1-1,n2-1) F?(n1-1,n2-1) ?1=?2 (?12、?22 已知) ?1=?2 (方差未知 n1、n2>50) ?1=?2 (?12=?22=?22但值未知) ?1≠?2(双侧) ?1>?2(单侧) Z?X?Y?2?2N(0,1) z?/2 z? |z|> z?/2 z> z? n2 N(0,1) z?/2 z? |z|> z?/2 z> z? ?1≠?2(双侧) ?1>?2(单侧) ?1≠?2(双侧) ?1>?2(单侧) Z?X?Y2S12S2?n1n2 X?YT?Sp11?n1n2t(n1+n2-2) [注] t?/2(n1+n2-2) t?(n1+n2-2) |t|>t?/2 t>t? [注] 式中
Sp?22(n1?1)S12?(n2?1)S2S12?S2Sp?n1?n2?22,特别地,当n1=n2时,
§5.1 单个正态总体的参数检验
一、单个正态总体均值Z检验
对于总体方差?2已知时,进行单个正态总体均值的Z检验H0:? =?0,可利用Z检验统计量
Z?X??0?/n
来进行。
在Excel中,可利用函数ZTEST进行,其格式为
ZTEST(array, a , sigma) 返回Z检验的双侧概率P值P{|Z|>z},
其中 Array 为用来检验的数组或数据区域;
a 为被检验的已知均值,即?0;
Sigma 为已知的总体标准差?,如果省略,则使用样本标准差S。
例如,要检验样本数据
Z?X?a?/n
3, 6, 7, 8, 6, 5, 4, 2, 1, 9
的总体均值是否等于4,如果已知其总体标准差为2,则只需计算
ZTEST({3, 6, 7, 8, 6, 5, 4, 2, 1, 9}, 4,2),
其概率值
P=0.0409951<0.05,
认为在显著性水平?=0.05下,总体均值与4有显著差异。
如果总体标准差未知,而用样本标准差S替代时,计算
ZTEST({3, 6, 7, 8, 6, 5, 4, 2, 1, 9}, 4),
得到其概率值
P=0.090574>0.05,
认为在显著性水平?=0.05下,总体均值与4无显著差异。
二、单个正态总体均值t检验
当总体方差?2未知时,单个正态总体均值的t检验对于大样本(n>30)问题可归结为上述Z检验进行。对于小样本,则可利用函数和输入公式的方法计算t统计量
n
和P值来进行t检验。
例5.1 正常人的脉搏平均为72(次/min),现测得50例慢性四乙基铅中毒患者的脉搏(次/min)的均值是65.45,标准差是5.67,若四乙基铅中毒患者的脉搏服从正态分布,问四乙基铅中毒患者和正常人的脉搏有无显著性差异(?=0.05)?
Excel求解:应检验H0:? =72。其实现t检验的步骤为:
1.按图5.1输入已知数据:单元格C4中输入总体均值72,单元格B7中输入样本容量25,单元格C7中输入样本均值65.45,单元格D7中输入样本标准差7.67;
2.计算t统计量的值和P值
(1) 在单元格G4中输入“=ABS(C7-C4)/D7*B7^0.5”求t值; (2) 在单元格G5中输入“=B7-1”求自由度;
(3) 在单元格G6中输入“=TDIST(G4,G5,1)”求单侧P值; (4) 在单元格G7中输入“=TDIST(G4,G5,2)”求双侧P值;
t?X??0S
所得结果如图5-1所示。
图5-1
结果分析:因|t|=4.27,P=0.000266(双侧)<0.05,则拒绝原假设H0,即认为四乙基铅中毒患者和正常人的脉搏有显著性差异。
注意:利用上述函数和公式,每次只要更改相应单元格的总体均值(C4)、样本容量(B7)、样本均值(C7)和标准差(D7),即可得到对应的结果。
如果已知的不是样本均值、标准差,而是原始数据,则只要先用Excel函数AVERAGE、STDEV计算出均值、标准差即可与上题类似进行。
例5.2 已知某炼铁厂正常情况下的铁水含碳量X~N(4.55,?)。现观测5炉铁水的含碳量分别为:4.40,4.25,4.21,4.33,4.46,问此时铁水的平均含碳量?=E(X)是否有显著变化?(?=0.05)
Excel求解:应检验H0:? =4.55。
本题已知样本原始数据,其实现t检验的步骤与上例类似:
(1)将上例的图5-1所在的工作表复制(见图5-2),并在第I列依次输入:样本数据,4.40,?,4.46原始数据;
(2)将单元格C4的总体均值改为4.55;将单元格B7的样本容量改为5;在单元格B7的样本容量中输入公式“=COUNT(I2:I6)”;在单元格C7的样本均值中输入公式“=AVERAGE(I2:I6)”;在单元格D7的样本标准差中输入公式“=STDEV (I2:I6)”即可得到计算结果见图5-2。
2
图5-2
结果分析:因|t|=4.767,P=0.00886(双侧)<0.05,则拒绝原假设H0,即认为此时铁水的平均含碳量?=E(X)有显著变化。
注意:利用上述函数和公式,每次只要更改相应单元格的总体均值(C4)与原始数据(第I列),即可得到对应的结果。
对于单个正态总体方差的检验,利用相应的Excel函数和输入公式的方法与上题类似地建立工作表,即可进行相应检验。
§5.2 两个正态总体的参数检验
一、两个正态总体方差的齐性检验
方差相等(或无显著差异)的总体称为具有方差齐性的总体,因此检验两个(或多个)总体方差是否相等的显著性检验又称为方差齐性检验。
对两个总体方差的齐性检验,即检验H0:?12=?22 ,可用F检验统计量
S12F?2S2
来进行。在两个总体方差的齐性检验。
在Excel中,采用“工具→数据分析→F检验:双样本方差”即可进行两个正态总体方差的齐性检验,下面我们结合例题来介绍用EXCEL进行方差的齐性检验的步骤。
例5.3 用24只豚鼠均分成二组作支管灌流试验,记录流速如下(滴数/分):
对照组 用药组 46 30 38 48 60 46 26 58 46 48 44 48 54 46 50 52 52 58 64 56 54 54 58 36 假定豚鼠灌流试验的流速服从正态分布,试检验这两组灌流试验流速的方差是否有显著差异?(?=0.10)
Excel求解:现列出用Excel来进行两组数据方差齐性检验的具体步骤。
首先将两组数据输入表中的A2:A13和B2:B13。(参见图5-4),则检验步骤为: 1. 在菜单中选取“工具→数据分析→F检验:双样本方差”,点击“确定”; 2. 当出现“F检验:双样本方差”对话框后,选定参数,见图5-3: 在“变量1的区域”方框内键入A1:A13 在“变量2的区域”方框内键入B1:B13 选定“标志”(数据区域第一行为标志名) 在“?”方框内键入0.05
(注意:由于在Excel中该检验的结果中只有F分布的“单尾临界值”,故这里“?”
方框内应键入?/2=0.1/2=0.05的值)
在“输出选项”中选择“输出区域”为D1
3. 选择“确定”,如图5-3所示
图5-3
图5-4
结果分析:如图5-4所示,因
F=1.993103
所以不拒绝H0,即两组数据的总体方差无显著差异,即方差齐性成立。
二、两个正态总体均值比较检验
对两个正态总体均值的比较检验,即检验H0:?1= ?2,也即检验H0: ?1–?2=0 是否成立。当两组数据的方差齐性成立即等方差时,可用检验统计量
T?SpX?Y11?n1n2
来进行检验,其中
2(n1?1)S12?(n2?1)S2Sp?n1?n2?2
在Excel的数据分析工具中,采用“t-检验: 双样本等方差假设”即可进行两个正态总体方差的齐性检验,下面我们还是通过上列例5.3的数据来说明两个正态总体均值比较检验的步骤。
例5.4 对例5.3中的两组数据,检验用药是否显著影响灌流试验的流速(?=0.10) Excel求解:因为已经知道该例中两组数据的方差齐性成立,故可以用 “t-检验: 双样本等方差假设”
来进行两组数据的流速是否有显著差异的检验。其具体步骤为:
1. 在菜单中选取“工具→数据分析→t-检验: 双样本等方差假设”,点击“确定”; 2. 当出现“t-检验: 双样本等方差假设”对话框后,选定参数,见图5-5;
图5-5
3. 选择“确定”,即可得到等方差假设检验结果如图5-6。 结果分析:如图5-6示,因
|t| = |-2.30407| > t?/2 = 1.717144,
或 P值= 0.03104 < 0.05
所以拒绝H0,认为两组数据的总体均值显著差异,即用药显著影响灌流试验的流速。
图5-6
对于方差未知且方差齐性不成立的两个正态总体均值比较检验可以用
“t-检验: 双样本异方差假设”
来进行。对于总体方差已知的两个正态总体均值比较检验可以用
“z检验: 双样本平均差检验”
来进行。对于配对数据资料比较的t检验可以用
“t-检验: 平均值的二样本分析”
来进行(在“假设平均差”中选0或不选)。上述检验步骤与前面介绍的“t-检验: 双样本等方差假设”基本相同,限于篇幅这里不再详细介绍。
上机训练题
1. 某公司生产某种灯管,该公司的经理称,他们产品的平均使用寿命为3年。为检验他的说法,随机抽取10个灯管,测得灯管寿命数据如下:(单位:年)
1.3, 4.1,4.8, 3.4 ,2.9,3.8,4.2,2.5,4.3,2.8
已知灯管的使用寿命服从正态分布,试检验他的说法是否正确?(?=0.05)
2. 某种药液中的某成分含量(%)服从正态分布,现由其10个样本观测值算出
x=0.452,S=0.037,试检验假设H0:?=0.5是否成立(?=0.10)
3.设有两种玉米的甲、乙两块农业试验区,各分为10个小区,各小区的面积相同,除甲区施磷肥外,其他试验条件均相同,试验结果玉米产量(kg)如下:
甲区 乙区 62 57 65 60 63 58 57 60 60 58 56 59 56 57 58 57 60 55 57 55 设两区玉米产量均服从正态分布,且方差相同,试判别磷肥对玉米产量有无显著性影响?(?=0.05)
4.某医院用新药与常规药物治疗婴幼儿贫血,将20贫血患儿随机等分成两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)如下表所示。问新药与常规药的疗效有无显著差别?(?=0.05)
治疗药物 新药组 常规药组 24 14 36 18 25 20 血红蛋白增加量(g/L) 14 15 26 22 34 24 23 21 20 25 15 27 19 23 上机实习六 用Excel进行方差分析
方差分析法(Analysis of Variance)是通过对样本的离差平方和进行分解,判断差异的可能来源的统计分析方法。它是对试验结果进行分析,考察各因素对试验结果是否有显著影响的有效方法。
§6.1 单因素方差分析
一、用Excel进行单因素方差分析
在Excel中,采用“工具→数据分析→方差分析:单因素方差分析”即可进行单因素方差分析。
下面我们结合例题来介绍用EXCEL进行的步骤。
例6.1 考察催化剂对某药得率的影响,现用4种不同的催化剂独立地在相同条件下进行试验,每种催化剂各做5次试验,得到的该药得率如下表6-2所示,试问不同的催化剂是否对该药的得率有显著影响?
表6-2 4种催化剂作用下的得率
催化剂 得率(%)
甲 85 88 91 乙 79 85 82 丙 93 90 96 丁 75 81 78
87 90 88.2 81 88 83 95 96 94 82 84 80 平均得率(%) Excel求解:用Excel进行单因素方差分析的操作步骤: 1. 输入数据。首先将数据输入到工作表中的B2:E6(如图6-1所示);
图6-1
2.在菜单中选取“工具→数据分析→方差分析:单因素方差分析”,点击“确定”; 3.当出现“方差分析:单因素方差分析”对话框后,选定参数,见图6-2;
图6-2
输出数据结果如下列图6-3所示。
图6-3
在图6-3中的方差分析表中,“差异源”即方差来源;“SS”为离差平方和;“df”为自由度;“MS”为均方;“F”为F值:F=20.33692;“P-value”为P值:
P(F>20.33692)=1.05×10-5(即0.0000105);
“F crit”为检验临界值:F?(3, 16)=3.238867。
表6-3 单因素方差分析表结果
方差来源 Source 因素A (组间) 误差E (组内) 离差平方和SS 567.4 148.8 自由度df 3 16 均 方 MS 9.3 F值 F P值 P-value 临界值Fα F crit F0.05(3,16)=3.24 189.13 20.337 1.05×10-5
总变差 716.2 19 由图6-3的方差分析表结果知,因为
F=20.33692>F crit=3.238867 (或P-value=0.0000105<0.05),
所以拒绝原假设,即在显著性水平?=0.05下,认为不同的催化剂对该药得率有显著的影响。
§6.2 无交互作用的双因素方差分析
一、用Excel进行双因素方差分析
在Excel中,采用“工具→数据分析→方差分析:无重复双因素方差分析”即可进行无交互作用双因素方差分析。
现结合例题介绍用EXCEL软件进行无交互作用双因素方差分析步骤。
例6.2??为考察硫酸铜溶液浓度和蒸馏水pH值对化验血清中白蛋白与球蛋白之比的影响,对硫酸铜浓度(A因素)取了3个不同水平,对蒸馏水pH值(B因素)取了4个不同水平,在不同水平组合(Ai, Bj)下各测一次白蛋白与球蛋白之比,得其结果如下表所示。
表6-5 数据表
硫酸铜 浓度 (A因素) 蒸馏水的pH值(B因素) B1 B2 B3 B4 A1 A2 A3 3.5 2.6 2.0 1.4 2.3 2.0 1.5 0.8 2.0 1.9 1.2 0.3
试检验这两个因素对化验结果有无显著影响?(?=0.05)
Excel求解:EXCEL操作步骤:
1. 输入数据。
首先将例6.2中的数据输入到工作表中的B3:E5;(图6-4)
图6-4
2. 在菜单中选取“工具→数据分析→方差分析:无重复双因素方差分析”,点击“确
定”;
3.当出现“方差分析:无重复双因素方差分析”对话框后,选定参数,见图6-5;
图6-5
4.点击“确定”。如图6.5所示得到输出数据结果如下图6-6所示。
图6-6
在图6-6的方差分析表中,“差异源”即方差来源;“SS”为离差平方和;“df”为自由度;“MS”为均方;“F”为F值;“P-value”为P值;“F crit”为检验临界值;“行”对应于A因素,“列”对应于B因素。即所求双因素方差分析表为:
表6-5 双因素方差分析表
方差来源 离差平方和 SS 2.222 5.291 0.256 7.769 自由度df 2 3 6 11 均 方 MS 1.111 1.764 0.043 F值 F Value FA=25.84 P值P-value 临界值Fα F-crit Source 因素A (行) 因素B (列) 误差E 总变差(Total) 0.00113 F0.05(2,6)=5.14 FB=41.02 0.000217 F0.05(3,6)=4.76 对于A因素(行),因为
FA=25.8>FA-crit=5.143249 (或P-value=0.00113<0.05),
所以拒绝HA0, 即在?=0.05显著性水平下,认为硫酸铜浓度对化验结果有显著影响。
对于B因素(列),因为
FB=40.94839>FB-crit=4.757055 (或P-value=0.000217<0.05),
所以拒绝HB0, 即在?=0.05显著性水平下,认为蒸馏水pH值对化验结果有显著影响。
上机训练题六
1.用四种不同的分析方法测定同一药物的某种成分的含量,测得数据如下:
方法 含量 A 9.29 9.44 9.33 9.56 B 10.16 10.08 10.03 10.11 C 10.60 10.43 10.65 10.48 D 10.12 9.96 9.98 10.11 试判断这四种方法的测量结果有无显著性差异。(?=0.05) 2. 某湖水在不同季节氯化物含量测定值(mg/L)如下表所示,试问不同季节氯化物含量有无显著差别?(?=0.05)
季节 春 22.6 22.8 21.0 夏 19.1 22.8 24.5 18.0 15.2 18.4 20.1 21.2 秋 18.9 13.6 17.2 15.1 16.6 14.2 16.7 19.6 冬 19.0 16.9 17.6 14.8 13.1 16.9 16.2 14.8 氯化物 含量 16.9 20.0 21.9 21.5 21.2 3.在四台不同纺织机器B1,B2,B3,B4中,采用3种不同的加压水平A1,A2,A3各做一次试样测量,得纱支强度如下表所示,
加压 A1 A2 A3 机 器 B1 B2 B3 B4 1577 1692 1800 1642 1535 1640 1783 1621 1502 1652 1810 1663
问不同的加压水平和不同纺织机器之间纱支强度有无显著差异?(?=0.05)
1.用四种不同的分析方法测定同一药物的某种成分的含量,测得数据如下:
方法 含量 A 9.29 9.44 9.33 9.56 B 10.16 10.08 10.03 10.11 C 10.60 10.43 10.65 10.48 D 10.12 9.96 9.98 10.11 试判断这四种方法的测量结果有无显著性差异。(?=0.05) 2. 某湖水在不同季节氯化物含量测定值(mg/L)如下表所示,试问不同季节氯化物含量有无显著差别?(?=0.05)
季节 春 22.6 22.8 21.0 夏 19.1 22.8 24.5 18.0 15.2 18.4 20.1 21.2 秋 18.9 13.6 17.2 15.1 16.6 14.2 16.7 19.6 冬 19.0 16.9 17.6 14.8 13.1 16.9 16.2 14.8 氯化物 含量 16.9 20.0 21.9 21.5 21.2 3.在四台不同纺织机器B1,B2,B3,B4中,采用3种不同的加压水平A1,A2,A3各做一次试样测量,得纱支强度如下表所示,
加压 A1 A2 A3 机 器 B1 B2 B3 B4 1577 1692 1800 1642 1535 1640 1783 1621 1502 1652 1810 1663
问不同的加压水平和不同纺织机器之间纱支强度有无显著差异?(?=0.05)
百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典综合文库用Excel进行参数的假设检验在线全文阅读。
相关推荐: