课前复习:
知识点1、线性回归方程:
b^???a??bx?yii?xyii?1nni?nxy???2 22(X?X)x?nx?i?i i?1i?1
例题.已知x与y之间的一组数据: x 0 1 2 y 1 3 5 则y与x的线性回归方程为
知识点2 总偏差平方和、残差平方和、回归平方和
??b?(x?X)(yi?1nn?Y)???Y?bXa3 7 总偏差平方和:SST??(yi?y)2i?1nyi)2残差平方和:SSE??(yi??i?1nn
yi?y)2回归平方和:SSR??(?i?1相关指数R2?1??(yi?1ni?1ni??yi)2?y)2?(y?1?i残差平方和总偏差平方和
总偏差平方和=残差平方和+回归平方和 例2 关于x与Y有如下数据: 2 4 5 x y 6 50 8 70 30 40 60 为了对x、现有以下两种线性模型:?y?6.5x?17.5,Y两个变量进行统计分析,
?y?7x?17,试比较哪一个模型拟合的效果更好。
分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论。 (答案:R21?1?yi)2?(yi??5?(y?y)ii?1i?15?1?2155?0.845,R22?1?1000y)?(y??ii52?(y?y)ii?1i?15?1?2180?0.82,84.5%>82%,所1000 1
以甲选用的模型拟合效果较好。)
2
1.2 独立性检验的基本思想及其初步应用
n(ad?bc)2独立性检测中,随机变量k?
a?bc?da?cb?d????????2参考公式
P(K2?k)0.50 0.40 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828 k 示:
0.455 0.708 例1.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所
吸烟 不吸烟 合计
患病 43 13 56 不患病 162 121 283 合计 205 134 339 试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗? 解:根据列联表中的数据,得
3
因为有关。
。
,所以我们有99%的把握说:50岁以上的人患慢性气管炎与吸烟习惯
2.若由一个2×2列联表中的数据计算得K2=4.395,那么确认两个变量有关系的把握性有( )
A.90% B.95% C.99% D.99.5%
选修1-2第一章《统计案例》
(本卷共150分,考试时间120分钟)
一、选择题(共12小题,共60分)
1.炼钢时钢水的含碳量与冶炼时间有( )
A.确定性关系 B.相关关系 C.函数关系 D.无任何关系 2.设有一个回归方程为?y?2?2.5x,变量x增加一个单位时,则( ) A.y平均增加2.5个单位
B.y平均增加2个单位
C.y平均减少2.5个单位
D.y平均减少2个单位
3.在一次实验中,测得?x,y?的四组值分别是A?1,2?,B?2,3?,C?3,4?,D?4,5?,则y与x之间的回归直线方程为( )
A.?y?x?1 B.?y?x?2 C.?y?2x?1 D.?y?x?1 4.已知x、y之间的数据如下表所示,则y与x之间的线性回归方程过点( ) A.?0,0? B.x,0 C.0,y D.x,y 5.变量y与x之间的回归方程表示( ) A.y与x之间的函数关系
??????B.y与x之间的不确定性关系
C.y与x之间的真实关系的形式
4
D.y与x之间的真实关系达到最大限度的吻合
6.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做100次和150次试验,并且利用线性回归方法,求得回归直线分别为t1和t2,已知两人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )
A.t1和t2有交点?s,t? B.t1与t2相交,但交点不一定是?s,t?
C.t1与t2必定平行 D.t1与t2必定重合
7.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有( )
A.b与r的符号相同 B.a与r的符号相同
C.b与r的符号相反 D.a与r的符号相反
8.考察棉花种子经过处理跟生病之间的关系得到如下表数据:
得病 不得病 合计 根据以上数据,则( ) A.种子经过处理跟是否生病有关
种子处理 32 61 93 种子未处理 101 213 314 合计 133 274 407 B.种子经过处理跟是否生病无关
C.种子是否经过处理决定是否生病
D.以上都是错误的
9.在研究打酣与患心脏病之间的关系中,通过收集数据、整理分析数据得“打酣与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的。下列说法中正确的是( )
A.100个心脏病患者中至少有99人打酣
B.1个人患心脏病,那么这个人有99%的概率打酣
C.在100个心脏病患者中一定有打酣的人
D.在100个心脏病患者中可能一个打酣的人都没有
5
10.经过对K的统计量的研究,得到了若干个临界值,当K2?3.841时,我们( )
2A.有95%的把握认为A与B有关 B.有99%的把握认为A与B有关
C.没有充分理由说明事件A与B有关系
D.有97.5%的把握认为A与B有关
11.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度。如果k?3.841,那么就有把握认为“X和Y有关系”的百分比为( )
p?K2?k? 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.6357.879 10.83 A.25% B.95% C.5% D.97.5%
12.在对一组数据采用几种不同的回归模型进行回归分析时,得到下面的相应模型的相关指数R的值,其中拟和效果较好的是( )
A.0.60 B.0.63 C.0.65 D.0.68 二、填空题(共4小题,每小题4分)
13.在研究硝酸钠的可溶性程度时,对不同的温度观测它在水中的溶解度,得观测结果如下: 温度?x? 溶解度?y? 0 10 20 50 70 266.7 76.0 85.0 112.3 128.0 则由此得到的回归直线方程为________。
14.若样本容量为1或2,此时的残差平方和为________,用这样的样本建立的线性回归方程的预报误差为________。
15.对于回归方程?y?4.75x?257,当x?28时,y的估计值为________。
16.在对某小学的学生进行吃零食的调查中,得到如下表数据:
男学生 吃零食 24 不吃零食 31 合计 55 6
女学生 合计 8 32 26 57 34 89 2根据上述数据分析,我们得出的K?________。
三、解答题(共74分)
17.某种产品的广告费用支出x与销售额之间有如下的对应数据:
x y 2 30 4 40 5 60 6 50 8 70 (1)画出散点图;(2)求回归直线方程;(3)据此估计广告费用为10销售收入y的值。
18.某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑,你能运用这组数据,得出相应结论吗?
19.一项调查表对9个不同的x值,测得y的9个对应值如下表:
i 1 1.5 4.8 2 1.8 5.7 3 2.4 7.0 4 3.0 8.3 5 3.5 10.9 6 3.9 12.4 7 4.4 13.1 8 4.8 13.6 9 5.0 15.3 xi yi 试作出该数据的散点图并由此判断可否存在回归直线,若有则求出回归直线方程。
7
20.在钢线碳含量对于电阻的效应中,得到如下表所示的数据: 碳含量(x/%) 0.10 15 0.30 18 0.40 19 0.55 21 0.70 22.6 0.80 23.6 0.95 26 200C时电阻(y/?) 求y对x的线性回归方程,并检验回归方程的显著性。
21.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下的列联表:
甲线 乙线 总计 合格 97 95 192 不合格 3 5 8 总计 100 100 200 请问甲、乙两条生产线的产品合格率在多大程度上有关系?
22.对某校小学生进行心理障碍测试得到如下的列联表: 女生 男生 总计 焦虑 5 20 25 说谎 10 10 20 懒惰 15 50 65 总计 30 80 110 试说明在这三种心理障碍中哪一种与性别关系最大?
8
百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典综合文库案例统计知识点和习题在线全文阅读。
相关推荐: