第三章 统计案例
章末检测
一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
2.对于自变量和因变量,当取值一定时,的取值带有一定的随机性,,之间的这种非确定性关系叫做
A.函数关系 B.线性关系
C.相关关系 D.回归关系
3.已知回归方程为,若解释变量增加1个单位,则预报变量平均
A.增加2个单位 B.减少2个单位
C.增加3个单位 D.减少3个单位
4.对于,当时,就推断“与有关系”,这种推断犯错误的概率不超过
参考数据:
A.0.01 B.0.05
C.0.10 D.以上都不对
5.若对于变量的取值为3,4,5,6,7时,变量对应的值依次分别为4.0,2.5,–0.5,–1,–2;若对于变量的取值为1,2,3,4时,变量对应的值依次分别为2,3,4,6,则变量和,变量和的相关关系是
A.变量和是正相关,变量和是正相关
B.变量和是正相关,变量和是负相关
C.变量和是负相关,变量和是负相关
D.变量和是负相关,变量和是正相关
6.有下列数据:
x
1
2
3
y
3
5.99
12.01
下列四个函数中,模拟效果最好的为
A. B.
C. D.
7.为考察高中生的性别与喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过
A.0.1% B.1%
C.99% D.99.9%
8.某机构在对具有线性相关的两个变量和进行统计分析时,得到的数据如下表所示.由表中数据求得关于的回归方程为,则在这些样本点中任取一点,该点落在回归直线下方的概率为
4
6
8
10
12
1
2
3
5
6
A. B.
C. D.无法确定
9.为了调查“小学成绩”与“中学成绩”两个变量之间是否存在相关关系,某科研机构将所调查的结果统计如下表所示:
中学成绩不优秀
中学成绩优秀
总计
小学成绩优秀
5
20
25
小学成绩不优秀
10
5
15
总计
15
25
40
参考数据:
则下列说法正确的是
A.在犯错误的概率不超过的前提下,认为“小学成绩与中学成绩无关”
B.在犯错误的概率不超过的前提下,认为“小学成绩与中学成绩有关”
C.在犯错误的概率不超过的前提下,认为“小学成绩与中学成绩无关”
D.在犯错误的概率不超过的前提下,认为“小学成绩与中学成绩有关”
10.已知下列说法:
①残差平方和可以用来判断模型拟合的效果;
②对于线性回归方程,变量增加一个单位时,平均增加5个单位;
③线性回归方程必过样本点的中心;
④若由列联表计算得的观测值,则有的把握确认这两个变量间有关系(其中).其中说法错误的个数是
A. B.
C. D.
二、填空题:请将答案填在题中横线上.
11.已知是根据女大学生的身高预报她的体重的回归方程,其中的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是________________.
12.已知x与y之间的一组数据:
x
0
1
3
4
y
1
3
5
7
则与的线性回归方程必过点________________.
13.某班主任对全班50名学生作了一次调查,所得数据如下表:
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总计
26
24
50
由表中数据计算得到的观测值,于是________________(填“能”或“不能”)在犯错误的概率不超过的前提下认为喜欢玩电脑游戏与认为作业多有关.
14.某城市年到年人口总数与年份的关系如下表所示:
年份(年)
0
1
2
3
4
人口数y(百万)
5
7
8
11
19
据此估计年该城市人口总数为________________百万人.(参考数据和公式:,)
三、解答题:解答应写出文字说明、证明过程或演算步骤.
15.某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(第周)和市场占有率()的几组相关数据如下表:
1
2
3
4
5
0.03
0.06
0.1
0.14
0.17
(1)根据表中的数据,用最小二乘法求出关于的线性回归方程;
(2)根据上述线性回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测在第几周,该款旗舰机型市场占有率将首次超过(最后结果精确到整数).
参考公式:,.
16.某中学对高三甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分别估计两个班级的优秀率;
(2)由以上统计数据填写下面列联表,并问是否有的把握认为加强语文阅读理解训练对提高数学应用题得分率有帮助?
优秀人数
非优秀人数
合计
甲班
乙班
合计
参考公式及数据:,.
17.在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据如下表所示:
价格x/元
14
16
18
20
22
需求量y/件
56
50
43
41
37
(1)求出y关于x的线性回归方程;
(2)说明(1)中所求的线性回归方程拟合效果的好坏.
(参考数据:,)
18.年为我国改革开放周年,某事业单位共有职工人,其年龄与人数分布表如下:
年龄段
人数(单位:人)
若定义岁至岁的为中年人,其余的为青年人,现按分层抽样抽取人作为某庆祝晚会的观众.
(1)若抽出的青年观众与中年观众中分别有人和人不热衷关心民生大事,其余人热衷关心民生大事.请将下面的列联表补充完整,并判断是否有的把握认为年龄层与是否热衷关心民生大事有关?
热衷关心民生大事
不热衷关心民生大事
总计
青年观众
12
中年观众
5
总计
30
(2)在(1)的条件下,热衷关心民生大事的青年观众中有1人擅长歌舞,有3人擅长乐器,现从热衷关心民生大事的青年观众中随机抽取2人上台进行才艺表演,求抽出的2人能胜任才艺表演的概率.
参考公式及数据:,其中.
参考答案
1.【答案】C
【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.
2.【答案】C
【解析】对于自变量和因变量,当取值一定时,的取值带有一定的随机性,,之间的这种非确定性关系叫相关关系,故选C.
5.【答案】D
【解析】变量增加,变量减少,所以变量和是负相关;
变量增加,变量增加,所以变量和是正相关,故选D.
6.【答案】A
【解析】当=1,2,3时,分别代入求值,离最近的值模拟效果最好,
可知模拟效果最好.故选A.
7.【答案】B
【解析】因为,
所以认为“性别与喜欢数学有关”犯错误的概率不超过1%.故选B.
8.【答案】A
【解析】因为,,所以,所以,所以,
故5个点中落在回归直线下方的有(6,2),(8,3),共2个,故所求概率.故选A.
9.【答案】D
【解析】的观测值,
可知在犯错误的概率不超过的前提下,认为“小学成绩与中学成绩有关”.故选D.
10.【答案】B
【解析】对于①:可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,①正确;对于②:变量增加一个单位时,平均减少个单位,②错误;对于③:线性回归方程必过样本点的中心,③正确;对于④:因为,,所以有的把握确认这两个变量间有关系,④正确.故选B.
13.【答案】不能
【解析】查表知若要在犯错误的概率不超过的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值,本题中,所以不能在犯错误的概率不超过的前提下认为喜欢玩电脑游戏与认为作业多有关.
14.【答案】
【解析】由题可得,,
因为,所以,
故关于的线性回归方程为,
当时,,
故估计年该城市人口总数为百万人.
15.【答案】(1);(2)第11周.
【解析】(1)由题中的数据可得,,
易得,所以,
所以关于的线性回归方程为.
(2)由(1)知,
令,解得,
所以预测在第11周,该款旗舰机型市场占有率将首次超过.
16.【答案】(1)甲、乙两班的优秀率分别为和;(2)列联表见解析,没有的把握认为加强语文阅读理解训练对提高数学应用题得分率有帮助.
【解析】(1)由题意知,甲、乙两班均有学生50人,
甲班优秀人数为30人,优秀率为,
乙班优秀人数为25人,优秀率为,
所以甲、乙两班的优秀率分别为和.
(2)补充完整的列联表如下:
优秀人数
非优秀人数
合计
甲班
30
20
50
乙班
25
25
50
合计
55
45
100
因为的观测值,
所以没有的把握认为加强语文阅读理解训练对提高数学应用题得分率有帮助.
17.【答案】(1);(2)拟合效果好.
【解析】(1)从作出的散点图(图略)可看出,这些点在一条直线附近,可用线性回归模型来拟合数据.
由题表中数据可得,,
所以,
所以,
故y关于x的线性回归方程为.
(2)列表:
1.2
-0.1
-2.4
0.3
1
10.6
4.6
-2.4
-4.4
-8.4
所以,,
故相关指数,
因为很接近于,所以该模型的拟合效果好.
(2)热衷关心民生大事的青年观众有6人,记这6人分别为A,B,C,D,a,b,
其中A表示擅长歌舞的青年观众,B,C,D表示擅长乐器的青年观众,
从这6人中随机抽取2人,有AB,AC,AD,Aa,Ab,BC,BD,Ba,Bb,CD,Ca,Cb,Da,Db,ab,共15种情况,
其中能胜任才艺表演的有AB,AC,AD,BC,BD,CD,共6种情况,
故所求概率.