第9章 统计 单元测试卷
参考公式与数据:相关系数r=,回归直线=x+的斜率和截距的最小二乘估计公式分别为==, =-.2=,
P(2≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.已知两个统计案例如下.
①某机构调查了100位社区网格员手机即时通讯软件的使用情况,结果如表:
35岁以上 35岁及以下 合计
微信 45 20 65
QQ 13 22 35
合计 58 42 100
②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表.
母亲身高/cm 159 160 160 163 159 154 159 158 159 157
女儿身高/cm 158 159 160 161 161 155 162 157 162 156
则对这些数据的处理所应用的统计方法分别是 ( )
A.①回归分析,②取平均值 B.①独立性检验,②回归分析
C.①回归分析,②独立性检验 D.①独立性检验,②取平均值
2.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是 ( )
x 4 5 6 7 8 9 10
y 14 18 19 20 23 25 28
A.线性函数模型 B.二次函数模型
C.指数函数模型 D.对数函数模型
3.为了解某城市居民对某项运动的关注情况,随机抽取了该市100人进行调查统计,得到如下2×2列联表.
男 女 合计
关注冰雪运动 35 25 60
不关注冰雪运动 15 25 40
合计 50 50 100
根据列联表可知 ( )
A.该市女性居民中大约有5%的人关注该运动
B.该市男性居民中大约有95%的人关注该运动
C.有95%的把握认为该市居民是否关注该运动与性别有关
D.有99%的把握认为该市居民是否关注该运动与性别有关
4.已知由下表数据得到的回归直线方程为=5.3x-a,且由此得到当x=7时的预测值是28.9,则实数m的值为 ( )
X 2 3 4 5 6
Y 3 7 12 m 23
A.18 B.20 C.21 D.22
5.在考查儿童出生月份X与学习成绩Y是否优秀的独立性检验中,得到如下列联表:
A 合计
B 200 800 1 000
180 a 180+a
合计 380 800+a 1 180+a
最后发现,两个分类变量A和B没有任何关系,则a的值可能是 ( )
A.200 B.720 C.100 D.180
6.某车间加工某种机器的零件数x(单位:个)与加工这些零件所花费的时间y(单位:min)之间的对应数据如表所示:
x/个 10 20 30 40 50
y/min 62 68 75 81 89
由表中的数据可得线性回归方程=x+54.9,则加工70个零件比加工60个零件大约多用 ( )
A.5.8 min B.6 min C.6.7 min D.8 min
7.对某校高一学生进行心理障碍(其中焦虑、说谎、懒惰都是心理障碍)测试得到如下列联表:
焦虑 说谎 懒惰 合计
女生 5 10 15 30
男生 20 10 50 80
合计 25 20 65 110
下列说法正确的是 ( )
A.在这三种心理障碍中与性别关系最大的是焦虑
B.在这三种心理障碍中与性别关系最大的是说谎
C.在这三种心理障碍中与性别关系最大的是懒惰
D.这三种心理障碍与性别有关系的概率一样大
8.已知由一组样本数据确定的线性回归方程为=1.5x+1,且=2,发现有两组数据(2.6,2.8)与(1.4,5.2)误差较大,去掉这两组数据后,重新求得回归直线的斜率为1.4,那么当x=6时,的值为 ( )
A.9.6 B.10 C.10.6 D.9.4
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.下列说法中错误的是 ( )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义
C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的
D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的
10.为了判断英语词汇量与阅读水平是否相互独立,某语言培训机构随机抽取了100位英语学习者进行调查,经过计算2≈7,根据这一数据和下表分析,下列说法正确的是 ( )
P(2≥x0) 0.05 0.01 0.005 0.001
x0 3.841 6.635 7.879 10.828
A.有99%以上的把握认为英语词汇量与阅读水平无关
B.有99%以上的把握认为英语词汇量与阅读水平有关
C.有99.9%以上的把握认为英语词汇量与阅读水平有关
D.在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关
11.某部门经统计,客户对不同款理财产品的最满意度百分比和对应的理财总销售量(单位:万元)如下表(最满意度百分比越高时总销售量越高):
产品款型 A B C D E F G H I J
最满意度百分比/% 20 34 28 19 26 20 19 24 18 22
总销售量/万元 65 89 80 75 75 71 65 62 60 52
设x表示理财产品最满意度的百分比,y为该理财产品的总销售量(单位:万元),这些数据的散点图如图1所示.
图1
我们约定:相关系数的绝对值在0.3以下是无线性相关,在0.3以上(含0.3)至0.75是一般线性相关,在0.75以上(含0.75)是较强线性相关.y与x是否达到较强线性相关 若达到,请求出线性回归方程(系数精确到0.1);若没有达到,则采取“末位”剔除制度(即总销售量最少的那一款产品退出理财销售),若剔除后仍然未达到,则继续剔除.则下列说法错误的是 ( )
数据参考计算值:
-10 xiyi-10
参考计算值 23 69.4 232 32.35 346 15.23
A.无须剔除,y与x达到较强线性相关
B.第一次“末位”剔除后,y与x达到较强线性相关
C.线性回归方程为=39.5+1.6x
D.线性回归方程为=39.0+1.4x
三、填空题:本题共3小题,每小题5分,共15分.
12.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过 .
13.为了规定工时定额,需要确定加工零件x(单位:个)所花费的时间y(单位:分),为此进行5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).由最小二乘法求得线性回归方程为=0.67x+54.9,则生产100个零件大约需要花费 分钟;根据收集到的数据可知x1+x2+x3+x4+x5=150,则y1+y2+y3+y4+y5的值为 .(本题第一空2分,第二空3分)
14.已知x,y的一组数据如下表所示.
x 1 2 3 4 5 6
y 291 440 571 830 1 287 1 975
其中ωi=ln yi,=≈6.6,ωixi≈145.1.
该同学画出散点图并通过观察,发现y与x大致呈现指数增长关系,关系式为=,则= (保留两位小数).
四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(13分)随着手机的发展,“微信”越来越成为人们交流的一种方式.某机构对“使用微信交流”的态度进行调查,随机抽取了50人,他们年龄的频数分布及对“使用微信交流”赞成的人数如下表:
年龄/岁 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75)
频数 5 10 15 10 5 5
赞成人数 5 10 12 7 2 1
若以年龄45岁为分界点,由以上统计数据完成下面2×2列联表,并判断是否有99%的把握认为“使用微信交流”的态度与人的年龄有关.
年龄不低于45岁的人数 年龄低于45岁的人数 合计
赞成
不赞成
合计
16.(15分)某地随着经济的发展,居民收入逐年增长,下表(表1)是该地一银行连续五年的储蓄存款(年底余额).
表1
年份x 2017 2018 2019 2020 2021
储蓄存款y/千亿元 5 6 7 9 12
为了计算的方便,工作人员将上表中的数据进行了处理,t=x-2 016,z=y-5得到表2.
表2
时间代号t 1 2 3 4 5
z 0 1 2 4 7
(1)求z关于t的线性回归方程;
(2)求y关于x的回归方程;
(3)用所求回归方程预测到2035年年底该地该银行储蓄存款额达到多少.
17.(15分)近几年,随着大众鲜花消费习惯的转变,中国进入一个鲜花消费的增长期.根据以往统计,某地一鲜花店销售某种B级玫瑰花,在连续统计的320天的玫瑰花售卖中,每天的玫瑰花的销售量(单位:支)与特殊节日的天数如下表.
非特殊节日的天数 特殊节日的天数 合计
销售量在[120,160]内的天数 160
销售量在(160,200]内的天数 10 40
合计 170 320
(1)填写上表,判断是否有99%的把握认为“每天的玫瑰花的销售量与特殊节日有关”.
(2)若按分层抽样的方式,从上述表格的特殊节日中抽取5天作为一个样本,再从这个样本中抽取2天加以分析研究,求这两天玫瑰花的销售量在[120,160]内的概率.
18.(17分)茶是中国颇受青睐的传统饮品.于爱茶的人而言,不仅迷恋于茶恬淡的气味与味道,泡茶工序带来的仪式感也是个修身养性静心的方式.但是细细品来,茶饮复杂的味型之中,总能品出点点的苦和淡淡的涩,所以也有人并不喜欢饮茶.在人们的固有印象中,总觉得中年人好饮茶,年轻人对饮茶持有怎样的态度呢 带着这样的疑问,高二(3)班的小明同学做了一项社会调查.调查针对身边的同学与方便联系的家长,共回收了200份有效问卷.为了提高统计工作的效率,小明只记录了问卷中三项有效数据,得到如下2×2列联表:
喜欢饮茶 不喜欢饮茶 合计
家长 60 120
学生 50
合计
(1)请将上面的信息表格补充完整;
(2)从这200人中随机选取2人,已知选取的2人中有人喜欢饮茶,求其中有学生的概率;
(3)请利用独立性检验相关的知识帮小明同学得出这次调查的结论.
19.(17分)在国家积极推动美丽乡村建设的政策背景下,各地根据当地生态资源打造了众多特色纷呈的乡村旅游胜地.某人意图将自己位于乡村旅游胜地的房子改造成民宿用于出租,在旅游淡季随机选取100天,对当地已有的六间不同价位的民宿进行跟踪,统计其出租率y(),设民宿租金为x(单位:元/日),得到如图2的数据散点图.
图2
(1)若用“出租率”近似估计旅游淡季民宿每天租出去的概率,求租金为388元的那间民宿在淡季内的3天中至少有2天闲置的概率.
(2)①根据散点图判断,y=bx+a与y=cln x+d哪个更适合此模型(给出判断即可,不必说明理由) 根据判断结果求回归方程;
②若该地一年中旅游淡季约为280天,在此期间无论民宿是否出租,每天都要付出9.9%x的固定成本,若民宿出租,则每天需要再付出10%x的日常支出成本.试用①中模型进行分析,旅游淡季民宿租金定为多少元时,该民宿在这280天的收益W达到最大
记zi=ln xi,≈261.3,=0.47,=5.4,(xi-)·(yi-)≈-221,
(xi-)2≈121 333.3,(zi-)·(yi-)≈-0.99,
(zi-)2≈2.2,e5≈148,e5.1≈164,e5.2≈181.
第9章 统计 单元测试卷 参考答案
1.B 本题主要考查独立性检验与回归分析.由题意可知,①应用独立性检验,②应用回归分析,选B.
2.A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.故选A.
3.C 提出假设H0:该市居民是否关注该运动与性别无关.根据2×2列联表中数据,计算2==≈4.167,因为当H0成立时,P(2≥3.841)≈0.05.
所以有95%的把握认为该市居民是否关注该运动与性别有关,选项C正确.故选C.
4.B 由题意知,==4,==+9,则解得
故选B.
5.B 根据题意,结合列联表可知和基本相等,可知B满足条件.故选B.
6.C 由题意可得,=×(10+20+30+40+50)=30,=×(62+68+75+81+89)=75.
∵=x+54.9,∴75=30+54.9,解得=0.67,∴=0.67x+54.9,
∴加工70个零件比加工60个零件大约多用0.67×70+54.9-(0.67×60+54.9)=6.7(min).
故选C.
7.B 对于焦虑、说谎、懒惰三种心理障碍分别构造三个统计量,,,由表中数据可得=≈0.863,=≈6.366,=≈1.410.因为的值最大,所以说谎与性别关系最大,故选B.
8.A 由=1.5x+1和=2,得=1.5×2+1=4.所以去掉数据(2.6,2.8)与(1.4,5.2)后得到的新数据的平均数'=2,'=4,由题意可设去掉两组数据后的线性回归方程为=1.4x+a,代入(2,4),求得a=1.2,故去掉(2.6,2.8)与(1.4,5.2)这两组数据后求得的线性回归方程为=1.4x+1.2.将x=6代入该回归方程,得=1.4×6+1.2=9.6.
9.ABD 相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.
10.BD 2≈7>6.635,P(2≥6.635)≈0.01,所以在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关,或者可以说有99%以上的把握认为英语词汇量与阅读水平有关.
11.BD 样本相关系数r=≈0.70∈[0.3,0.75),
则y与x具有一般线性相关关系,没有达到较强线性相关关系,A错误.
由“末位”剔除制度可知,第一次应剔除J款理财产品,
重新计算得'=≈23.111,'=≈71.333,
-9'2≈232+10×232-222-9×23.1112≈230.935,
-10'2≈32.352+10×69.42-522-9×71.3332≈710.550,
xiyi-9''≈346+10×23×69.4-22×52-9×23.111×71.333≈326.807,
所以r≈≈0.81>0.75,故B正确.
≈≈1.4,≈'-'=71.333-1.40×23.111≈39.0,
所以所求线性回归方程为=39.0+1.4x,故D正确,C错误.
12.0.025 2×2列联表如下:
通过 未通过 合计
集中培训 45 10 55
分散培训 30 20 50
合计 75 30 105
提出假设H0:能否一次考试通过与是否集中培训无关.
2=≈6.109.
因为当H0成立时,2≥5.024的概率约为0.025,所以认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.025.
13.121.9 375 由题意,当x=100时,=0.67×100+54.9=121.9,故生产100个零件大约需要花费121.9分钟.=(x1+x2+x3+x4+x5)=30,且回归直线=0.67x+54.9恒过点(,),则=0.67×30+54.9=75,所以y1+y2+y3+y4+y5=5=375.
14.0.37 由=得ln =ln +x,即=x+ln .由条件易知=3.5,=91,则=≈≈0.37.
15.根据条件得2×2列联表:
年龄不低于 45岁的人数 年龄低于 45岁的人数 合计
赞成 10 27 37
不赞成 10 3 13
合计 20 30 50
提出假设H0:“使用微信交流”的态度与人的年龄无关.
根据列联表所给的数据代入公式可得
2=≈9.979>6.635,
当H0成立时,2≥6.635的概率约为0.01,所以有99%的把握认为“使用微信交流”的态度与人的年龄有关.
16.(1)设z关于t的线性回归方程为=t+,由题意得,=3,=2.8,
则==1.7,
所以=-=2.8-1.7×3=-2.3,
所以=1.7t-2.3.
(2)将t=x-2 016,z=y-5,
代入=1.7t-2.3,得-5=1.7×(x-2 016)-2.3,
即=1.7x-3 429.5.
(3)当x=2 035时,=1.7×2 035-3 429.5=30,
即预测到2035年年底该地该银行储蓄存款额达到30千亿元.
17.(1)提出假设H0:每天的玫瑰花的销售量与特殊节日无关.
根据题意填写列联表如下:
非特殊节日的天数 特殊节日的天数 合计
销售量在[120,160]内的天数 160 120 280
销售量在(160,200]内的天数 10 30 40
合计 170 150 320
2=≈14.521>6.635.
因为当H0成立时,2≥6.635的概率约为0.01,所以有99%的把握认为“每天的玫瑰花的销售量与特殊节日有关”.
(2)根据分层抽样,抽取销售量在[120,160]内的特殊节日有4天,记为a,b,c,d,销售量在(160,200]内的特殊节日有1天,记为E;
从这5天内随机抽取2天,基本事件是ab,ac,ad,aE,bc,bd,bE,cd,cE,dE共10种,
其中有两天玫瑰花的销售量在[120,160]内的基本事件是ab,ac,ad,bc,bd,cd共6种,故所求的概率P==.
18.(1)由已知条件得:
喜欢饮茶 不喜欢饮茶 合计
家长 60 60 120
学生 30 50 80
合计 90 110 200
(2)设选取的2人中有人喜欢饮茶为A事件,所以P(A)=.
设选取的2人中有学生为B事件,即选取的2人中既有人喜欢饮茶,又包含有学生为AB事件.
所以P(AB)=,故P(B|A)===.
(3)设H0:“某人是否喜欢饮茶与其是学生或家长无关”,由2×2列联表得,2=≈3.03>2.706,因为当H0成立时,P(2≥2.706)≈0.10,所以认为某人是否喜欢饮茶与其是学生或家长无关的概率不超过0.1,有超过90%的把握认为某人是否喜欢饮茶与其是学生或家长有关.
19.(1)三天中至少有2天闲置的反面为3天中至多有一天能够租出,又每天的出租率为0.2,
所以3天中至少有2天闲置的概率P=(1-0.2)2×0.2+(1-0.2)3=0.896.
(2)①根据散点图的分布情况,各散点连线更贴近y=cln x+d的图象,故y=cln x+d的拟合效果更好.
依题意,(zi-)·(yi-)≈-0.99,(zi-)2≈2.2,
所以c===-0.45,
所以d=-c=0.47+0.45×5.4=2.9,
所以回归方程为=-0.45ln x+2.9.
②设旅游淡季民宿租金为x,则淡季该民宿的出租率y=-0.45ln x+2.9,
所以该民宿在这280天的收益为
W=280(x-0.1x)(-0.45ln x+2.9)-280×0.099x
=280×0.9x(-0.45ln x+2.9)-27.72x
=-113.4xln x+703.08x,
所以W'=703.08-113.4ln x-113.4=589.68-113.4ln x.
令W'=0,得ln x=5.2,
所以x=e5.2≈181,
且当x∈(0,181)时,W'>0,x∈(181,+∞)时,W'<0,
所以W在(0,181)上单调递增,在(181,+∞)上单调递减,
所以当x=181时,W取得最大值.
所以旅游淡季民宿租金定为181元时,该民宿在这280天的收益W达到最大.