高二成对数据的统计分析复习测试题B
一.选择题(共8小题)
1.经过对中学生记忆能力和识图能力进行统计分析,得到如下数据:
记忆能力 4 6 8 10
识图能力 3 5 6 8
由表中数据,求得线性回归方程为,若某中学生的记忆能力为14,则该中学生的识图能力为
A.7 B.9.5 C.11.1 D.12
2.对于一组具有线性相关关系的数据,,2,3,,,根据最小二乘法求得回归直线方程为,则以下说法正确的是
A.预报变量^的值由解释变量唯一确定
B.在回归分析中,的模型比的模型拟合效果好
C.所有的样本点均落在回归直线上
D.残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高
3.2020年12月30日,国家药品监督管理局附条件批准国药集团中国生物北京生物制品研究所有限责任公司的新型冠状病毒灭活疫苗细胞)注册申请.该疫苗是首家获批的国产新冠病毒灭活疫苗,适用于预防由新型冠状病毒感染引起的疾病.2021年1月3日,北京市人民政府新闻办公室召开疫情防控第200场例行新闻发布会,表示不在岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄内和该年龄段外的110人进行了临床试验,得到如下列联表:
能接种 不能接种 总计
岁内 40 20 60
岁外 20 30 50
总计 60 50 110
附:,其中.
0.050 0.010 0.001
3.841 6.635 10.828
参照附表,得到的正确结论是
A.在犯错误的概率不超过的前提下,认为“能接种与年龄段无关”
B.在犯错误的概率不超过的前提下,认为“能接种与年龄段有关”
C.有以上的把握认为“能接种与年龄段无关”
D.有以上的把握认为“能接种与年龄段有关”
4.已知,之间的一组数据如表所示,则对的回归直线必经过
0 1 2 3
1 3 5 7
A. B. C. D.
5.利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用列联表,由计算可得,参照下表:得到的正确结论是
0.01 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.有以上的把握认为“爱好该项运动与性别无关”
B.有以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”
6.某商场2020年部分月份销售金额如表:
月份 2 4 6 8 10
销售金额(单位:万元) 64 132
286 368
若用最小二乘法求得回归直线方程为,则
A.198.2 B.205 C.211 D.213.5
7.某医院医疗攻关小组在一项实验中获得一组关于症状指数与时间之间的数据,将其整理得到如图所示的散点图,以下回归模型最能拟合与之间关系的是
A. B. C. D.
8.一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据如表可得回归方程,则实数的值为
零件数(个 2 3 4 5
加工时间(分钟) 30
40 50
A.34 B.35 C.36 D.37
二.多选题(共4小题)
9.因防疫的需要,多数大学开学后启用封闭式管理.某大学开学后也启用封闭式管理,该校有在校学生9000人,其中男生4000人,女生5000人,为了解学生在封闭式管理期间对学校的管理和服务的满意度,随机调查了40名男生和50名女生,每位被调查的学生都对学校的管理和服务给出了满意或不满意的评价,经统计得到如下列联表:
满意 不满意
男 20 20
女 40 10
附表:
0.100 0.05 0.025 0.010 0.001
2.706 3.841 5.024 6.635 10.828
附:
以下说法正确的有
A.满意度的调查过程采用了分层抽样的抽样方法
B.该学校学生对学校的管理和服务满意的概率的估计值为0.6
C.有的把握认为学生对学校的管理和服务满意与否与性别有关系
D.没有的把握认为学生对学校的管理和服务满意与否与性别有关系
10.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关“作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有 人
附表:
0.050 0.010
3.841 6.635
附:
A.25 B.35 C.45 D.60
11.研究变量,得到一组样本数据,进行回归分析,以下说法正确的是
A.残差平方和越小的模型,拟合的效果越好
B.用相关指数来刻画回归效果,越小说明拟合效果越好
C.在回归直线方程中,当解释变量每增加1个单位时,预报变量平均增加0.2个单位
D.若变量和之间的相关系数为,则变量和之间的负相关很强.
12.对某中学的高中女生体重(单位:与身高(单位:进行线性回归分析,根据样本数据,,2,3,,,计算得到相关系数,用最小二乘法近似得到回归直线方程为,则以下结论中正确的是
A.与正相关
B.与具有较强的线性相关关系,得到的回归直线方程有价值
C.若该中学某高中女生身高增加,则其体重约增加
D.若该中学某高中女生身高为,则可断定其体重为
三.填空题(共4小题)
13.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下列联表(部分数据缺失)
被新冠病毒感染 未被新冠病毒感染 总计
注射疫苗 10
50
未注射疫苗
30
总计
100
表中的值为 ;计算可知,在犯错误的概率最多不超过 的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.
参考公式:,.
参考数据:
0.100 0.050 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
14.若某商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下对应数据:
2 4 5 6 8
20 40 60 70 80
根据如表,利用最小二乘法求得关于的回归直线方程为,据此预测,当投入10万元时,销售额的估计值为 万元.
15.“关注夕阳,爱老敬老” 某协会从2015年开始每年向敬老院捐赠物资和现金.如表记录了第年年是第一年)与捐赠的现金(万元)的对应数据,由此表中的数据得到了关于的线性回归方程为,则预测2021年捐赠的现金大约是 万元.
3 4 5 6
2.5 3 4 4.5
16.已知与之间的一组数据:
1 3 5 7
7 9
已求得关于与的线性回归方程,则的值为 .
四.解答题(共6小题)
17.“天上钩钩云,地上雨淋淋”,“日落云里走,雨在半夜后” 这些耳熟能详的谚语是千百年来我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结出来的“看云识天气”的宝贵经验.小明同学为了验证“日落云里走,雨在半夜后”的关联性,观察了他所在地区200天“日落云里走”和夜晚天气情况,得到了如图所示列联表和等高条形图,由于种种原因两图表的信息不全.
夜晚天气日落云里走 下雨 未下雨
出现 90
未出现
30
(1)根据以上图表的信息,求图表中,,的值:
(2)根据以上数据判断能否有的把握认为“当晚下雨”与“日落云里走”有关?
附表:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
(参考公式,其中
18.2020年2月1日时,英国顺利“脱欧”.在此之前,英国“脱欧”这件国际大事被社会各界广泛关注,英国大选之后,曾预计将会在2020年1月31日完成“脱欧”,但是因为之前“脱欧”一直被延时,所以很多人认为并不能如期完成,某媒体随机在人群中抽取了100人做调查,其中40岁以上的55人中有10人认为不能完成,40岁以下的人中认为能完成的占.
(Ⅰ)完成列联表,并回答能否有的把握认为“预测国际大事的准确率与年龄有关”?
能完成 不能完成 合计
40岁以上
40岁以下
合计
(Ⅱ)从上述100人中,采用按年龄分层抽样的方法,抽取20人,从这20人中再选取40岁以下的2人做深度调查,则2人中恰有1人认为英国能够完成“脱欧”的概率为多少?
附表:
0.150 0.100 0.050 0.025 0.010
2.072 2.706 3.841 5.024 6.635
参考公式:
19.随着冬季的到来,是否应该自觉佩戴口罩成为了人们热议的一个话题.为了调查佩戴口罩的态度与性别是否具有相关性,研究人员作出相应调查,并统计数据如表所示:
认为冬季佩戴口罩十分必要 认为冬季佩戴口罩没有必要
男性 300 200
女性 150 150
(1)判断是否有的把握认为佩戴口罩的态度与性别有关?
(2)若按照分层抽样的方法从男性中随机抽取5人,再从这5人中随机抽取2人,求恰有1人认为冬季佩戴口罩十分必要的概率.
参考公式:,其中.
参考数据:
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
20.为了比较两种治疗失眠症的药(分别称为药,药)的疗效,某机构随机地选取20位患者服用药,20位患者服用药,观察这40位患者的睡眠改善情况.这些患者服用一段时间后,根据患者的日平均增加睡眠时间(单位:,以整数部分当茎,小数部分当叶,绘制了如图茎叶图:
(1)根据茎叶图判断哪种药对增加睡眠时间更有效?并说明理由;
(2)求这40名患者日平均增加睡眠时间的中位数,并将日平均增加睡眠时间超过和不超过的患者人数填入如表的列联表:
超过 不超过
服用药
服用药
(3)根据(2)中的列联表,能否有的把握认为,两种药的疗效有差异?
附:.
0.01 0.005 0.001
6.635 7.879 10.828
21.某公司为提高市场销售业绩,促进某产品的销售,随机调查了该产品的月销售单价(单位:元件)及相应月销量(单位:万件),对近5个月的月销售单价和月销售量,2,3,4,的数据进行了统计,得到如表数据:
月销售单价(元件) 9 9.5 10 10.5 11
月销售量(万件) 11 10 8 6 5
(Ⅰ)建立关于的回归直线方程;
(Ⅱ)该公司开展促销活动,当该产品月销售单价为7元件时,其月销售量达到18万件,若由回归直线方程得到的预测数据与此次促销活动的实际数据之差的绝对值不超过0.5万件,则认为所得到的回归直线方程是理想的,试问:(Ⅰ)中得到的回归直线方程是否理想?
(Ⅲ)根据(Ⅰ)的结果,若该产品成本是5元件,月销售单价为何值时(销售单价不超过11元件),公司月利润的预计值最大?
参考公式:回归直线方程,其中,.
参考数据:,.
22.为了进一步提高食堂员工的专业技能和操作能力,更好地为职工服务,某大型企业举行食堂员工基本功技能大赛.大赛由企业食堂组织实施,动员全体食堂员工参加,比赛项目有红案、切配、洗消、抹桌子拖地等四个项目.第一食堂和第二食堂各组织50名厨师参加了比赛,其中第一食堂这50名厨师中女厨师有2名,第二食堂这50名厨师中女厨师有8名.
(1)根据题中数据,完成答题卡上的列联表;
(2)根据(1)中的列联表,判断能否有的把握认为第一食堂、第二食堂员工的专业技能与操作技能与性别有关?
参考公式,其中.
0.10 0.05 0.010 0.001
2.706 3.841 6.635 10.828
参考答案与试题解析
一.选择题(共8小题)
1.【解答】解:的平均数,
的平均数,
即回归方程过点,,即
则得,
则,
则当时,,
即该中学生的识图能力为11.1,
故选:.
2.【解答】解:选项,预报变量由解释变量进行估计,即选项错误;
选项,相关系数越大,说明拟合效果越好,即选项错误;
选项,可能所有的样本点都不在回归直线上,即选项错误;
选项,在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,即选项正确.
故选:.
3.【解答】解:根据列联表中数据,计算,
参照附表知,在犯错误的概率不超过的前提下,认为“能接种与年龄段有关”,
即有以上的把握认为“能接种与年龄段有关”.
故选:.
4.【解答】解:由题意,.
.
所以对的回归直线必经过,
故选:.
5.【解答】解:独立性检验的方法计算得,参照临界值表,得,
所以有以上的把握认为“爱好该项运动与性别有关”.
故选:.
6.【解答】解:由表中数据可知,
,,
回归直线恒过样本中心点,
,解得.
故选:.
7.【解答】解:分析散点图图象知,函数增长速度越来越慢,符合对数函数增长模型.
故选:.
8.【解答】解:,,
则样本点的中心坐标为,
代入线性回归方程,得,
解得.
故选:.
二.多选题(共4小题)
9.【解答】解:因为男女比例为,所以选项正确;
满意的频率为,
所以该学校学生对学校的管理和服务的概率的估计值约为0.667,所以选项错误;
由列联表中数据,计算,
所以有的把握认为学生对学校的管理和服务满意与性别有关,所以选项正确,选项错误.
故选:.
10.【解答】解:设男生可能有人,依题意得女生有人,填写列联表如下:
喜欢抖音 不喜欢抖音 总计
男生
女生
总计
若有的把握认为是否喜欢抖音和性别有关,则,
即,解得,
由题意知,且是5的整数倍,所以45和60都满足题意.
故选:.
11.【解答】解:残差平方和越小的模型,拟合的效果越好,故正确;
用相关指数来刻画回归效果,越大说明拟合效果越好,故错误;
在回归直线方程中,当解释变量每增加1个单位时,预报变量平均增加0.2个单位,故正确;
若变量和之间的相关系数为,接近,则变量和之间的负相关很强,故正确.
故选:.
12.【解答】解:由于线性回归方程中的系数为,因此与具有正的线性相关关系,正确;
根据样本数据计算得到相关系数接近1,则样本数据与回归直线方程有较强的相关性,因此正确;
由线性回归方程中系数的意义可得回归直线的估计值知,每增加,其体重约增加,正确;
当某女生的身高为时,其体重估计值是,而不是具体值,因此错误.
故选:.
三.填空题(共4小题)
13.【解答】解:根据题意,补充列联表如下:
被新冠病毒感染 未被新冠病毒感染 总计
注射疫苗 10 40 50
未注射疫苗 20 30 50
总计 30 70 100
所以表中的值为;
计算,
所以在犯错误的概率最多不超过0.05的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.
故答案为:30,0.05.
14.【解答】解:,,
样本中心为,
将其代入回归直线方程中,有,解得,
回归直线方程为,
当时,,
当投入10万元时,销售额的估计值为106.5万元.
故答案为:106.5.
15.【解答】解:由已知得,,,
所以样本的中心点为,
将其代入,得,即,
所以,
取,得,
所以预测2021年捐赠的现金大约是5.25万元.
故答案为:5.25.
16.【解答】解:由题意可得,因为回归直线,经过样本中心,所以,
所以,解得,
故答案为:2.
四.解答题(共6小题)
17.【解答】解:(1)根据图表的信息知,列联表中,
,;
(2)由列联表中数据,
计算,
所以有的把握认为“当晚下雨”与“日落云里走”有关.
18.【解答】解:(Ⅰ)根据题意,列联表如下表:
能完成 不能完成 合计
40岁以上 45 10 55
40岁以下 30 15 45
合计 75 25 100
所以,
故有的把握认为“预测国际大事的准确率与年龄有关”.
(Ⅱ)选取的20人中,40岁以下的人数为人,
而这9人中,认为能完成的人数为人,不能完成的人数为人,
故所求的概率为.
19.【解答】解:(1)根据题意,由列联表可得:
,
没有的把握认为佩戴口罩的态度与性别有关.
(2)根据题意,男性中认为冬季佩戴口罩十分必要抽取3人,记为,,,男性中认为冬季佩戴口罩没有必要抽取2人,记为,,
故随机抽取2人,所有基本事件为,,,,,,,,,,
其中事件“恰有1人认为冬季佩戴口罩十分必要”包含的基本事件为:,,,,,.
故所求概率.
20.【解答】解:(1)四个理由,任意一个均可,(答案不唯一)
①从以上茎叶图可以看出,药疗效的试验结果有的叶集中在茎2和3上,而药疗效的试验结果有的叶集中在茎0和1上,由此可看出药的疗效更好.
②从茎叶图的分布情况可以看出,服用药的患者日平均增加睡眠时间的平均数大于2,而服用药的患者日平均增加睡眠时间的平均数小于2,因此可知药的疗效更好.
③由茎叶图可知,服用药的患者日平均增加睡眠时间的中位数是,而服用药的患者日平均增加睡眠时间的中位数是,因此药的疗效更好.
④由茎叶图可知,服用药的患者日平均增加睡眠时间分布在茎2上的最多,关于茎2大致呈对称分布;而服用药的患者日平均增加睡眠时间分布在茎1上的最多,关于茎1大致呈对称分布;又患者在服用两种药后日平均增加睡眠时间分布的区间相同,故可以认为服用药的患者日平均增加睡眠时间比服用药的患者日平均增加睡眠时间更多,因此药的疗效更好.
(2)由茎叶图可知,40组数据的中位数为,
因此列联表如下:
超过 不超过
服用药 14 6
服用药 5 15
(3)由于;
所以有的把握认为,两种药的疗效有差异.
21.【解答】解:(Ⅰ)因为,.
所以,所以,
所以关于的回归直线方程为:.
(Ⅱ)当时,,则,
所以可以认为所得到的回归直线方程是理想的.
(Ⅲ)设销售利润为,则,所以时,取最大值,
所以该产品单价定为8.75元时,公司才能获得最大利润.
22.【解答】解:(1)列联表完成如下:
男厨师 女厨师 合计
第一食堂 48 2 50
第二食堂 42 8 50
合计 90 10 100
(2),
因为,
所以有的把握认为第一食堂、第二食堂员工的专业技能与操作技能与性别有关.