第八章 成对数据的统计分析(含解析)—2023-2024学年高二数学人教A版(2019)选择性必修第三册单元双测卷(B卷)

文档属性

名称 第八章 成对数据的统计分析(含解析)—2023-2024学年高二数学人教A版(2019)选择性必修第三册单元双测卷(B卷)
格式 docx
文件大小 638.1KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-03-15 11:14:20

图片预览

文档简介

第八章 成对数据的统计分析—2023-2024学年高二数学人教A版(2019)选择性必修第三册单元双测卷(B卷)
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1.某医疗机构通过抽样调查(样本容量),利用列联表和统计量研究患肺病是否与吸烟有关.计算得,经查对临界值表知,现给出四个结论,其中正确的是( )
A.在100个吸烟的人中约有95个人患肺病
B.若某人吸烟,那么他有95%的可能性患肺病
C.有95%的把握认为“患肺病与吸烟有关”
D.只有5%的把握认为“患肺病与吸烟有关”
2.下列说法中,正确的命题是( )
A.已知随机变量X服从正态分布,则
B.线性相关系数r越大,两个变量的线性相关性越强,反之,线性相关性越弱
C.已知两个变量具有线性相关关系,其回归方程为,若,,则
D.若样本数据,,,的方差为8,则数据,,,的方差为2
3.某小学为提高课后延时服务水平和家长满意度,对该校学生家长就服务质量、课程内容、学生感受、家长认可度等问题进行随机电话回访.某天共回访5位家长,通话时长和评分情况如下表:
时长x(分钟) 10 12 14 15 19
评分y 60 m 75 90
根据散点图分析得知y与x具有线性相关关系且求得其回归方程为,则( )
A.61 B.63 C.65 D.67
4.有两个分类变量X,Y,其列联表如表所示:
a
其中a,均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为( )
A.8 B.9 C.8或9 D.6或8
5.中国新能源汽车出口实现跨越式突破,是国产汽车品牌实现弯道超车,打造核心竞争力的主要抓手.下表是2022年我国某新能源汽车厂前5个月的销量y和月份x的统计表,根据表中的数据可得线性回归方程为,则下列四个命题正确的个数为( )
月份x 1 2 3 4 5
销量y(万辆) 1.5 1.6 2 2.4 2.5
①变量x与y正相关;②;③y与x的样本相关系数;④2022年7月该新能源汽车厂的销量一定是3.12万辆.
A.1 B.2 C.3 D.4
6.根据一组样本数据,,…,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.2,则( )
A.去除两个误差较大的样本点后,y的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.05
7.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 50
未注射疫苗 30 50
合计 30 100
计算可知,根据小概率值________的独立性检验,分析 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”( )
附:,.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.0.001 B.0.05 C.0.01 D.0.005
8.在独立性检测中,我们常用随机变量来判断“两个分类变量有关系”.越大关系越强;越小关系越弱.(附:,其中)下面有甲乙丙丁四组关于“秃顶与患心脏病的列联表”(单位:人)
甲:
患心脏病 患其他病 总计
秃顶 30 20 50
不秃顶 50 100 150
总计 80 120 200
乙:
患心脏病 患其他病 总计
秃顶 25 55 80
不秃顶 25 95 120
总计 50 150 200
丙:
患心脏病 患其他病 总计
秃顶 85 65 150
不秃顶 35 15 50
总计 120 80 200
丁:
患心脏病 患其他病 总计
秃顶 88 32 120
不秃顶 62 18 80
总计 150 50 200
最能说明秃顶与患心脏病有关的一组数据是( )
A.甲 B.乙 C.丙 D.丁
二、多项选择题
9.下图是5个成对数据的散点图,若去掉点,则下列说法正确的是( )
A.变量x与变量y负相关 B.变量x与变量y的相关性变强
C.残差平方和变小 D.样本相关系数r变大
10.某企业秉承“科学技术是第一生产力”的发展理念,投入大量科研经费进行技术革新,该企业统计了最近6年投入的年科研经费x(单位:百万元)和年利润y(单位:百万元)的数据,并绘制成如图所示的散点图.已知x,y的平均值分别为,.甲统计员得到的回归方程为;乙统计员得到的回归方程为;若甲、乙二人计算均未出现错误,下列四个结论中正确的是( )
A.当投入年科研经费为20百万元时,按乙统计员的回归方程可得年利润估计值为75.6百万元(取)
B.
C.方程比方程拟合效果好
D.y与x正相关
11.某学校数学学习兴趣小组利用信息技术手段探究两个数值变量x,y之间的线性关系,随机抽取8个样本点,,……,,由于操作过程的疏忽,在用最小二乘法求经验回归方程时只输入了前6组数据,得到的线性回归方程为,其样本中心为.后来检查发现后,输入8组数据得到的新的经验回归方程为,新的样本中心为,已知,,则( )
A.新的样本中心仍为 B.新的样本中心为
C.两个数值变量x,y具有正相关关系 D.
12.已知由样本数据点集合,求得线性回归方程为,且,现发现两个数据点和误差较大,去除后重新求得回归直线l的斜率为1.2,则下列结论正确的是( )
A.变量x与y具有正相关关系
B.去除后y的估计值增加速度变快
C.去除后与去除前均值,不变
D.去除后的线性回归方程为
三、填空题
13.在一组样本数据,,…,(,,,…,不相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为__________.
14.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元) 4 2 3 5
销售额y(万元) 49 26 39 54
根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为________万元.
15.某单位为了制定节能减排的目标,先调查了用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据,得线性回归方程,当气温为-5℃时,预测用电量的度数约为______.
16.某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的,女生喜欢看篮球赛的人数占女生人数的.若被调查的男生人数为n,且有的把握认为喜欢看篮球赛与性别有关,则n的最小值为________.
四、解答题
17.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(i)证明:;
(ii)利用该调查数据,给出,的估计值,并利用(i)的结果给出R的估计值.
附:,
0.050 0.010 0.001
3.841 6.635 10.828
18.随着寒冷冬季的到来,羽绒服进入了销售旺季,某调查机构随机调查了400人,询问他们选购羽绒服时更关注保暖性能还是更关注款式设计,得到以下的列联表:
更关注保暖性能 更关注款式设计 合计
女性 160 80 240
男性 120 40 160
合计 280 120 400
(1)是否有的把握认为男性和女性在选购羽线服时的关注点有差异?
(2)若从这400人中按男女比例用分层抽样的方法抽取5人进行采访,再从这5人中任选2人赠送羽线服,记X为抽取的2人中女生的人数,求X的分布列和数学期望.
附:.
0.10 0.05 0.010
2.706 3.841 6.635
19.在政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据,如表所示:
单价x千元 3 4 5 6 7 8
销量y百件 70 65 62 59 56 48
(1)若变量x,y具有线性相关关系,求产品销量y(百件)关于试销单价x(千元)的线性回归方程;
(2)用(1)中所求的线性回归方程得到与对应的产品销量的估计值当销售数据对应的残差的绝对值时,则将销售数据称为一个“好数据”现从个销售数据中任取2个,求“好数据”至少有1个的概率.
参考数据:,(参考公式:线性回归方程中,的估计值分别为,).
20.某学校甲、乙、丙三家餐厅,分布在生活区的南北两个区域,其中甲、乙餐厅在南区,丙餐厅在北区.各餐厅菜品丰富多样,可以满足学生的不同口味和需求.
(1)现在对学生性别与在南北两个区域就餐的相关性进行分析,得到下表所示的抽样数据,依据的独立性检验,能否认为在不同区域就餐与学生性别有关联?
性别 就餐区域 合计
南区 北区
男 33 10 43
女 38 7 45
合计 71 17 88
(2)张同学选择餐厅就餐时,如果前一天在甲餐厅,那么后一天去甲,乙餐厅的概率均为;如果前一天在乙餐厅,那么后一天去甲,丙餐厅的概率分別为,;如果前一天在丙餐厅,那么后一天去甲,乙餐厅的概率均为.张同学第1天就餐时选择甲,乙,丙餐厅的概率分别为,,.
(i)求第2天他去乙餐厅用餐的概率;
(ii)求第n天他去甲餐厅用餐的概率.
附:,;
0.100 0.050 0.025 0.010
2.706 3.841 5.024 6.635
参考答案
1.答案:C
解析:计算得,经查对临界值表知,
有的把握说患肺病与吸烟有关,故选C.
2.答案:D
解析:A.已知随机变量服从正态分布,,
则,所以,
所以,
,故A错误;
B. 线性相关系数r的范围在-1到1之间,有正有负,相关有正相关和负相关,
相关系数的绝对值的大小越接近于1,两个变量的线性相关性越强,
反之,线性相关性越弱,故B错误;
C.已知两个变量具有线性相关关系,其回归直线方程为,若,,,则,故C错误;
D. 设数据,,…,的方差为,
则样本数据,,…,的方差为,则,即数据,,的方差为2,故D正确.
故选:D.
3.答案:C
解析:依题意,得,
,
将样本中心代入回归方程,
得,解得.
故选:C.
4.答案:C
解析:根据公式,得,
又且,,求得当或9时满足题意.故选C.
5.答案:B
解析:由,
因为回归直线过样本中心,,,②错误;
可知y随着x变大而变大,所以变量x与y正相关,①③正确;
由回归直线可知,2022年7月该新能源汽车厂的销量的估计值是万辆,④错误.
故选:B.
6.答案:C
解析:因为,所以去除两个误差较大的样本点后y的估计值增加速度变慢,故A错误;当时,,设去掉两个误差较大的样本点后,横坐标的平均值为,纵坐标的平均值为,则,,故B错误;因为去除两个误差较大的样本点后,重新求得回归直线的斜率为1.2,所以,解得,所以去除两个误差较大的样本点后的经验回归方程为,故C正确;对D,因为,所以,故D错误.
7.答案:B
解析:完善列联表如下:
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 40 50
未注射疫苗 20 30 50
合计 30 70 100
零假设为 “给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.
因为,
所以根据小概率值的独立性检验,推断不成立,
即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.
故选:B.
8.答案:A
解析:解:由题意,,,
,,
因为,
所以,
所以最能说明秃顶与患心脏病有关的一组数据是甲组,
故选:A.
9.答案:ABC
解析:由散点图可知,去掉点D后,y与x的线性相关加强,且为负相关,所以AB正确.
由于y与x的线性相关加强,所以残差平方和变小,所以C正确.
由于y与x的线性相关加强,且为负相关,所以相关系数的绝对值变大,而相关系数为负的,所以样本相关系数r变小,所以D错误,故选ABC.
10.答案:ABD
解析:将代入,得,A正确;将,代入得,B正确;由散点图可知,回归方程比的拟合效果更好,C错误;
因为y随x的增大而增大,所以y与x正相关,D正确.故ABD正确.
11.答案:BC
解析:对于A,B,根据前6组数据的样本中心为,
又因为,,可得,,故A错误,B正确
对于C,因为8组数据的样本中心为,经验回归方程为,所以可以解得,所以两个数值变量为正相关关系;
对于D,根据样本估计总体及最小二乘法原理,利用8组数据所得的经验回归方程是与所有样本点“距离”平方和最小的直线方程,故D错误
故选BC.
12.答案:ACD
解析:关于x的线性回归方程为,回归系数,变量x与y具有正相关关系,故A正确;去除两个数据点后重新求得回归直线l的斜率为1.2,由,可知去除后y的估计值增加速度变慢,故B错误;去除前的均值,去除的两个数据点的横坐标的平均数为3,则去除后与去除前的均值不变,由回归直线恒过样本点的中心,可得去除前均值,而去除的两个数据点的纵坐标的平均数为5,则去除后与去除前的均值不变,故C正确;设去除后的线性回归方程为,把样本点的中心代入,得,解得,去除后的线性回归方程为,故D正确.
故选ACD.
13.答案:-1
解析:因为在直线方程中,斜率,所有样本点都在直线上,所以这组样本数据的样本相关系数为-1.
14.答案:
解析:由表可计算,,因为点在回归直线上,且,所以,解得,故回归方程为,令得
故答案为:
15.答案:70
解析:由表格,可得
,,
即为:,
又在回归方程上,

解得:,
.
当时,.
故答案为:70.
16.答案:12
解析:由题意得到如下列联表:
喜欢看篮球赛 不喜欢看篮球赛 总计
男生 n
女生
总计 n
所以.
因为有的把握认为喜欢看篮球赛与性别有关,所以,
即,.
又,,为整数,所以n的最小值为12.故答案为12.
17.答案:(1)有的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异
(2)(i)证明见解析;(ii)6
解析:(1)由已知:,所以有的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为,所以,所以.
(ii)由已知,,又,,所以.
18.答案:(1)没有的把握认为男性和女性在选购羽线服时的关注点有差异
(2)分布列见解析,
解析:(1)因为,
因为,所以没有的把握认为男性和女性在选购羽线服时的关注点有差异.
(2)选出的男性人数为,选出的女性人数为,
由题意可得X的所有可能取值为0,1,2,
,
,
故X的分布列为
X 0 1 2
P
所以X的数学期望.
19.答案:(1);
(2).
解析:(1)依题意,,,
而,,于是,
,
所以所求线性回归方程为.
(2)利用(1)中所求的线性回归方程得:
当时,;当时,;
当时,;当时,;
当时,;当时,,
与销售数据对比知满足的共有个“好数据”:,,,
记6个销售数据中的4个“好数据”分别为a,b,c,d,另两个数据为1,2,
从6个销售数据中任取个的试验的样本空间:
,共15个样本点,
“好数据”至少有个的事件A,其对立事件,
故,
所以“好数据”至少有1个的概率为.
20.答案:(1)认为在不同区域就餐与学生性别没有关联
(2);
解析:(1)依据表中数据,,
依据的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为在不同区域就餐与学生性别没有关联.
(2)设“第i天去甲餐厅用餐”,“第i天去乙餐厅用餐”,“第i天去丙餐厅用餐”,则、、两两互斥,,2,…,n.
根据题意得,,,,,,,.
(i)由,结合全概率公式,得,
因此,张同学第2天去乙餐厅用餐的概率为.
(ii)记第天他去甲,乙,丙餐厅用餐的概率分别为,,,
则,,由全概率公式,


故①,
同理②,
③,
④,
由①②,,
由④,,
代入②,得:,即,
故是首项为,公比为的等比数列,即,
所以,
于是,当时,

综上所述,.