【人教A版(2019)】高中数学选修3 第8章-成对数据的统计分析 单元检测卷(原卷版+解析版)

文档属性

名称 【人教A版(2019)】高中数学选修3 第8章-成对数据的统计分析 单元检测卷(原卷版+解析版)
格式 zip
文件大小 898.8KB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2022-08-02 17:12:03

文档简介

(
…………○…………内…………○…………装…………○…………订…………○…………线…………○…………
) (
※※请※※不※※要※※在※※装※※订※※线※※内※※答※※题※※
) (
…………○…………外…………○…………装…………○…………订…………○…………线…………○…………
)
(
…………○…………内…………○…………装…………○…………订…………○…………线…………○…………
) (
学校:___________姓名:___________班级:___________考号:___________
) (
…………○…………外…………○…………装…………○…………订…………○…………线…………○…………
)
绝密★启用前
第八章成对数据的统计分析 单元检测卷
试卷副标题
考试范围:xxx;考试时间:100分钟;命题人:xxx
注意事项:
1.答题前填写好自己的姓名、班级、考号等信息
2.请将答案正确填写在答题卡上
第I卷(选择题)
请点击修改第I卷的文字说明
一、单选题
1.下列说法正确的是(  )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义
C.相关关系可以对变量的发展趋势进行预报,这种预报可能是错误的
D.独立性检验如果得出的结论有99%的可信度就意味着这个结论一定是正确的
2.下面的散点图与相关系数一定不符合的是( )
A.①②③ B.①②④ C.①③④ D.②③④
3.已知变量与,且观测数据如下表(其中,),则由该观测的数据算得的线性回归方程可能是( )
1 2 3 4 5
6.5 4 1
A. B.
C. D.
4.下图是相关变量的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程:,相关系数为;方案二:剔除点,根据剩下数据,得到线性回归方程:,相关系数为;则( )
A. B.
C. D.
5.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
6.某调查者在调查中获知某公司近年来科研费用支出(万元)与公司所获得利润(万元)的统计资料如下表:
序号 科研费用支出 利润
合计
则利润关于科研费用支出的经验回归方程为( )
参考公式:,.A. B. C. D.
7.2021年3月全国两会上,“碳达峰”碳中和”备受关注.为应对气候变化,我国提出“二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和”等庄严的目标承诺.在今年的政府工作报告中,“做好碳达峰 碳中和工作”被列为2021年重点任务之一;“十四五”规划也将加快推动绿色低碳发展列入其中.我国自1981年开展全民义务植树以来,全国森林面积呈线性增长,第三次全国森林资源清查的时间为1984﹣1988年,每5年清查一次,历次清查数据如表:
第次 3 4 5 6 7 8 9
森林面积(亿平方米) 1.25 1.34 1.59 1.75 1.95 2.08 2.20
经计算得到线性回归直线为(参考数据:),据此估算我国森林面积在第几次森林资源清查时首次超过3亿平方米( )A.12 B.13 C.14 D.15
8.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民能否做到“光盘”得到如下的列联表:
单位:人
不能做到“光盘” 能做到“光盘” 合计
男 45 10 55
女 30 15 45
合计 75 25 100
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
,其中.
参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”
D.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”
二、多选题
9.下列说法正确的是( )
A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系
B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好
C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好
D.在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位
10.在独立性检验中,为了调查变量与变量的关系,经过计算得到,表示的意义是( )
A.有99%的把握认为变量与变量没有关系
B.有1%的把握认为变量与变量有关系
C.有99%的把握认为变量与变量有关系
D.有1%的把握认为变量与变量没有关系
11.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系 B.去除后的回归方程为
C.去除后y的估计值增加速度变快 D.去除后相应于样本点的残差为0.05
12.某校团委对“学生性别和喜欢运动是否有关”进行了一次调查,其中被调查的男 女生人数相同,男生喜欢运动的人数占男生人数的,女生喜欢运动的人数占女生人数的,若有95%的把握,但没有99%的把握认为“是否喜欢运动和性别有关”,则被调查人中男生可能有( )
附:
0.05 0.01
3.841 6.635
,其中.A.25人 B.45人 C.60人 D.75人
第II卷(非选择题)
请点击修改第II卷的文字说明
三、填空题
13.下表是关于男婴与女婴出生时间调查的列联表:
晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180
那么,A=_____,B=_____,C=_____,D=_____,E=_____.
14.如图是一组数据的散点图,经最小二乘估计公式计算,与之间的线性回归方程为,则______.
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:表中数据得回归直线方程中的=-2,预测当气温为-4℃时,用电量为________.
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身得到的数据如下表:
单位:人
读书 健身 合计
女 24 31 55
男 8 26 34
合计 32 57 89
在犯错误的概率不超过___________的前提下认为性别与休闲方式有关系.
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
四、解答题
17.某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.
(1)根据已知条件与等高条形图完成下面的列联表:
单位:名
男同学 女同学 总计
需要帮助
不需要帮助
总计
(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.
附:,其中.
0.050 0.010 0.001
3.841 6.635 10.828
18.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:
商店名称 A B C D E
销售额x/千万元 3 5 6 7 9
利润额y/百万元 2 3 3 4 5
(1)画出散点图,观察散点图,说明两个变量是否线性相关;
(2)用最小二乘法计算利润额y对销售额x的线性回归方程;
(3)当销售额为4千万元时,估计利润额的大小.
(参考公式:,)
19.从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔 使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率和电动自行车驾乘人员交通事故死亡率,并整理得到下面的散点图.
(1)求这20个城市的电动自行车头盔佩戴率大于50%的概率;
(2)通过散点图分析与的相关关系,说明佩戴安全头盔的必要性;
(3)有四名同学通过计算得到与的相关系数分别为0.97,0.62,,,请你从中选出最有可能正确的结果,并以此求出关于的线性回归方程.
参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.
20.2020年3月,由于疫情的影响,各地学生在家进行网上在线学习,为了研究学生在网上学习的情况,某学校在网上随机抽取120名学生对线上教育进行调查,其中男生与女生的人数之比为,男生中有30人对线上教育满意,女生中有15人表示对线上教育不满意.
(1)完成下面的列联表,并依据的独立性检验,分析对线上教育是否满意与性别是否有关:
单位:人
满意 不满意 合计
男生
女生
合计 120
(2)从被调查的对线上教育满意的学生中,利用分层随机抽样抽取8名学生,再在这8名学生中抽取3名学生作线上学习的经验介绍,其中抽取男生的人数为,求的分布列及期望.
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
21.某省级示范高中高三年级对各科考试的评价指标中,有“难度系数“和“区分度“两个指标中,难度系数,区分度.
(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147,142,137;普通班三人的成绩分别为97,102,113.通过样本估计本次考试的区分度(精确0.01).
(2)如表表格是该校高三年级6次数学考试的统计数据:
难度系数x 0.64 0.71 0.74 0.76 0.77 0.82
区分度y 0.18 0.23 0.24 0.24 0.22 0.15
①计算相关系数r,|r|<0.75时,认为相关性弱;|r|≥0.75时,认为相关性强.通过计算说明,能否利用线性回归模型描述y与x的关系(精确到0.01).
②ti=|xi﹣0.74|(i=1,2,…,6),求出y关于t的线性回归方程,并预测x=0.75时y的值(精确到0.01).
附注:参考数据:
参考公式:相关系数r,回归直线的斜率和截距的最小二乘估计分别为
22.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在25周岁以上(含25周岁)和25周岁以下分为两组,再将两组工人的日平均生产件数分成5组:,,,,分别加以统计,得到的频率分布直方图分别如图1,图2.
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名25周岁以下工人的概率;
(2)规定日平均生产件数不少于80者为生产能手,请你根据已知条件列出列联表,并依据的独立性检验,分析生产能手与工人所在的年龄组是否有关.
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
,其中.
试卷第1页,共3页
试卷第1页,共3页(
…………○…………内…………○…………装…………○…………订…………○…………线…………○…………
) (
※※请※※不※※要※※在※※装※※订※※线※※内※※答※※题※※
) (
…………○…………外…………○…………装…………○…………订…………○…………线…………○…………
)
(
…………○…………内…………○…………装…………○…………订…………○…………线…………○…………
) (
学校:___________姓名:___________班级:___________考号:___________
) (
…………○…………外…………○…………装…………○…………订…………○…………线…………○…………
)
绝密★启用前
第八章成对数据的统计分析 单元检测卷
试卷副标题
考试范围:xxx;考试时间:100分钟;命题人:xxx
注意事项:
1.答题前填写好自己的姓名、班级、考号等信息
2.请将答案正确填写在答题卡上
第I卷(选择题)
请点击修改第I卷的文字说明
一、单选题
1.下列说法正确的是(  )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义
C.相关关系可以对变量的发展趋势进行预报,这种预报可能是错误的
D.独立性检验如果得出的结论有99%的可信度就意味着这个结论一定是正确的
【答案】C
【解析】
【详解】
相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用;独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义,故正确答案为C.
2.下面的散点图与相关系数一定不符合的是( )
A.①②③ B.①②④ C.①③④ D.②③④
【答案】C
【解析】
【分析】
根据散点图与相关系数直接的关系,逐项判断,即可得出结果.
【详解】
①中,由散点图可得,两相关变量呈负相关,故①错;
②中,由散点图可得,两相关变量呈正相关,且相关系数可能是;
③中,若相关系数,则所有的点应该分布在一条直线上,散点图显然不符合,故③错;
④中,若相关系数,则所有的点应该分布在一条直线上,散点图显然不符合,故④错;
故选:C.
3.已知变量与,且观测数据如下表(其中,),则由该观测的数据算得的线性回归方程可能是( )
1 2 3 4 5
6.5 4 1
A. B.
C. D.
【答案】C
【解析】
【分析】
求出,代入方程检验,然后根据的变化趋势判系数的正负可得.
【详解】
由题意,,
把代入各方程,A中,,同理有B中,,C中,D中,,
又表格中数据随着的增大,减小,因此它们负相关,的系数为负.
故选:C.
【点睛】
在求线性回归方程时,可观察已知数据,呈线性相关的数据,如果随的增大,也增大,则与是正相关,在回归直线方程中的系数为正,反之为负.
4.下图是相关变量的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程:,相关系数为;方案二:剔除点,根据剩下数据,得到线性回归方程:,相关系数为;则( )
A. B.
C. D.
【答案】A
【解析】
由散点图可判断正负相关,得出为正,再结合剔除点前后的回归直线,即可比较出.
【详解】
由散点图分布图可知,变量 和成正相关,所以 ,
在剔除点之后,
且可看出回归直线的线性相关程度更强,更接近1.
所以 .
故选:A.
【点睛】
本题主要考查散点图的正负相关以及变量的相关性,相关系数的意义:①当散点分布呈正相关,;负相关,;②越接近1,说明两个变量越具有线性相关关系,即线性关系越强.
5.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
【答案】D
【解析】
【分析】
由等高条形图的定义和性质依次分析,即得解
【详解】
观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强.
故选:D
6.某调查者在调查中获知某公司近年来科研费用支出(万元)与公司所获得利润(万元)的统计资料如下表:
序号 科研费用支出 利润
合计
则利润关于科研费用支出的经验回归方程为( )
参考公式:,.A. B. C. D.
【答案】A
【解析】
【分析】
根据表格数据,直接采用最小二乘法计算即可.
【详解】
由表格数据知:,,
,,所求经验回归方程为:.
故选:A.
7.2021年3月全国两会上,“碳达峰”碳中和”备受关注.为应对气候变化,我国提出“二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和”等庄严的目标承诺.在今年的政府工作报告中,“做好碳达峰 碳中和工作”被列为2021年重点任务之一;“十四五”规划也将加快推动绿色低碳发展列入其中.我国自1981年开展全民义务植树以来,全国森林面积呈线性增长,第三次全国森林资源清查的时间为1984﹣1988年,每5年清查一次,历次清查数据如表:
第次 3 4 5 6 7 8 9
森林面积(亿平方米) 1.25 1.34 1.59 1.75 1.95 2.08 2.20
经计算得到线性回归直线为(参考数据:),据此估算我国森林面积在第几次森林资源清查时首次超过3亿平方米( )A.12 B.13 C.14 D.15
【答案】C
【解析】
【分析】
先根据回归方程过样本中心点求得,再解不等式,即得结果.
【详解】
解:由题意可知,,

又因为,
则,
故,
令,得,又为整数,
所以,为整数,
即估算我国森林面积在第14次森林资源清查时首次超过3亿平方米.
故选:C.
8.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民能否做到“光盘”得到如下的列联表:
单位:人
不能做到“光盘” 能做到“光盘” 合计
男 45 10 55
女 30 15 45
合计 75 25 100
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
,其中.
参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”
D.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”
【答案】C
【解析】
【分析】
由公式计算卡方后判断
【详解】

∵,∴在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”.
故选:C
二、多选题
9.下列说法正确的是( )
A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系
B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好
C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好
D.在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位
【答案】ABD
【解析】
【分析】
A选项,可以利用散点图直观判断两个变量是否具有线性相关关系;B选项,可以从残差图中发现可疑数据,用残差平方和判断模型拟合效果;C选项,拟合效果的好坏不能用样本相关系数来进行判断;D选项,根据经验回归方程,得到当解释变量每增加1个单位时,相应变量增加0.1个单位.
【详解】
对于A,可以借助散点图直观判断两个变量是否具有线性相关关系,所以A正确;
对于B,残差图可以发现原始数据中的可疑数据;可用残差平方和判断模型的拟合效果,
残差平方和越小,模型的拟合效果越好,所以B选项正确;
对于C,样本相关系数的绝对值越大,只能说明两个变量的线性相关性越强,
不能作为分析模型的拟合效果好坏的依据,应该是越大,模型的拟合效果越好,所以C错误;
对于D,在经验回归方程中,当解释变量每增加1个单位时,
相应变量增加0.1个单位,所以D正确.
故选:ABD.
10.在独立性检验中,为了调查变量与变量的关系,经过计算得到,表示的意义是( )
A.有99%的把握认为变量与变量没有关系
B.有1%的把握认为变量与变量有关系
C.有99%的把握认为变量与变量有关系
D.有1%的把握认为变量与变量没有关系
【答案】CD
【解析】
【分析】
由独立性检验中观测值和临界值的意义,即可得出正确的答案.
【详解】
在独立性检验中,由.
表示的意义是:有1%的把握认为变量与变量没有关系,所以D正确.
即有99%的把握认为变量与变量有关系,所以C正确.
故选:CD
【点睛】
本题考查了独立性检验的应用问题,属于基础题.
11.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系 B.去除后的回归方程为
C.去除后y的估计值增加速度变快 D.去除后相应于样本点的残差为0.05
【答案】AB
【解析】
A. 根据回归直线方程的x系数的正负判断.B. 根据去除前后样本点不变判断.C. 根据去除前后x的系数大小判断.D.根据残差的计算公式判断.
【详解】
因为回归直线方程为,,
所以变量x与y具有正相关关系.故A正确.
当时,,
样本点为,去掉两个数据点和后,样本点还是,
又因为去除后重新求得的回归直线l的斜率为1.2,
所以,
解得,
所以去除后的回归方程为,故B正确.
因为,所以去除后y的估计值增加速度变慢,故C错误.
因为,
所以,故D错误.
故选:AB
【点睛】
本题主要考查回归分析的理解,还考查了理解辨析的能力,属于基础题.
12.某校团委对“学生性别和喜欢运动是否有关”进行了一次调查,其中被调查的男 女生人数相同,男生喜欢运动的人数占男生人数的,女生喜欢运动的人数占女生人数的,若有95%的把握,但没有99%的把握认为“是否喜欢运动和性别有关”,则被调查人中男生可能有( )
附:
0.05 0.01
3.841 6.635
,其中.A.25人 B.45人 C.60人 D.75人
【答案】BC
【解析】
【分析】
设被调查人中男生有人,列出列联表,根据公式得出,解出即可.
【详解】
设被调查人中男生有人,依题意可得列联表如下:
单位:人
喜欢运动 不喜欢运动 合计
男生
女生
合计
若有95%的把握,但没有99%的把握认为“是否喜欢运动和性别有关”,
则,解得,
由题意知,所以结合选项知45和60满足题意.
故选:BC.
第II卷(非选择题)
请点击修改第II卷的文字说明
三、填空题
13.下表是关于男婴与女婴出生时间调查的列联表:
晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180
那么,A=_____,B=_____,C=_____,D=_____,E=_____.
【答案】 47 92 88 82 53
【解析】
【分析】
由题意,根据独立性检验的的列联表,列出关于的方程组,即可求解.
【详解】
由题意,根据独立性检验的的列联表,
可得,解得.
【点睛】
本题主要考查了独立性检验的应用,其中解答中熟记独立性检验中的列联表,列出相应的方程组是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.
14.如图是一组数据的散点图,经最小二乘估计公式计算,与之间的线性回归方程为,则______.
【答案】1
【解析】
【分析】
根据线性回归方程过样本点中心求解出的值即可.
【详解】
因为,,
所以,所以,
故答案为:.
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:表中数据得回归直线方程中的=-2,预测当气温为-4℃时,用电量为________.
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
【答案】68度
【解析】
【分析】
先求样本数据的中心点,代入回归直线方程可得,然后代入可求.
【详解】
回归直线过(,),
根据题意得,,
将(10,40)代入,解得=60,,
当x=-4时,,即当气温为-4℃时用电量约为68度.
【点睛】
本题主要考查 回归直线方程的求解,根据回归直线一定经过样本数据的中心点可求参数,然后根据方程可求预测值,侧重考查数据分析和数学运算的核心素养.
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身得到的数据如下表:
单位:人
读书 健身 合计
女 24 31 55
男 8 26 34
合计 32 57 89
在犯错误的概率不超过___________的前提下认为性别与休闲方式有关系.
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】0.1##
【解析】
【分析】
计算卡方,进行独立性检验.
【详解】
由题中列联表中的数据,得,
因为,所以在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关系.
故答案为:
四、解答题
17.某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.
(1)根据已知条件与等高条形图完成下面的列联表:
单位:名
男同学 女同学 总计
需要帮助
不需要帮助
总计
(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.
附:,其中.
0.050 0.010 0.001
3.841 6.635 10.828
【答案】(1)答案见解析;
(2)认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
【解析】
【分析】
(1)根据等高条形图分别求出男、女同学需要帮助和不需要帮助的分数,可得出列联表.
(2)先由公式求出的值,再对照表格中给出的值可得答案.
(1)
由题意知有20名男同学,则有30名女同学.
由题中等高条形图可知男同学需要帮助的有4人,不需要帮助的有16人.
女同学需要帮助的有3人,不需要帮助的有27人.
则列联表为
单位:名
男同学 女同学 总计
需要帮助 4 3 7
不需要帮助 16 27 43
总计 20 30 50
(2)
假设:该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
经计算得,
依据的独立性检验,没有充分证据推断不成立,因此证明成立,
即认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
18.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:
商店名称 A B C D E
销售额x/千万元 3 5 6 7 9
利润额y/百万元 2 3 3 4 5
(1)画出散点图,观察散点图,说明两个变量是否线性相关;
(2)用最小二乘法计算利润额y对销售额x的线性回归方程;
(3)当销售额为4千万元时,估计利润额的大小.
(参考公式:,)
【答案】(1)图见解析,变量线性相关;(2);(3)2.4百万元
【解析】
(1)根据题中数据在直角坐标系中作出这五个点,即可得到散点图,并由图观察这些点是否在一条直线附近,即可判断;
(2)根据公式分别求出,即可求出;
(3)由(2)中求出的回归方程,将代入,即可估计利润额的大小.
【详解】
解:(1)散点图如图所示.
由散点图可以看出变量线性相关.
(2)设线性回归方程是.
因为,所以,

即利润额y对销售额x的线性回归方程为.
(3)当销售额为4千万元时,利润额约为(百万元).
【点睛】
本题主要考查利用散点图判断两个变量是否存在相关关系,利用最小二乘法求线性回归方程,以及利用回归方程进行预测,属于基础题.
19.从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔 使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率和电动自行车驾乘人员交通事故死亡率,并整理得到下面的散点图.
(1)求这20个城市的电动自行车头盔佩戴率大于50%的概率;
(2)通过散点图分析与的相关关系,说明佩戴安全头盔的必要性;
(3)有四名同学通过计算得到与的相关系数分别为0.97,0.62,,,请你从中选出最有可能正确的结果,并以此求出关于的线性回归方程.
参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.
【答案】(1);(2)答案见解析;(3)最有可能正确的结果为,回归方程为.
【解析】
【分析】
(1)由散点图数出佩戴率大于50%的城市有10个,计算结果;(2)由较强的负相关关系分析;(3)最有可能正确的结果为.由给定公式可得,代入数据计算求出,,,代入可求出,从而求出回归方程.
【详解】
解:(1)电动自行车头盔佩戴率大于50%的城市有10个,故所求的概率为.
(2)由散点图可知与有较强的负相关关系,提高电动自行车头盔佩戴率能有效降低驾乘人员交通事故死亡率,所以佩戴安全头盔十分有必要.
(3)最有可能正确的结果为.
根据参考数据得,,
所以,

所以关于的线性回归方程为.
【点睛】
知识点点睛:(1)一般情况下,相关系数时,两个变量不具备相关关系,当时,两个变量具备较强的相关关系;(2)线性回归方程必过点.
20.2020年3月,由于疫情的影响,各地学生在家进行网上在线学习,为了研究学生在网上学习的情况,某学校在网上随机抽取120名学生对线上教育进行调查,其中男生与女生的人数之比为,男生中有30人对线上教育满意,女生中有15人表示对线上教育不满意.
(1)完成下面的列联表,并依据的独立性检验,分析对线上教育是否满意与性别是否有关:
单位:人
满意 不满意 合计
男生
女生
合计 120
(2)从被调查的对线上教育满意的学生中,利用分层随机抽样抽取8名学生,再在这8名学生中抽取3名学生作线上学习的经验介绍,其中抽取男生的人数为,求的分布列及期望.
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)列联表见解析,认为对线上教育是否满意与性别有关
(2)分布列见解析,数学期望:
【解析】
【分析】
(1)由题意,根据比例求出男女生满意和不满意的人数,即可完成列联表;写出零假设,由定义计算并与比较即可得出结果;
(2)由男女满意人数比例求出男生的人数及的可能取值,服从超几何分布,即可由超几何分布概率公式求出概率,得到分布列,最后根据定义求出期望即可
(1)
男生人数为,
所以女生人数为,于是可完成列联表如下:
单位:人
满意 不满意 合计
男生 30 25 55
女生 50 15 65
合计 80 40 120
零假设为:对线上教育是否满意与性别无关. 计算可得

依据的独立性检验,推断不成立,即认为对线上教育是否满意与性别有关.
(2)
由(1)可知男生抽取3人,女生抽取5人,依题可知的可能取值为0,1,2,3,
并且服从超几何分布,,即
,,
,.
所以的分布列为
0 1 2 3
可得.
21.某省级示范高中高三年级对各科考试的评价指标中,有“难度系数“和“区分度“两个指标中,难度系数,区分度.
(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147,142,137;普通班三人的成绩分别为97,102,113.通过样本估计本次考试的区分度(精确0.01).
(2)如表表格是该校高三年级6次数学考试的统计数据:
难度系数x 0.64 0.71 0.74 0.76 0.77 0.82
区分度y 0.18 0.23 0.24 0.24 0.22 0.15
①计算相关系数r,|r|<0.75时,认为相关性弱;|r|≥0.75时,认为相关性强.通过计算说明,能否利用线性回归模型描述y与x的关系(精确到0.01).
②ti=|xi﹣0.74|(i=1,2,…,6),求出y关于t的线性回归方程,并预测x=0.75时y的值(精确到0.01).
附注:参考数据:
参考公式:相关系数r,回归直线的斜率和截距的最小二乘估计分别为
【答案】(1)0.25;(2)①理由见解析,不能利用线性回归模型描述y与x的关系; ② 回归直线方程,预测值为0.24
【解析】
(1)先求出平均成绩,即可求出区分度;
(2)①由题意计算 ,求出相关系数,即可判断两变量相关性强弱;
②计算回归系数,写出线性回归方程,利用方程计算t=10时的值.
【详解】
(1)实验班三人成绩的平均值为,
普通班三人成绩的平均值为,
故估计本次考试的区分度为0.25,
(2)①由题中的表格可知(0.64+0.71+0.74+0.76+0.77+0.82)=0.74,
(0.18+0.23+0.24+0.24+0.22+0.15)=0.21,
故r0.13.
因为|r|<0.75,所以相关性弱,故不能利用线性回归模型描述y与x的关系;
②y与t的值如下表
t 0.10 0.03 0 0.02 0.03 0.08
区别度y 0.18 0.23 0.24 0.24 0.22 0.15
因为0.86,
所以a0.21+0.860.25,
所以所求回归直线方程y=﹣0.86t+0.25,
当x=0.75时,此时t=0.01,则y≈0.24
【点睛】
本题考查线性回归方程的求法,考查线性相关关系强弱的判定,考查计算能力,是中档题.
22.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在25周岁以上(含25周岁)和25周岁以下分为两组,再将两组工人的日平均生产件数分成5组:,,,,分别加以统计,得到的频率分布直方图分别如图1,图2.
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名25周岁以下工人的概率;
(2)规定日平均生产件数不少于80者为生产能手,请你根据已知条件列出列联表,并依据的独立性检验,分析生产能手与工人所在的年龄组是否有关.
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
,其中.
【答案】(1)
(2)列联表答案见解析,认为生产能手与工人所在的年龄组无关
【解析】
【分析】
(1)由题中数据得出相应人数,再由古典概型求解
(2)由题中数据列出列联表,计算卡方后判断
(1)
由已知得,样本中有25周岁以上(含25周岁)工人60名,25周岁以下工人40名.
所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)工人有(名),记为,,;25周岁以下工人有(名),记为,.
从中随机抽取2名工人,所有的可能结果共有10种,它们是,,,,,,,,,.
其中,至少有一名25周岁以下工人的可能结果共有7种,它们是,,,,,,,故所求概率.
(2)
由题中频率分布直方图可知,在抽取的100名工人中,25周岁以上(含25周岁)的生产能手有(名),25周岁以下的生产能手有(名),据此可得列联表如下:
单位:名
生产能手 非生产能手 合计
25周岁以上(含25周岁) 15 45 60
25周岁以下 15 25 40
合计 30 70 100
零假设为:生产能手与工人所在的年龄组无关.计算可得
.
依据的独立性检验,没有充分证据推断不成立,因此认为成立,即认为生产能手与工人所在的年龄组无关.
试卷第1页,共3页
试卷第1页,共3页