2023-2024学年高二数学苏教版2019选择性必修第二册同步试题 第9章 统计 单元综合检测(含解析)

文档属性

名称 2023-2024学年高二数学苏教版2019选择性必修第二册同步试题 第9章 统计 单元综合检测(含解析)
格式 zip
文件大小 1.4MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2023-09-13 18:13:14

文档简介

第9章 统计 单元综合检测
一、单选题
1.下列有关回归分析的说法中不正确的是( )
A.回归直线必过点
B.回归直线就是散点图中经过样本数据点最多的那条直线
C.当相关系数时,两个变量正相关
D.如果两个变量的线性相关性越弱,则就越接近于
【答案】B
【分析】根据线性回归直线的性质可判断选项AB;根据相关系数的性质可判断CD,进而可得正确选项.
【解析】对于A选项,回归直线必过点,A对;
对于B选项,线性回归直线在散点图中可能不经过任一样本数据点,B错;
对于C选项,当相关系数时,两个变量正相关,C对;
对于D选项,如果两个变量的线性相关性越弱,则就越接近于,D对.
故选:B.
2.某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是( )
A.相关系数r变小 B.决定系数变小
C.残差平方和变大 D.解释变量x与预报变量y的相关性变强
【答案】D
【分析】从图中分析得到去掉后,回归效果更好,再由相关系数,决定系数,残差平方和和相关性的概念和性质作出判断即可.
【解析】从图中可以看出较其他点,偏离直线远,故去掉后,回归效果更好,
对于A,相关系数越接近于1,模型的拟合效果越好,若去掉后,相关系数r变大,故A错误;
对于B,决定系数越接近于1,模型的拟合效果越好,若去掉后,决定系数变大,故B错误;
对于C,残差平方和越小,模型的拟合效果越好,若去掉后,残差平方和变小,故C错误;
对于D,若去掉后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.
故选:D.
3.下列图形中具有相关关系的是( )
A. B.
C. D.
【答案】C
【分析】根据图形的特点结合相关关系的概念判断即可.
【解析】根据图象可得选项AB中的图形为连续曲线,变量间的关系是确定的,不是相关关系;
选项C中散点分布在一条直线附近,可得其线性相关;
选项D中散点分布在一个长方形区域,即其不具有相关关系.
故选:C
4.营养学家对某地区居民的身高与营养摄入量的几组数据进行研究后发现两个变量存在相关关系,该营养学家按照不同的曲线拟合与之间的回归方程,并算出相关指数如下表所示:
拟合曲线 直线 指数曲线 抛物线 三次曲线
与的回归方程
相关指数 0.893 0.986 0.931 0.312
则这组数据模型的回归方程的最好选择应是( )A. B.
C. D.
【答案】B
【分析】根据相关指数的性质,相关指数的值越大,模型的拟合效果越好,即可得出答案.
【解析】相关指数的值越大,说明模型的拟合效果越好,观察可知,指数曲线的最大,故回归方程的最好选择应是,
故选:B.
5.若由一个列联表中的数据计算得,则( )
0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.能有的把握认为这两个变量有关系
B.能有的把握认为这两个变量没有关系
C.能有的把握认为这两个变量有关系
D.能有的把握认为这两个变量没有关系
【答案】A
【分析】通过所给的观测值,同临界值表中的数据进行比较,得到结论.
【解析】因为,所以能有的把握认为这两个变量有关系.
故选:A
6.党的二十大报告提出全面推进乡村振兴.为振兴乡村经济,某市一知名电商平台决定为乡村的特色产品开设直播带货专场.该特色产品的热卖黄金时段为2023年2月1至4月1日,为了解直播的效果和关注度,该电商平台统计了已直播的2023年2月1日至2月5日时段的相关数据,这5天的第天到该电商平台专营店购物人数(单位:万人)的数据如下表:
日期 2月1日 2月2日 2月3日 2月4日 2月5日
第x天 1 2 3 4 5
人数y(单位:万人) 75 84 93 98 100
依据表中的统计数据,该电商平台直播黄金时间的天数与到该电商平台专营店购物的人数(单位:万人)具有较强的线性相关关系,经计算得,到该电商平台专营店购物人数与直播天数的线性回归方程为.请预测从2023年2月1日起的第38天到该专营店购物的人数(单位:万人)为( )A.312 B.313 C.314 D.315
【答案】C
【分析】根据回归直线过样本中心,建立方程,可得参数,即可得答案.
【解析】由题意,,,
将代入,可得,解得,
线性回归直线方程为,将代入上式,.
故选:C.
7.已知变量y与x之间具有线性相关关系,根据变量x与y的相关数据,计算得则y关于x的线性回归方程为( )
附:回归方程中的斜率和截距的最小二乘法估计公式分别为
A. B.
C. D.
【答案】B
【分析】根据已知数据求,代入回归直线方程即可求解.
【解析】由题中的数据可知,
所以.
所以.
所以y关于x的线性回归方程为.
故选:B.
8.为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40名学生进行调查,按照性别和体育锻炼情况整理出如下的列联表:
性别 锻炼情况 合计
不经常 经常
女生/人 14 7 21
男生/人 8 11 19
合计/人 22 18 40
注:独立性检验中,.
常用的小概率值和相应的临界值如下表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
根据这些数据,给出下列四个结论:
①依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响;
②依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响;
③根据小概率值的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05;
④根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响.
其中,正确结论的序号是( )A.①③ B.①④ C.②③ D.②④
【答案】B
【分析】分别求出男生和女生经常锻炼的频率即可依据频率稳定于概率的原理判断,求出卡方值,和3.841比较即可根据小概率值的独立性检验判断.
【解析】由表可知,女生有21人,其中经常锻炼的有7人,频率为,
男生有19人,其中经常锻炼的有11人,频率为,
因为,依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响,故①正确,②错误;
,所以根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响,故④正确,③错误.
故选:B.
二、多选题
9.下列说法正确的是( )
A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系
B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好
C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好
D.在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位
【答案】ABD
【分析】A选项,可以利用散点图直观判断两个变量是否具有线性相关关系;B选项,可以从残差图中发现可疑数据,用残差平方和判断模型拟合效果;C选项,拟合效果的好坏不能用样本相关系数来进行判断;D选项,根据经验回归方程,得到当解释变量每增加1个单位时,相应变量增加0.1个单位.
【解析】对于A,可以借助散点图直观判断两个变量是否具有线性相关关系,所以A正确;
对于B,残差图可以发现原始数据中的可疑数据;可用残差平方和判断模型的拟合效果,
残差平方和越小,模型的拟合效果越好,所以B选项正确;
对于C,样本相关系数的绝对值越大,只能说明两个变量的线性相关性越强,
不能作为分析模型的拟合效果好坏的依据,应该是越大,模型的拟合效果越好,所以C错误;
对于D,在经验回归方程中,当解释变量每增加1个单位时,
相应变量增加0.1个单位,所以D正确.
故选:ABD.
10.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系 B.去除后的回归方程为
C.去除后y的估计值增加速度变快 D.去除后相应于样本点的残差为0.05
【答案】AB
【解析】A. 根据回归直线方程的x系数的正负判断.B. 根据去除前后样本点不变判断.C. 根据去除前后x的系数大小判断.D.根据残差的计算公式判断.
【解析】因为回归直线方程为,,
所以变量x与y具有正相关关系.故A正确.
当时,,
样本点为,去掉两个数据点和后,样本点还是,
又因为去除后重新求得的回归直线l的斜率为1.2,
所以,
解得,
所以去除后的回归方程为,故B正确.
因为,所以去除后y的估计值增加速度变慢,故C错误.
因为,
所以,故D错误.
故选:AB
【点睛】本题主要考查回归分析的理解,还考查了理解辨析的能力,属于基础题.
11.晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学生晚上10点10分必须休息,另一所同类高中的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中衡水某高中有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )
附:,
0.050 0.010 0.005 0.001
3.841 6.635 7.879 10.828
A.衡水某高中的前50名学生中有60%的学生学习效率高
B.另一所同类高中的前50名学生中有40%的学生学习效率高
C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”
D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05
【答案】AC
【分析】先根据题意求出每一所学校中前50名学生中学习效率高的人数,再列出列联表,通过计算就可以对选项作出判断.
【解析】设这100名学生中学习效率高的人数有人,由题意有,得.
所以某高中的50名学生中有30人学习效率高,另一所同类高中的50名学生中有10人学习效率高,所以某高中的前50名学生中有的学生学习效率高,故选项A正确,另一所同类高中的前50名学生中有学习效率高,故选项B不正确.
根据以上数据得到所下的列联表:
学校晚上休息时间 学习效率高人数 学习效率不高人数 总计
某高中 30 20 50
另一所同类高中 10 40 50
总计 40 60 100

所以选项C正确,选项D不正确.
故选:AC.
12.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其回归直线方程为,以下结论正确的是( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者的身高和臂展具有正相关关系
C.可估计身高为190厘米的人臂展大约为189.65厘米
D.身高相差10厘米的两人臂展都相差11.6厘米
【答案】ABC
【分析】根据折线图数据判断,由回归直线方程、散点图判断BCD.
【解析】对于,身高极差大约为21,臂展极差大约为26,故结论正确;
对于B,很明显根据散点图以及回归直线得到,身高矮一些,臂展就会短一些,身高高一些,臂展就长些,故结论正确;
对于C,身高为190厘米,代入回归直线方程可得到臂展估计值等于189.65厘米,但不是准确值,故结论正确;
对于D,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归直线上的点并不都是准确的样本点,故结论不正确.
故选:ABC.
三、填空题
13.下表是关于男婴与女婴出生时间调查的列联表:
晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180
那么,A=_____,B=_____,C=_____,D=_____,E=_____.
【答案】 47 92 88 82 53
【分析】由题意,根据独立性检验的的列联表,列出关于的方程组,即可求解.
【解析】由题意,根据独立性检验的的列联表,
可得,解得.
【点睛】本题主要考查了独立性检验的应用,其中解答中熟记独立性检验中的列联表,列出相应的方程组是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.
14.如图是一组数据的散点图,经最小二乘估计公式计算,与之间的线性回归方程为,则______.
【答案】1
【分析】根据线性回归方程过样本点中心求解出的值即可.
【解析】因为,,
所以,所以,
故答案为:.
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:表中数据得回归直线方程中的=-2,预测当气温为-4℃时,用电量为________.
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
【答案】68度
【分析】先求样本数据的中心点,代入回归直线方程可得,然后代入可求.
【解析】回归直线过(,),
根据题意得,,
将(10,40)代入,解得=60,,
当x=-4时,,即当气温为-4℃时用电量约为68度.
【点睛】本题主要考查 回归直线方程的求解,根据回归直线一定经过样本数据的中心点可求参数,然后根据方程可求预测值,侧重考查数据分析和数学运算的核心素养.
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身得到的数据如下表:
单位:人
读书 健身 合计
女 24 31 55
男 8 26 34
合计 32 57 89
在犯错误的概率不超过___________的前提下认为性别与休闲方式有关系.
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】0.1##
【分析】计算卡方,进行独立性检验.
【解析】由题中列联表中的数据,得,
因为,所以在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关系.
故答案为:
四、解答题
17.以下是在某地搜集到的房屋的销售价格y和房屋的面积x的一组数据:
房屋面积x/ 115 110 80 135 105
销售价格y/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图;
(2)求经验回归方程;
(3)根据(2)的结果估算当房屋面积为150时的销售价格.
参考数据:,.
【答案】(1)图见解析
(2)
(3)(万元)
【分析】(1)根据题目所给数据画出散点图.
(2)根据回归直线方程计算公式,计算出回归直线方程.
(3)利用回归直线方程进行预测.
(1)
数据对应的散点图如图所示:
(2)


所求经验回归方程为.
(3)
所求销售价格的估计值为(万元).
18.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:
商店名称 A B C D E
销售额x/千万元 3 5 6 7 9
利润额y/百万元 2 3 3 4 5
(1)画出散点图,观察散点图,说明两个变量是否线性相关;
(2)用最小二乘法计算利润额y对销售额x的线性回归方程;
(3)当销售额为4千万元时,估计利润额的大小.
(参考公式:,)
【答案】(1)图见解析,变量线性相关;(2);(3)2.4百万元
【解析】(1)根据题中数据在直角坐标系中作出这五个点,即可得到散点图,并由图观察这些点是否在一条直线附近,即可判断;
(2)根据公式分别求出,即可求出;
(3)由(2)中求出的回归方程,将代入,即可估计利润额的大小.
【解析】解:(1)散点图如图所示.
由散点图可以看出变量线性相关.
(2)设线性回归方程是.
因为,所以,

即利润额y对销售额x的线性回归方程为.
(3)当销售额为4千万元时,利润额约为(百万元).
【点睛】本题主要考查利用散点图判断两个变量是否存在相关关系,利用最小二乘法求线性回归方程,以及利用回归方程进行预测,属于基础题.
19.某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.
(1)根据已知条件与等高条形图完成下面的列联表:
单位:名
男同学 女同学 总计
需要帮助
不需要帮助
总计
(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.
附:,其中.
0.050 0.010 0.001
3.841 6.635 10.828
【答案】(1)答案见解析;
(2)认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
【分析】(1)根据等高条形图分别求出男、女同学需要帮助和不需要帮助的分数,可得出列联表.
(2)先由公式求出的值,再对照表格中给出的值可得答案.
【解析】(1)由题意知有20名男同学,则有30名女同学.
由题中等高条形图可知男同学需要帮助的有4人,不需要帮助的有16人.
女同学需要帮助的有3人,不需要帮助的有27人.
则列联表为
单位:名
男同学 女同学 总计
需要帮助 4 3 7
不需要帮助 16 27 43
总计 20 30 50
(2)假设:该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
经计算得,
依据的独立性检验,没有充分证据推断不成立,因此证明成立,
即认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
20.从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔 使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率和电动自行车驾乘人员交通事故死亡率,并整理得到下面的散点图.
(1)求这20个城市的电动自行车头盔佩戴率大于50%的概率;
(2)通过散点图分析与的相关关系,说明佩戴安全头盔的必要性;
(3)有四名同学通过计算得到与的相关系数分别为0.97,0.62,,,请你从中选出最有可能正确的结果,并以此求出关于的线性回归方程.
参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.
【答案】(1);(2)答案见解析;(3)最有可能正确的结果为,回归方程为.
【分析】(1)由散点图数出佩戴率大于50%的城市有10个,计算结果;(2)由较强的负相关关系分析;(3)最有可能正确的结果为.由给定公式可得,代入数据计算求出,,,代入可求出,从而求出回归方程.
【解析】解:(1)电动自行车头盔佩戴率大于50%的城市有10个,故所求的概率为.
(2)由散点图可知与有较强的负相关关系,提高电动自行车头盔佩戴率能有效降低驾乘人员交通事故死亡率,所以佩戴安全头盔十分有必要.
(3)最有可能正确的结果为.
根据参考数据得,,
所以,

所以关于的线性回归方程为.
【点睛】知识点点睛:(1)一般情况下,相关系数时,两个变量不具备相关关系,当时,两个变量具备较强的相关关系;(2)线性回归方程必过点.
21.年月国务院印发《全民健身计划》,《计划》中提出了各方面的主要任务,包括加大全民健身场地设施供给、广泛开展全民健身赛事活动、提升科学健身指导服务水平、激发体育社会组织活动、促进重点人群健身活动开展和营造全民健身社会氛围等.在各种健身的方式中,瑜伽逐渐成为一种新型的热门健身运动.某瑜伽馆在月份随机采访了名市民,对于是否愿意把瑜伽作为主要的健身方式作了调查.
愿意 不愿意 合计
男性
女性
合计
(1)能否在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关?
附:
(2)为了推广全民健身,某市文化馆计划联合该瑜伽馆举办“瑜你一起”的公益活动,在全市范围内开设一期公益瑜伽课,先从上述参与调查的人中选择“愿意”的人按分层抽样抽出人,再从人中随机抽取人免费参加.市文化馆拨给瑜伽馆一定的经费补贴,补贴方案为:男性每人元,女性每人元.求补贴金额的分布列及数学期望(四舍五入精确到元)
【答案】(1)能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关
(2)的分布列为
期望为1385(元)
【分析】(1)根据公式计算出,和比较大小,得到结论;(2)通过分层抽样算出抽出的男性和女性人数,写出的可能取值,计算出相应的概率,写出分布列,计算出期望.
(1)
由已知得.
所以能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关.
(2)
调查的人中选择“愿意”的人按分层抽样抽出人,
其中男性人数为,女性人数为.
记补贴金额为,则可能为,,.
,,,
则的分布列为
数学期望(元).
22.随着全球经济一体化进程的不断加快,机械零件的加工质量决定了制造工厂的生存,零件加工精度逐渐成为供应商判断制造公司产品的标准.已知某公司生产不同规格的一种产品,根据检测精度的标准,其合格产品的质量y()与尺寸x()之间近似满足关系式(b,c为大于0的常数).现随机从中抽取6件合格产品,测得数据如下:
尺寸x(〕 38 48 58 68 78 88
质量y(〕 16.8 18.8 20.7 22.4 24 25.5
根据测得数据作出如下处理:令,得相关统计量的值如下表:
75.3 24.6 18.3 101.4
(1)根据所给统计数据,求y关于x的回归方程;
(2)若从一批该产品中抽取n件进行检测,已知检测结果的误差满足,求至少需要抽取多少件该产品,才能使误差在(-0.1,0.1)的概率不少于0.9545?
附:①对于样本,i)(i=1,2,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为:,,.②,则
【答案】(1)
(2)800
【分析】(1)按照公式求出与,写出回归方程;(2)根据正态分布及所给数据得出不等关系,解出答案.
(1)
,,所以,即,整理为:,所以y关于x的回归方程为
(2)
因为,,所以,要想使误差在(-0.1,0.1)的概率不少于0.9545,则满足,解得:,即至少需要抽取800件该产品,才能使误差在(-0.1,0.1)的概率不少于0.9545.第9章 统计 单元综合检测
一、单选题
1.下列有关回归分析的说法中不正确的是( )
A.回归直线必过点
B.回归直线就是散点图中经过样本数据点最多的那条直线
C.当相关系数时,两个变量正相关
D.如果两个变量的线性相关性越弱,则就越接近于
2.某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是( )
A.相关系数r变小 B.决定系数变小
C.残差平方和变大 D.解释变量x与预报变量y的相关性变强
3.下列图形中具有相关关系的是( )
A. B.
C. D.
4.营养学家对某地区居民的身高与营养摄入量的几组数据进行研究后发现两个变量存在相关关系,该营养学家按照不同的曲线拟合与之间的回归方程,并算出相关指数如下表所示:
拟合曲线 直线 指数曲线 抛物线 三次曲线
与的回归方程
相关指数 0.893 0.986 0.931 0.312
则这组数据模型的回归方程的最好选择应是( )A. B.
C. D.
5.若由一个列联表中的数据计算得,则( )
0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.能有的把握认为这两个变量有关系
B.能有的把握认为这两个变量没有关系
C.能有的把握认为这两个变量有关系
D.能有的把握认为这两个变量没有关系
6.党的二十大报告提出全面推进乡村振兴.为振兴乡村经济,某市一知名电商平台决定为乡村的特色产品开设直播带货专场.该特色产品的热卖黄金时段为2023年2月1至4月1日,为了解直播的效果和关注度,该电商平台统计了已直播的2023年2月1日至2月5日时段的相关数据,这5天的第天到该电商平台专营店购物人数(单位:万人)的数据如下表:
日期 2月1日 2月2日 2月3日 2月4日 2月5日
第x天 1 2 3 4 5
人数y(单位:万人) 75 84 93 98 100
依据表中的统计数据,该电商平台直播黄金时间的天数与到该电商平台专营店购物的人数(单位:万人)具有较强的线性相关关系,经计算得,到该电商平台专营店购物人数与直播天数的线性回归方程为.请预测从2023年2月1日起的第38天到该专营店购物的人数(单位:万人)为( )A.312 B.313 C.314 D.315
7.已知变量y与x之间具有线性相关关系,根据变量x与y的相关数据,计算得则y关于x的线性回归方程为( )
附:回归方程中的斜率和截距的最小二乘法估计公式分别为
A. B.
C. D.
8.为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40名学生进行调查,按照性别和体育锻炼情况整理出如下的列联表:
性别 锻炼情况 合计
不经常 经常
女生/人 14 7 21
男生/人 8 11 19
合计/人 22 18 40
注:独立性检验中,.
常用的小概率值和相应的临界值如下表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
根据这些数据,给出下列四个结论:
①依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响;
②依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响;
③根据小概率值的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05;
④根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响.
其中,正确结论的序号是( )A.①③ B.①④ C.②③ D.②④
二、多选题
9.下列说法正确的是( )
A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系
B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好
C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好
D.在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位
10.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系 B.去除后的回归方程为
C.去除后y的估计值增加速度变快 D.去除后相应于样本点的残差为0.05
11.晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学生晚上10点10分必须休息,另一所同类高中的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中衡水某高中有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )
附:,
0.050 0.010 0.005 0.001
3.841 6.635 7.879 10.828
A.衡水某高中的前50名学生中有60%的学生学习效率高
B.另一所同类高中的前50名学生中有40%的学生学习效率高
C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”
D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05
12.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其回归直线方程为,以下结论正确的是( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者的身高和臂展具有正相关关系
C.可估计身高为190厘米的人臂展大约为189.65厘米
D.身高相差10厘米的两人臂展都相差11.6厘米
三、填空题
13.下表是关于男婴与女婴出生时间调查的列联表:
晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180
那么,A=_____,B=_____,C=_____,D=_____,E=_____.
14.如图是一组数据的散点图,经最小二乘估计公式计算,与之间的线性回归方程为,则______.
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:表中数据得回归直线方程中的=-2,预测当气温为-4℃时,用电量为________.
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身得到的数据如下表:
单位:人
读书 健身 合计
女 24 31 55
男 8 26 34
合计 32 57 89
在犯错误的概率不超过___________的前提下认为性别与休闲方式有关系.
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
四、解答题
17.以下是在某地搜集到的房屋的销售价格y和房屋的面积x的一组数据:
房屋面积x/ 115 110 80 135 105
销售价格y/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图;
(2)求经验回归方程;
(3)根据(2)的结果估算当房屋面积为150时的销售价格.
参考数据:,.
18.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:
商店名称 A B C D E
销售额x/千万元 3 5 6 7 9
利润额y/百万元 2 3 3 4 5
(1)画出散点图,观察散点图,说明两个变量是否线性相关;
(2)用最小二乘法计算利润额y对销售额x的线性回归方程;
(3)当销售额为4千万元时,估计利润额的大小.
(参考公式:,)
19.某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.
(1)根据已知条件与等高条形图完成下面的列联表:
单位:名
男同学 女同学 总计
需要帮助
不需要帮助
总计
(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.
附:,其中.
0.050 0.010 0.001
3.841 6.635 10.828
20.从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔 使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率和电动自行车驾乘人员交通事故死亡率,并整理得到下面的散点图.
(1)求这20个城市的电动自行车头盔佩戴率大于50%的概率;
(2)通过散点图分析与的相关关系,说明佩戴安全头盔的必要性;
(3)有四名同学通过计算得到与的相关系数分别为0.97,0.62,,,请你从中选出最有可能正确的结果,并以此求出关于的线性回归方程.
参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.
21.年月国务院印发《全民健身计划》,《计划》中提出了各方面的主要任务,包括加大全民健身场地设施供给、广泛开展全民健身赛事活动、提升科学健身指导服务水平、激发体育社会组织活动、促进重点人群健身活动开展和营造全民健身社会氛围等.在各种健身的方式中,瑜伽逐渐成为一种新型的热门健身运动.某瑜伽馆在月份随机采访了名市民,对于是否愿意把瑜伽作为主要的健身方式作了调查.
愿意 不愿意 合计
男性
女性
合计
(1)能否在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关?
附:
(2)为了推广全民健身,某市文化馆计划联合该瑜伽馆举办“瑜你一起”的公益活动,在全市范围内开设一期公益瑜伽课,先从上述参与调查的人中选择“愿意”的人按分层抽样抽出人,再从人中随机抽取人免费参加.市文化馆拨给瑜伽馆一定的经费补贴,补贴方案为:男性每人元,女性每人元.求补贴金额的分布列及数学期望(四舍五入精确到元)
22.随着全球经济一体化进程的不断加快,机械零件的加工质量决定了制造工厂的生存,零件加工精度逐渐成为供应商判断制造公司产品的标准.已知某公司生产不同规格的一种产品,根据检测精度的标准,其合格产品的质量y()与尺寸x()之间近似满足关系式(b,c为大于0的常数).现随机从中抽取6件合格产品,测得数据如下:
尺寸x(〕 38 48 58 68 78 88
质量y(〕 16.8 18.8 20.7 22.4 24 25.5
根据测得数据作出如下处理:令,得相关统计量的值如下表:
75.3 24.6 18.3 101.4
(1)根据所给统计数据,求y关于x的回归方程;
(2)若从一批该产品中抽取n件进行检测,已知检测结果的误差满足,求至少需要抽取多少件该产品,才能使误差在(-0.1,0.1)的概率不少于0.9545?
附:①对于样本,i)(i=1,2,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为:,,.②,则