2019-2020学年选修1-2第一章训练卷
统计案例(一)
注意事项:
1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置。
2.选择题的作答:每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。
3.非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。写在试题卷、草稿纸和答题卡上的非答题区域均无效。
4.考试结束后,请将本试题卷和答题卡一并上交。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.已知下面的列联表:
则等于( )
A. B. C. D.
2.每一吨铸铁成本(元)与铸件废品率建立的回归方程,下列说法正确的是( )
A.废品率每增加,成本每吨增加元
B.废品率每增加,成本每吨增加
C.废品率每增加,成本每吨增加元
D.废品率每增加,成本每吨增加元
3.已知与之间的一组数据:
则与的线性回归方程为必过点( )
A. B. C. D.
4.已知方程是根据女大学生的身高预报体重的回归方程,其中,的单位分别是,,则该方程在样本处的残差是( )
A. B. C. D.
5.统计中有一个非常有用的统计量,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班老师教,乙班老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的列联表.
根据的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为( )
A. B.
C. D.无充分依据
附:,.
临界值表:
6.为了考察两个变量和之间的线性相关性,甲、乙两个同学各自独立做了次和次试验,并且利用线性回归方法,求得回归直线为和,已知在两人的试验中发现对变量的观测数据的平均值恰好相等,都为,对变量的观测数据的
平均值也恰好相等,都为,那么下列说法正确的是( )
A.直线和直线有交点
B.直线和直线相交,但交点未必是点
C.直线和直线由于斜率相等,所以必定平行
D.直线和直线必定重合
7.某考察团对全国大城市进行职工人均工资水平(千元)与居民人均消费水平(千元)统计调查,与具有相关关系,回归方程为,若某城市居民人均消费水平为千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A. B. C. D.
8.已知具有线性相关的两个变量,之间的一组数据如下表所示:
且回归方程是,则( )
A. B. C. D.
9.有甲、乙两个班级进行数学考试,按照大于等于分为优秀,分以下为非优秀统计成绩,得到如下所示的列联表:
已知在全部人中随机抽取人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中的值为,的值为
B.列联表中的值为,的值为
C.根据列联表中的数据,若按的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按的可靠性要求,不能认为“成绩与班级有关系”
附:,.
临界值表:
10.法国欧洲杯比赛于月中旬揭开战幕,随机询问人是否喜欢足球,得到如下的列联表:
临界值表:
参照临界值表,下列结论正确的是( )
A.有的把握认为“喜欢足球与性别有关系”
B.有的把握认为“喜欢足球与性别没有关系”
C.在犯错误的概率不超过的前提下,认为“喜欢足球与性别没有关系”
D.在犯错误的概率不超过的前提下,认为“喜欢足球与性别有关系”
11.假设有两个分类变量和,它们的可能取值分别为和,
其列联表如下:
对于以下数据,对同一样本能说明与有关的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
12.两个分类变量和,值域分别为和,其样本频数分别
和,且有,,.若与有关系的可信程度不小于,则等于( )
A. B. C. D.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.关于统计量的判断中,有以下几种说法:
①在任何问题中都可以用来检验两个变量有关系还是没有关系;
②的值越大,两个分类变量的相关性就越大;
③是用来判断两个分类变量是否有关系的随机变量,当的值很小时,可以判定两个分类变量不相关.
其中说法正确的是________.
14.下表是某数学老师及他的爷爷、父亲和儿子的身高数据:
因为儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高约为________.
参考公式:回归直线的方程是,
其中;,其中是与对应的回归估计值.
参考数据:,.
15.独立性检验显示:在犯错误的概率不超过的前提下认为性别与是否喜爱喝酒有关系.则下列说法正确的是________.
①在名男性中约有人爱喝酒;
②若某人爱喝酒,那么此人为男性的可能性为;
③认为性别与是否喜爱喝酒有关判断出错的可能性为;
④有的把握认为名男性中有人爱喝酒.
16.已知,之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为与,利用最小二乘法判断拟合程度更好的直线是________.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.(10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)
试说明在这三种心理障碍中哪一种与性别关系最大?
因为的值最大,所以说谎与性别关系最大.
18.(12分)某研究机构对高三学生的记忆力和判断力进行统计分析,得下表数据:
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,求出关于的线性回归方程.
参考公式:,.
19.(12分)某中学采取分层抽样的方法从应届高三学生中按照性别抽取名学生,其中名女生中有名报考理科,男生中有名报考文科.
(1)根据以上信息,写出列联表;
(2)用假设检验的方法分析有多大的把握认为该中学的高三学生选报文理科与性别有关?参考公式.
20.(12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):
(1)求,;
(2)能否在犯错误的概率不超过的情况下认为教学方式与成绩有关系?
21.(12分)二手车经销商小王对其所经营的某一型号二手汽车的使用年数与销售价格(单位:万元/辆)进行整理,得到如表的对应数据:
(1)试求关于的回归直线方程;
(2)已知每辆该型号汽车的收购价格为(单位:万元),根据(1)中所求的回归方程,预测当为何值时,小王销售一辆该型号汽车所获得的利润最大?
22.(12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了位老年人,结果如下:
附:的观测值.
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)在犯错误的概率不超过的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.
2019-2020学年选修1-2第一章训练卷
统计案例(一)答 案
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.【答案】C
根据表中的数据,可得,
所以.
2.【答案】C
根据回归方程知是关于的单调增函数,并且由系数知每增加一个单位,平均增加个单位.
3.【答案】B
由数据可知,,
∴线性回归方程为必过点.
4.【答案】B
该方程在样本处的残差为.
5.【答案】A
,
∴不及格人数的多少与不同老师执教有关系的把握大约为.
6.【答案】A
与都过样本中心.
7.【答案】A
将代入回归方程,可计算得,
所以该城市人均消费额占人均工资收入的百分比约为.,即约为.
8.【答案】C
因为,,
代入回归方程,得.
9.【答案】C
由题意知,成绩优秀的学生数是,成绩非优秀的学生数是,
所以,,选项A、B错误.
根据列联表中的数据,得到,
因此有的把握认为“成绩与班级有关系”.
10.【答案】A
由题意,
所以有的把握认为“喜欢足球与性别有关系”.
11.【答案】B
对于同一样本,越小,说明与之间的关系越弱;
越大,说明与之间的关系越强,
检验之后可知选B.
12.【答案】A
列列联表如下:
故的观测值,
把选项A,B,C,D代入验证可知选A.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.【答案】②
只适用于列联表问题,故①错误;
的值越大,两个事件的相关性就越大,故②正确;
当的值很小时,只能说明两个变量的相关程度低,不能判定两个分类变量不相关,故③错误.
14.【答案】
由题可得,,,
求得,,代入线性回归方程得,,,
所以,当时,.
即他孙子的身高约为厘米.
15.【答案】③
独立性检验是对两个分类变量有关系的可信程度的判断.
16.【答案】
用作为拟合直线时,所得的实际值与的估计值的差的平方和为;
用作为拟合直线时,所得的实际值与的估计值的差的平方和为:,
因为,故用直线,拟合程度更好.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.【答案】说谎与性别关系最大.
对于焦虑、说谎、懒惰这三种心理障碍分别构造三个随机变量,,,
由表中数据可得,
,
,
因为的值最大,所以说谎与性别关系最大.
18.【答案】(1)见解析;(2).
(1)散点图如下:
(2)由于,,
,,
,,
故线性回归方程为.
19.【答案】(1)见解析;(2)见解析.
(1)
(2)假设:报考文理科与性别无关.
则的估计值,
因为,
所以我们有把握认为该中学的高三学生选报文理科与性别有关.
20.【答案】(1),;(2)见解析.
(1),.
(2)由表中的数据,得的观测值为.
因为,
所以能在犯错误的概率不超过的前提下认为教学方式与成绩有关系.
21.【答案】(1);(2)预测时,小王销售一辆该型号汽车所获得的利润最大.
(1)由表中数据得,,
由最小二乘法求得,
,
所以关于的回归直线方程为.
(2)根据题意,利润函数为
,
所以当时,二次函数取得最大值,
即预测时,小王销售一辆该型号汽车所获得的利润最大.
22.【答案】(1);(2)见解析;(3)见解析.
(1)调查的位老人中有位需要志愿者提供帮助,
因此该地区老年人中,需要帮助的老年人的比例的估算值为.
(2)随机变量的观测值.
由于,
因此,在犯错误的概率不超过的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.
(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,
因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.
2019-2020学年选修1-2第一章训练卷
统计案例(二)
注意事项:
1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置。
2.选择题的作答:每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。
3.非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。写在试题卷、草稿纸和答题卡上的非答题区域均无效。
4.考试结束后,请将本试题卷和答题卡一并上交。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
由散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归直线方程是,则等于( )
A. B. C. D.
2.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( )
A.三维柱形图 B.二维条形图
C.等高条形图 D.独立性检验
3.对两个变量和进行回归分析,得到一组样本数据:,,…,,则下列说法中不正确的是( )
A.由样本数据得到的回归方程为必过样本点的中心
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数来刻画回归效果,的值越小,说明模型的拟合效果越好
D.若变量和之间的相关系数,则变量和之间具有线性相关关系
4.根据如下样本数据:
得到的回归方程为,则( )
A. B.
C. D.
5.以下四个命题,其中正确的个数有( )
①由独立性检验可知,有的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有的可能物理优秀;
②两个随机变量相关性越强,则相关系数的绝对值越接近于;
③在线性回归方程中,当解释变量每增加一个单位时,预报变量平均增加个单位;
④对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.
A. B. C. D.
6.某医疗研究所为了检验某种血清预防感冒的作用,把名使用血清的人与另外名未使用血淸的人一年中的感冒记录作比较,提出假设“这种血淸不能起到预防感冒的作用”,利用列联表计算的,经査临界值表知,则下列表述中正确的是( )
A.有的把握认为“这种血清能起到预防感冒的作用”
B.若有人未使用该血淸,那么他在一年中有的可能性得感冒
C.这种血淸预防感冒的有效率为
D.这种血清预防感冒的有效率为
7.已知与之间数据如下表所示,则与之间的线性回归方程过点( )
A. B.
C. D.
8.已知变量,由它们的样本数据计算得到的观测值,的部分临界值表如下:
以下判断正确的是( )
A.在犯错误的概率不超过的前提下认为变量有关系
B.在犯错误的概率不超过的前提下认为变量没有关系
C.有的把握说变量有关系
D.有的把握说变量没有关系
9.人的年龄与人体脂肪含量的百分数的回归方程为,
如果某人岁,那么这个人的脂肪含量( )
A.一定 B.在附近的可能性比较大
C.无任何参考数据 D.以上解释都无道理
10.变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则( )
A. B. C. D.
11.为了研究子女吸烟与父母吸烟的关系,调查了青少年及其家长,得数据如下:
附:,
则下列结论较准确的一个是( )
A.子女吸烟与父母吸烟无关
B.有的把握说子女吸烟与父母吸烟有关
C.有的把握说子女吸烟与父母吸烟有关
D.有的把握说子女吸烟与父母吸烟有关
12.下面是某市场农产品的调查表.
市场供应量表:
市场需求量表:
根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间( )
A. B. C. D.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.当且仅当满足________时,数据点在一条直线上.
14.已知一个回归直线方程为,,则________.
15.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
根据表中数据,问是否有的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)
附:
16.在一组样本数据,,,的散点图中,若所有样本点都在曲线附近波动,经计算,,,则实数的值为__________.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.(10分)已知学生的数学成绩与物理成绩具有线性相关关系,某班6名学生的数学和物理成绩如表:
(1)求物理成绩y对数学成绩x的线性回归方程;
(2)当某位学生的数学成绩为70分时,预测他的物理成绩.
参考公式:用最小二乘法求线性回归方程的系数公式:,参考数据:.
18.(12分)在党的十九大报告中,习近平总书记提出“绿水青山就是金山银山”,为响应习总书记的号召,某旅游局计划对各景区的环境进行综合治理,并且对各旅游景区收益的增加值作了初步的估计,根据旅游局投入不同数额的治理经费,得到以下数据:
(1)结果显示与之间存在线性相关关系,求出关于的线性回归方程;
(2)在优化环境的同时.旅游局还计划使全旅游景区收益的总额至少增加万元,试估计旅游局应该对全市旅游景区至少投入多少千万元的治理经费?(答案精确到).
附:回归方程中的斜率和截距的最小二乘估计公式分别为:
,.
19.(12分)某省的一个气象站观测点在连续天里记录的指数与当天的空气水平可见度(单位)的情况如表:
表:
该省某市年月指数频数分布如表:
表:
(1)若通过数据发现,在这连续天里,当天的空气水平可见度(单位)与指数之间具有较强的线性相关关系,设,求出关于的线性回归方程;
(2)小李在该市开了一家洗车店,经统计,洗车店平均每月的收入与指数有相关关系,如表:
表:
根据表估计小李的洗车店月份平均每天的收入.
(附参考公式:,其中,)
20.(12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取名工人,将他们随机分成两组,每组人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
(3)根据(2)中的列联表,能否有的把握认为两种生产方式的效率有差异?
附:,
21.(12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了个网箱,测量各箱水产品的产量(单位:).其频率分布直方图如下:
(1)填写下面列联表,并根据列联表判断是否有的把握认为箱产量与养殖方法有关:
(2)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到).
附:,
.
22.(12分)某高三理科班共有名同学参加某次考试,从中随机挑选出名同学,他们的数学成绩与物理成绩如下表:
数据表明与之间有较强的线性关系.
(1)求关于的线性回归方程;
(2)该班一名同学的数学成绩为分,利用(1)中的回归方程,估计该同学的物理成绩;
(3)本次考试中,规定数学成绩达到分为优秀,物理成绩达到分为优秀.若该班数学优秀率与物理优秀率分别为和,且除去抽走的名同学外,剩下的同学中数学优秀但物理不优秀的同学共有人,在答卷页上填写下面列联表,判断能否在犯错误的概率不超过的前提下认为数学优秀与物理优秀有关?
参考数据:回归直线的系数,.
附:,
.
2019-2020学年选修1-2第一章训练卷
统计案例(二)答 案
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.【答案】D
,,
∵回归直线方程过定点,∴,∴.
2.【答案】D
前三种方法只能直观地看出两个分类变量与是否相关,但看不出相关的程度.
独立性检验通过计算得出相关的可能性,较为准确.
3.【答案】C
的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,
故选C.
4.【答案】B
根据题中表内数据画出散点图(图略),由散点图可知,,
故选B.
5.【答案】B
对于命题①认为数学成绩与物理成绩有关,不出错的概率是,不是数学成绩优秀,物理成绩就有的可能优秀,不正确;
对于④,随机变量的观测值越小,说明两个相关变量有关系的把握程度越小,不正确;容易验证②③正确,应选答案B.
6.【答案】A
有的把握认为“这种血清能起到预防感冒的作用”,
由题意有,这样得出有的把握认为“这种血清能起到预防感冒的作用”,故选A.
7.【答案】D
线性回归方程必过样本中心点,
由已知数据得,
,
故与之间的线性回归方程过点.
8.【答案】A
在犯错误的概率不超过的前提下认为变量有关系,
因为观测值,而在观测值表中对应于的是,
所以在犯错误的概率不超过的前提下认为变量有关系,故选A.
9.【答案】B
将代入计算知,根据回归分析的意义知选B.
10.【答案】C
,,
∴,,,
∴第一组数据的相关系数大于零,第二组数据的相关系数小于零.
11.【答案】D
,
∴有的把握说子女吸烟与父母吸烟有关.
12.【答案】C
分析表中数据可得,
当供给量与需求量均为50时,供给单价和需求单价相差为2,
当供给量与需求量均为60时,供给单价和需求单价相差为1,
当供给量与需求量均为70时,供给单价和需求单价相差为0.2,
当供给量与需求量均为75时,供给单价和需求单价相差为0.9,
当供给量与需求量均为80时,供给单价和需求单价相差为1.6,
可知当供给量与需求量均为70时,供给单价和需求单价相差最小.
所以价格在时最有可能达到供需平衡.故选C.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.【答案】
当数据点在一条直线上时,只受的影响,
即数据点完全线性相关,此时.
14.【答案】
因为,且,
所以.
15.【答案】有
根据表中数据,计算观测值,
对照临界值知,有的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
16.【答案】
令,则曲线的回归方程变为线性的回归方程即,
此时,,
代入,得,解得.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.【答案】(1);(2)68分.
(1)由题意,.
,,
∴.
(2)由(1)知,当时,,
∴当某位学生的数学成绩为70分时,估计他的物理成绩为68分.
18.【答案】(1);(2)至少投入千万元的治理经费.
(1)由题可得,,,
,
.
根据公式可求得,,
所以回归方程为.
(2)当时,,
∴旅游局应该对全市旅游景区至少投入千万元的治理经费.
19.【答案】(1);(2)元.
(1),,
,
,
∴,则,
∴关于的线性回归方程为.
(2)根据表和表可知,月天中有天每天亏损约元,有天每天亏损约元,有天每天收入约元,有天每天收入约元,有天每天收入约元,
则估计小李的洗车店月份平均每天的收入约
(元).
20.【答案】(1)第二种生产方式的效率更高,详见解析;(2)见解析;(3)有的把握认为,见解析.
(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有的工人完成生产任务所需时间至少分钟,用第二种生产方式的工人中,有的工人完成生产任务所需时间至多分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于分钟;用第二种生产方式的工人完成生产任务平均所需时间低于分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎上的最多,关于茎大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎上的最多,关于茎大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知.
列联表如下:
(3)由于,
所以有的把握认为两种生产方式的效率有差异.
21.【答案】(1)见解析;(2).
(1)根据箱产量的频率分布直方图得列联表:
,
由于,故有的把握认为箱产量与养殖方法有关.
(2)因为新养殖法的箱产量频率分布直方图中,箱产量低于的直方图面积为,
箱产量低于的直方图面积为,
故新养殖法箱产量的中位数的估计值为.
22.【答案】(1);(2)82分;(3)见解析.
(1)由题意可知,
故
,
,
故回归方程为.
(2)将代入上述方程,得.
(3)由题意可知,该班数学优秀人数及物理优秀人数分别为抽出的人中,数学优秀但物理不优秀的共人,故全班数学优秀但物理不优秀的人共人.
于是可以得到列联表为:
于是,
因此在犯错误概率不超过的前提下,可以认为数学优秀与物理优秀有关.