第八章 成对数据的统计分析单元综合提优专练(解析版)-【尖子生题典】专题训练(沪教版2021选择性必修二)

文档属性

名称 第八章 成对数据的统计分析单元综合提优专练(解析版)-【尖子生题典】专题训练(沪教版2021选择性必修二)
格式 zip
文件大小 731.2KB
资源类型 试卷
版本资源 上教版(2020)
科目 数学
更新时间 2022-03-18 19:47:42

文档简介

编者学科君小注:
本专辑专为2022年上海高中数学课改版沪教版2021必修二、选择性必修一、选择性必修二研发,供中等及以上学生使用。
思路设计:重在培优训练,分选择、填空、解答三种类型题,知识难度层层递进,由中等到压轴,基础差的学生选做每种类型题的前4题;基础中等的学生必做前4题、选做5-8题;尖子生全部题型必做,冲刺压轴题。
第八章 成对数据的统计分析单元综合提优专练(解析版)
错误率:___________易错题号:___________
一、单选题
1.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如下:
由样本中样本数据求得回归直线方程为,则点与直线的位置关系是
A. B.
C. D.与的大小无法确定
【标准答案】B
【详解详析】
分析:由样本数据可得,利用公式,求出b,a,点(a,b)代入x+18y,求出值与100比较即可得到选项.
详解:由题意,(15+16+18+19+22)=18,(102+98+115+115+120)=110,
,5=9900,=1650,n=5 324=1620,
∴b==3.1,
∴a=110﹣3.1×18=54.2,
∵点(a,b)代入x+18y,
∴54.2+18×3.1=110>100.
即a+18b>100.故答案为B
点睛:本题主要考查回归直线方程的求法,意在考查学生对该基础知识的掌握能力和运算能力.
2.下列关于独立性检验的叙述:
①常用等高条形图展示列联表数据的频率特征;
②独立性检验依据小概率原理;
③样本不同,独立性检验的结论可能有差异;
④对分类变量与的随机变量的观测值来说,越小,与有关系的把握程度就越大.
其中正确的个数为
A.1 B.2 C.3 D.4
【标准答案】C
【详解详析】
分析:根据独立性检验的定义及思想,可得结论.
详解:①常用等高条形图展示列联表数据的频率特征;正确;
②独立性检验依据小概率原理;正确;
③样本不同,独立性检验的结论可能有差异;正确;
④对分类变量与的随机变量的观测值来说,越大,与有关系的把握程度就越大.故④错误.
故选C.
点睛:本题考查了独立性检验的原理,考查了推理能力,属于基础题.
3.变量与相对应的一组数据为(10 , 1),(11.3 , 2),(11.8 , 3),(12.5 , 4),(13 , 5);变量与相对应的一组数据为(10 , 5),(11.3 , 4),(11.8 , 3),(12.5 , 2),(13 , 1).表示变量之间的线性相关系数,表示变量与之间的线性相关系数,则(  )
A. B. C. D.
【标准答案】C
【思路指引】
求出,,进行比较即可得到结果
【详解详析】
变量与相对应的一组数据为

变量与相对应的一组数据为
这一组数据的相关系数
则第一组数据的相关系数大于,第二组数据的相关系数小于

故选
【名师指路】
本题主要考查的是变量的相关性,属于基础题.
4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110

附表:
0.050 0.010 0.001
3.841 6.635 10.828
参照附表,得到的正确结论是( )A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
【标准答案】A
【详解详析】
由,而,故由独立性检验的意义可知选A
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用(万元) 4 2 3 5
销售额(万元) 49 26 39 54
根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
【标准答案】B
【详解详析】
试题分析:,
∵数据的样本中心点在线性回归直线上,
回归方程中的为9.4,
∴42=9.4×3.5+a,
∴=9.1,
∴线性回归方程是y=9.4x+9.1,
∴广告费用为6万元时销售额为9.4×6+9.1=65.5
考点:线性回归方程
6.根据如下样本数据得到的回归方程为,则
3 4 5 6 7
4.0 2.5 –0.5 0.5 –2.0
A., B.,
C., D.,
【标准答案】A
画出散点图来判断的符号,然后求出样本中心代入回归方程后判断间的关系.
【详解详析】
根据表中的数据画出散点图如下图所示,
由图象可得,回归直线的斜率.
又当时,.
所以.
由表中数据得,
∴样本的中心为.
∵回归直线过样本的中心,
∴.
故选A.
【名师指路】
在线性回归中,回归直线过样本中心是常用的重要结论,利用该结论可求回归方程中的未知参数,也可求原数据中的未知参数,考查计算能力,属于基础题.
7.已知的对应值表为:
0 1 3 4 5 6
且线性相关,由于表格污损,的对应值看不到了,若,且线性回归直线方程为,则时,的预报值为( )
A. B. C. D.
【标准答案】A
【思路指引】
求出,由线性回归方程必经过点()即得,代入求解即可.
【详解详析】
由表格知,,

代入得:,

则回归方程为,
当时,,
故选:A.
【名师指路】
本题主要考查了线性回归方程,线性回归方程的性质、应用, 属于中档题.
8.一组数据如下表所示:
1 2 3 4
已知变量关于的回归方程为,若,则预测的值可能为
A. B. C. D.
【标准答案】C
【思路指引】
令,求得之间的数据对照表,结合样本中心点的坐标满足回归直线方程,即可求得;再令,即可求得预测值.
【详解详析】
将式子两边取对数,得到,令,得到,
根据已知表格数据,得到的取值对照表如下:
由上述表格可知:
,,
利用回归直线过样本中心点,即可得,
求得,则,
进而得到,将代入,
解得.
故选:C.
【名师指路】
本题考查利用样本中心点坐标满足回归直线方程求参数值,以及由回归方程进行预测值得求解,属中档题.
9.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B.
C. D.
【标准答案】D
【思路指引】
根据散点图的分布可选择合适的函数模型.
【详解详析】
由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率和温度的回归方程类型的是.
故选:D.
【名师指路】
本题考查函数模型的选择,主要观察散点图的分布,属于基础题.
10.给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是( )
A.①②④ B.②③④ C.①③④ D.②④
【标准答案】B
【思路指引】
①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的.
【详解详析】
对于①中,回归直线恒过样本点的中心,但不一定过一个样本点,所以不正确;
对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,所以是正确的;
对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;
对于④中,根据回归系数的含义,可得在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位,所以是正确的.
故选:B.
【名师指路】
本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.
二、填空题
11.若身高x(单位:m)与体重y(单位:kg)之间的回归直线方程为(),样本点的中心为,当身高为1.7m时,预计体重为______kg.
【标准答案】72.5
【思路指引】
将样本中心点代入方程得到,再取计算得到答案.
【详解详析】
将样本中心点代入方程得到,故,故,
当时,.
故答案为:.
【名师指路】
本题考查了回归方程和估计,意在考查学生的应用能力.
12.已知一组数据的回归直线方程为,且,发现有两组数据,的误差较大,去掉这两组数据后,重新求得回归直线方程为,则当时,_____.
【标准答案】5
【思路指引】
分别求出原数据和新数据的样本中心点即可
【详解详析】
由回归直线方程过样本中心点,可将代入,得,
所以原数据的样本中心点为,
则去掉两组数据,后的新数据的
,,
新数据的样本中心点为,
设新数据的回归直线方程为,将代入得,
当时,.
故答案为:5
【名师指路】
回归直线一定经过样本中心点
13.给出下列命题:
①线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱;
②由变量和的数据得到其回归直线方程,则一定经过点;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
④将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.1个单位,
其中真命题的序号是_________.
【标准答案】②④⑤
根据线性相关系数,回归直线方程,抽样方法,方差的公式,逐一判断即可得到结论.
【详解详析】
①线性相关系数越大,两个变量的线性相关性越强,故①不正确;
②由变量和的数据得到其回归直线方程,其点为样本中心点,一定在回归直线方程上,故②正确;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样不是分层抽样,而是系统抽样,故③错误;
④由方差的公式,将一组数据中的每个数据都加上或减去同一个常数后,其平均数也相应的增加或减少同一个常数,故方差不变,故④正确;
⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.1个单位,故⑤正确.
故答案为:②④⑤.
【名师指路】
本题考查独立性检验,考查分层抽样方法,考查线性回归方程,考查判断两个相关变量之间的关系,这种题考查的知识点比较多,需要认真分析,属于基础题.
14.对两个变量和进行回归分析,得到一组样本数据,,…,,则下列说法中正确的序号是______.
①由样本数据得到的回归直线方程必过样本点的中心
②残差平方和越小的模型,拟合的效果越好
③用相关指数来刻画回归效果,越小说明拟合效果越好
④若变量和之间的相关系数为,则变量和之间线性相关性强
【标准答案】①②④
【思路指引】
根据两个变量线性相关的概念及性质,逐项判定,即可求解.
【详解详析】
由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;
根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确;
根据相关指数的概念,可得越大说明拟合效果越好,所以③不正确;
若变量和之间的相关系数为,则变量和之间负相关,且线性相关性强,所以④正确;
故答案为:①②④.
【名师指路】
本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.
15.和的散点图如图所示,则下列说法中所有正确命题的序号为______.
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
【标准答案】①③
【思路指引】
由图可知,散点图呈整体下降趋势,据此判断①的正误;由试验数据得到的点将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,据此判断②的正误;根据散点图比较两个方程的拟合效果,比较那个拟合效果更好,据此判断③;.
【详解详析】
在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确;
x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;
由散点图知用拟合比用拟合效果要好,则,故③正确.
故答案为:①③.
【名师指路】
本题考查由散点图反应两个变量的相关关系,散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,属于中档题.
16.回归方程在样本处的残差为________.
【标准答案】
【思路指引】
根据残差的定义直接计算即可.
【详解详析】
由题当x=4时,,

所以回归方程在样本处的残差为.
故答案为:
【名师指路】
本题主要考查了残差的概念,考查了运算能力,属于容易题.
17.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:
价格 9 9.5 10.5 11
销售量 11 8 6 5
可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的______.
【标准答案】10
【思路指引】
计算,代入回归直线方程,与结合,求解出的值.
【详解详析】
依题意,代入回归直线方程得①,根据题意②,解①②组成的方程组得,故填.
【名师指路】
本小题主要考查回归直线方程过样本中心点,考查方程的思想,属于基础题.
18.下列说法:
①线性回归方程必过;
②命题“”的否定是“”
③相关系数越小,表明两个变量相关性越弱;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
【标准答案】①④
【详解详析】
分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.
详解:线性回归方程必过样本中心点,故①正确.
命题“”的否定是“” 故②错误
③相关系数r绝对值越小,表明两个变量相关性越弱,故不正确;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,正确.
故答案为①④.
点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.
19.对相关系数r,
①r越大,线性相关程度越大;
②r越小,线性相关程度越大;
③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大;
④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小
以上说法中,正确说法的序号是__________.
【标准答案】④
【详解详析】
两个变量之间的相关系数,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.
20.有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②学生与他(她)的学号之间的关系;
③森林中的同一种树木,其断面直径与高度之间的关系;
④曲线上的点与该点的坐标之间的关系.
其中有相关关系的是__________.(填上你认为正确的所有序号)
【标准答案】①③
【详解详析】
对于①,人的年龄与他(她)拥有的财富是一种不确定的相关关系;对于②,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系;对于③,森林中的同一种树木,其断面直径与高度之间的关系是一种不确定的关系,属于相关关系;对于④,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系.综上,其中有相关关系的是①③.
故答案为:①③.
三、解答题
21.为了解某小区居民的饮食习惯,从50岁以下、50岁及以上的居民中分别随机调查了15人,得到他们的饮食指数的茎叶图.茎叶图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数不低于70的人,饮食以肉类为主.
(1)根据茎叶图,判断该小区50岁以下、50岁及以上居民的饮食分别以什么为主?并说明理由.
(2)根据所给数据,完成下面列联表,并判断能否有99%的把握认为该小区居民的饮食习惯与年龄有关?
饮食以蔬菜为主 饮食以肉类为主 总计
50岁以下
50岁及以上
总计
附:
0.05 0.010 0.001
3.841 6.635 10.828
【标准答案】(1)答案见解析
(2)表格见解析,有
【思路指引】
(1)由茎叶得出小区50岁以下、50岁及以上居民的饮食习惯;
(2)根据题意填写2×2列联表即可,利用公式计算的观测值,对照临界值得出结论.
(1)
由茎叶图可知,该小区50岁以下的居民饮食指数的平均值高于70,50岁及以上的居民饮食指数的平均值低于70.因此,该小区50岁以下的居民饮食以肉类为主,50岁及以上的居民饮食以蔬菜为主.
(2)
列联表如下:
饮食以蔬菜为主 饮食以肉类为主 总计
50岁以下 4 11 15
50岁及以上 12 3 15
总计 16 14 30
由题意,的观测值,
∴有99%的把握认为该小区居民的饮食习惯与年龄有关.
22.某社区倡导“天天健身,天天快乐”,为了调查本社区的社员每天锻炼的时间与性别的关系,分别调查了男女各100人,把每天锻炼时间不少于120分钟的人称为“乐健者”,否则称为“善健者”,得到如下统计表:
乐健者 善健者 合计
男土 90 10 100
女士 70 30 100
合计 160 40 200
(1)若用频率表示概率,求在20位男土中“乐健者”的人数的期望是多少?
(2)能否有99.9%把握认为每天锻炼的时间与性别有关系?
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
【标准答案】(1)18;
(2)有99.9%把握认为每天锻炼的时间与性别有关系.
【思路指引】
(1)由已知求出男土中“乐健者”的概率,20位男土中“乐健者”的人数服从二项分布,利用二项分布的期望公式计算即得.
(2)根据数表计算的观测值,再与临界值表比对即可作答.
(1)
根据数表,每个男土为“乐健者”的概率估计值为,
20位男土中“乐健者”的人数,而任抽一个男士的试验,有是“乐健者”和不是“乐健者”两个不同结果,
因此,,于是得,
所以在20位男土中“乐健者”的人数的期望是18.
(2)
由数表得的观测值为:,
显然,
所以有99.9%把握认为每天锻炼的时间与性别有关系.
23.《2021新锐品牌数字化运营白皮书》中,我国提出了新锐品牌的概念,全称是国货新锐品牌.对这个名称进行拆解:国货 新 锐.新有两个层面,一是针对企业本身,指2011年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需求),形成了细分化的品类.锐:是在短期内实现大大高于传统品牌的爆发式增长,并且占据了一定的消费者心智.如图是11月份中国某信息网发布的我国市2021年上半年新锐品牌人群用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以及商品详情页的人群)性别分析数据.市对购买家电类新锐品牌人群中随机调查了100位男性顾客和100位女性顾客,统计出每位顾客购买家电消费金额,根据这些数据得到如下的频数分布表:
消费金额(元)
女性顾客人数 50 30 10 6 4
男性顾客人数 20 40 24 10 6
(1)若以我国市2021年上半年新锐品牌人群用户性别分析数据作为市抽取新锐品牌人群中性别概率,从市新锐品牌人群中随机抽取四人,为四人中男性的人数,求的概率分布列和期望.
(2)根据市统计购买家电消费金额数据频数分布表,完成下列列联表,并根据列联表,判断是否有99%的把握认为购买家电类新锐品牌人群消费金额千元以上与性别有关?
不超千元 千元以上 合计
女性顾客
男性顾客
合计
附:,
0.050 0.010 0.001
3.841 6.635 10.828
【标准答案】(1)分布列答案见解析,数学期望:
(2)列联表答案见解析,有99%的把握认为顾客购买家电消费金额千元以上与性别有关
【思路指引】
(1)由频率估计概率得人群中随机抽取一人为男性的概率为75%,为女性的概率为25%,进而结合二项分布求解即可;
(2)根据题意补全列联表,结合公式计算,进行独立性检验.
(1)
解:若以我国2021年上半年新锐品牌人群用户性别比例数据作为市抽取新锐品牌人群性别概率,
则市新锐品牌人群中随机抽取一人为男性的概率为75%,为女性的概率为25%,且服从二项分布,
得分布列为
0 1 2 3 4
的数学期望:.
(2)
解:根据所给数据,可得列联表:
不超千元 千元以上 合计
女性顾客 80 20 100
男性顾客 60 40 100
合计 140 60 200
根据列联表得.
因为,所以有99%的把握认为顾客购买家电消费金额千元以上与性别有关.
24.某数学课题组针对高三学生掌握基本知识点的单位值和“一诊”基础题目得分值进行统计分析,所得统计数据如表所示:
35 55 75 95
20 30 35 55
(1)请根据如表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)若,则称为异常值,现有8名学生的成绩,其中有3个异常值,现从8个成绩中逐一抽取,每次抽取后不放回,求至多抽取4次就能将3个异常值全部找出来的概率.
(参考公式:,.
【标准答案】(1)
(2)
【思路指引】
(1)先求出样本中心点的坐标,再利用公式求出,将样本中心点的坐标代入回归方程求得,从而可得答案;
(2)利用古典概型求出恰好3次就能将3个异常值找出的概率,以及恰好4此就能将3个异常值找出的概率,再求和即可.
(1)
由题意可得,,,
所以,
则,
所以关于的线性回归方程为;
(2)
①恰好3此就能将3个异常值找出的概率为,
②恰好4此就能将3个异常值找出的概率为,
所以,至多抽取4次就能将3个异常值找出的概率为
.
25.击鼓传花,也称传彩球,是中国民间游戏,数人或几十人围成圆圈坐下,其中一人拿花(或一小物件);另有一人背着大家或蒙眼击鼓(桌子、黑板或其他能发出声音的物体),鼓响时众人开始传花(顺序不定),至鼓停止为止,此时花在谁手中(或其座位前),谁就上台表演节目,某单位组织团建活动,9人一组,共9组,玩击鼓传花,(前五组)组号x与组内女性人数y统计结果如表: .
x 1 2 3 4 5
y 2 2 3 4 4
(1)女性人数与组号x (组号变量x依次为1, 2, 3, 4, 5, ... )具有线性相关关系,请预测从第几组开始女性人数不低于男性人数;
(参考公式:)
(2)在(1) 的前提下,从9组中随机抽取3组,若3组中女性人数不低于5人的有X组,求X的分布列与期望.
【标准答案】(1)预测从第7组开始女性人数不低于男性人数
(2)分布列见解析,1.
【思路指引】
(1)根据题意,结合已知公式得,再解即可估计得答案;
(2)根据题意得的所有可能取值为0,1,2,3,再根据超几何分布求解即可.
(1)
解:由题可得,
,.

所以
当时,
所以预测从第7组开始女性人数不低于男性人数.
(2)
解:由题可知的所有可能取值为0,1,2,3,
则的分布列为
X 0 1 2 3
P编者学科君小注:
本专辑专为2022年上海高中数学课改版沪教版2021必修二、选择性必修一、选择性必修二研发,供中等及以上学生使用。
思路设计:重在培优训练,分选择、填空、解答三种类型题,知识难度层层递进,由中等到压轴,基础差的学生选做每种类型题的前4题;基础中等的学生必做前4题、选做5-8题;尖子生全部题型必做,冲刺压轴题。
第八章 成对数据的统计分析单元综合提优专练(原卷版)
错误率:___________易错题号:___________
一、单选题
1.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如下:
由样本中样本数据求得回归直线方程为,则点与直线的位置关系是
A. B.
C. D.与的大小无法确定
2.下列关于独立性检验的叙述:
①常用等高条形图展示列联表数据的频率特征;
②独立性检验依据小概率原理;
③样本不同,独立性检验的结论可能有差异;
④对分类变量与的随机变量的观测值来说,越小,与有关系的把握程度就越大.
其中正确的个数为
A.1 B.2 C.3 D.4
3.变量与相对应的一组数据为(10 , 1),(11.3 , 2),(11.8 , 3),(12.5 , 4),(13 , 5);变量与相对应的一组数据为(10 , 5),(11.3 , 4),(11.8 , 3),(12.5 , 2),(13 , 1).表示变量之间的线性相关系数,表示变量与之间的线性相关系数,则(  )
A. B. C. D.
4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110

附表:
0.050 0.010 0.001
3.841 6.635 10.828
参照附表,得到的正确结论是( )A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用(万元) 4 2 3 5
销售额(万元) 49 26 39 54
根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
6.根据如下样本数据得到的回归方程为,则
3 4 5 6 7
4.0 2.5 –0.5 0.5 –2.0
A., B.,
C., D.,
7.已知的对应值表为:
0 1 3 4 5 6
且线性相关,由于表格污损,的对应值看不到了,若,且线性回归直线方程为,则时,的预报值为( )A. B. C. D.
8.一组数据如下表所示:
1 2 3 4
已知变量关于的回归方程为,若,则预测的值可能为A. B. C. D.
9.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B.
C. D.
10.给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是( )
A.①②④ B.②③④ C.①③④ D.②④
二、填空题
11.若身高x(单位:m)与体重y(单位:kg)之间的回归直线方程为(),样本点的中心为,当身高为1.7m时,预计体重为______kg.
12.已知一组数据的回归直线方程为,且,发现有两组数据,的误差较大,去掉这两组数据后,重新求得回归直线方程为,则当时,_____.
13.给出下列命题:
①线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱;
②由变量和的数据得到其回归直线方程,则一定经过点;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
④将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.1个单位,
其中真命题的序号是_________.
14.对两个变量和进行回归分析,得到一组样本数据,,…,,则下列说法中正确的序号是______.
①由样本数据得到的回归直线方程必过样本点的中心
②残差平方和越小的模型,拟合的效果越好
③用相关指数来刻画回归效果,越小说明拟合效果越好
④若变量和之间的相关系数为,则变量和之间线性相关性强
15.和的散点图如图所示,则下列说法中所有正确命题的序号为______.
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
16.回归方程在样本处的残差为________.
17.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:
价格 9 9.5 10.5 11
销售量 11 8 6 5
可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的______.
18.下列说法:
①线性回归方程必过;
②命题“”的否定是“”
③相关系数越小,表明两个变量相关性越弱;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
19.对相关系数r,
①r越大,线性相关程度越大;
②r越小,线性相关程度越大;
③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大;
④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小
以上说法中,正确说法的序号是__________.
20.有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②学生与他(她)的学号之间的关系;
③森林中的同一种树木,其断面直径与高度之间的关系;
④曲线上的点与该点的坐标之间的关系.
其中有相关关系的是__________.(填上你认为正确的所有序号)
三、解答题
21.为了解某小区居民的饮食习惯,从50岁以下、50岁及以上的居民中分别随机调查了15人,得到他们的饮食指数的茎叶图.茎叶图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数不低于70的人,饮食以肉类为主.
(1)根据茎叶图,判断该小区50岁以下、50岁及以上居民的饮食分别以什么为主?并说明理由.
(2)根据所给数据,完成下面列联表,并判断能否有99%的把握认为该小区居民的饮食习惯与年龄有关?
饮食以蔬菜为主 饮食以肉类为主 总计
50岁以下
50岁及以上
总计
附:
0.05 0.010 0.001
3.841 6.635 10.828
22.某社区倡导“天天健身,天天快乐”,为了调查本社区的社员每天锻炼的时间与性别的关系,分别调查了男女各100人,把每天锻炼时间不少于120分钟的人称为“乐健者”,否则称为“善健者”,得到如下统计表:
乐健者 善健者 合计
男土 90 10 100
女士 70 30 100
合计 160 40 200
(1)若用频率表示概率,求在20位男土中“乐健者”的人数的期望是多少?
(2)能否有99.9%把握认为每天锻炼的时间与性别有关系?
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
23.《2021新锐品牌数字化运营白皮书》中,我国提出了新锐品牌的概念,全称是国货新锐品牌.对这个名称进行拆解:国货 新 锐.新有两个层面,一是针对企业本身,指2011年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需求),形成了细分化的品类.锐:是在短期内实现大大高于传统品牌的爆发式增长,并且占据了一定的消费者心智.如图是11月份中国某信息网发布的我国市2021年上半年新锐品牌人群用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以及商品详情页的人群)性别分析数据.市对购买家电类新锐品牌人群中随机调查了100位男性顾客和100位女性顾客,统计出每位顾客购买家电消费金额,根据这些数据得到如下的频数分布表:
消费金额(元)
女性顾客人数 50 30 10 6 4
男性顾客人数 20 40 24 10 6
(1)若以我国市2021年上半年新锐品牌人群用户性别分析数据作为市抽取新锐品牌人群中性别概率,从市新锐品牌人群中随机抽取四人,为四人中男性的人数,求的概率分布列和期望.
(2)根据市统计购买家电消费金额数据频数分布表,完成下列列联表,并根据列联表,判断是否有99%的把握认为购买家电类新锐品牌人群消费金额千元以上与性别有关?
不超千元 千元以上 合计
女性顾客
男性顾客
合计
附:,
0.050 0.010 0.001
3.841 6.635 10.828
24.某数学课题组针对高三学生掌握基本知识点的单位值和“一诊”基础题目得分值进行统计分析,所得统计数据如表所示:
35 55 75 95
20 30 35 55
(1)请根据如表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)若,则称为异常值,现有8名学生的成绩,其中有3个异常值,现从8个成绩中逐一抽取,每次抽取后不放回,求至多抽取4次就能将3个异常值全部找出来的概率.
(参考公式:,.
25.击鼓传花,也称传彩球,是中国民间游戏,数人或几十人围成圆圈坐下,其中一人拿花(或一小物件);另有一人背着大家或蒙眼击鼓(桌子、黑板或其他能发出声音的物体),鼓响时众人开始传花(顺序不定),至鼓停止为止,此时花在谁手中(或其座位前),谁就上台表演节目,某单位组织团建活动,9人一组,共9组,玩击鼓传花,(前五组)组号x与组内女性人数y统计结果如表: .
x 1 2 3 4 5
y 2 2 3 4 4
(1)女性人数与组号x (组号变量x依次为1, 2, 3, 4, 5, ... )具有线性相关关系,请预测从第几组开始女性人数不低于男性人数;
(参考公式:)
(2)在(1) 的前提下,从9组中随机抽取3组,若3组中女性人数不低于5人的有X组,求X的分布列与期望.
同课章节目录