高二数学选择性必修三第八章成对数据的统计分析单元测试
一、单选题
1.如图所示,给出了样本容量均为7的A、B两组样本数据的散点图,已知A组样本数据的相关系数为r1, B组数据的相关系数为r2,则( )
A.r1=r2 B.r1r2 D.无法判定
2. 下列关于回归分析的说法中错误的有( )
(1)残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高.
(2)若所有样本点都在上,则变量间的相关系数为±1
(3)两个模型中残差平方和越小的模型拟合的效果越好.
(4)甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好.
A.4个 B.3个 C.2个 D.1个
3.根据如下样本数据,得到回归直线方程,则( )
4 5 6 7 8
A., B.,
C., D.,
4.下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
5. 已知具有线性相关关系的两个变量x,y之间的一组数据如表:
x 0 1 2 3 4
y 2.2 n 4.5 4.8 6.7
若经验回归直线方程是=0.95x+2.6,则下列说法不正确的是( )
A.n的值是4.3 B.变量x,y呈正相关关系
C.若x=6,则y的值一定是8.3 D.若x的值增加1,则y的值约增加0.95
6.年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法不一定成立的是( )
A.当月在售二手房均价与月份代码呈正相关关系
B.根据可以预测年月在售二手房均价约为万元/平方米
C.曲线与的图形经过点
D.回归曲线的拟合效果好于的拟合效果
7.下列命题:
①在一个列联表中,由计算得 ,则有的把握确认这两类指标间有关联②若二项式的展开式中所有项的系数之和为,则展开式中的系数是③随机变量服从正态分布 ,则④若正数满足,则的最小值为其中正确命题的序号为( )
A.①②③ B.①③④ C.②④ D.③④
8.假设有两个变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
二、多项选择题
9. 为了解高中生选科时是否选物理与数学成绩之间的关系,某教研机构随机抽取了50名高中生,通过问卷调查,得到以下数据:
选物理 不选物理
数学成绩优异 20 7
数学成绩一般 10 13
由以上数据,计算得到χ2=≈4.844,根据临界值表,以下说法正确的是( )
参考数据:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.有95%的把握认为是否选择物理与数学成绩有关
B.在犯错误的概率不超过0.05的前提下,认为是否选择物理与数学成绩有关
C.95%的数学成绩优异的同学选择物理
D.若表格中的所有数据都扩大为原来的10倍,在相同条件下,结论不会发生变化
10.关于变量x,y的n个样本点,,,及其线性回归方程,下列说法正确的有( )
A.相关系数r的绝对值|r|越接近0,表示x,y的线性相关程度越强
B.相关指数的值越接近1,表示线性回归方程拟合效果越好
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若,,则点一定在线性回归方程上
11. 以下四个命题中,其中正确的是( )
A.已知两个变量具有线性相关关系,其经验回归直线方程为y=a+bx,若b=2,=1,=3,则a=1.
B.两个随机变量相关性越强,则相关系数的绝对值越接近于0
C.在经验回归直线方程=0.2x+12中,当变量x每增加一个单位时,则变量平均增加0.2个单位
D.以模型y=去拟合一组数据时,为了求出经验回归方程,设z=lny,将其变换后得到线性方程:z=0.3x+4,则c==0.3
12.变量x,y之间的一组数据如下表所示:
x 1 3 6 7 8
y 1 2 3 4 5
甲、乙两位同学给出的回归直线方程分别为①和②,
通过分析得出②的拟合效果更好,则下列分析理由正确的是( )
参考公式:.
A.①的残差和大于②的残差和,所以②的拟合效果更好
B.①的残差平方和大于②的残差平方和,所以②的拟合效果更好
C.①的R2小于②的R2,所以②的拟合效果更好
D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以②的拟合效果更好
三、填空题
13.在一组样本数据,,…,(,,,…,互不相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为________.
14. 已知变量x,y线性相关,由观测数据算得样本的平均数==5,线性回归方程=bx+a中的系数b,a满足b+a=4,则线性回归方程为________.
15.现在微信支付被越来越多的人所接受,现从某市市民中随机抽取300人,对是否使用微信支付进行调查,得到下面列联表:
年轻人 非年轻人 总计
经常使用微信支付 165 225
不常使用微信支付
合计 90 300
根据表中数据,我们得到结论:有___________的把握认为使用微信支付与年龄有关.
16.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作 不太积极参加班级工作 合计
学习积极性高 18 7 25
学习积极性一般 6 19 25
合计 24 26 50
则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).
注:独立性检验界值表
0.025 0.010 0.005 0.001
5.024 6.635 7.879 10.828
四、解答题
17. 为了研究黏虫孵化的平均温度x(单位:oC)与孵化天数y之间的关系,某课外兴趣小组通过试验得到如下6组数据:
组号 1 2 3 4 5 6
平均温度 12 16 17 18 19 20
孵化天数 23 16 14 12 9 7
他们分别用两种模型①,②分别进行拟合,得到相应的经验回归方程并进行残差分析,得到如图所示的残差图:
经计算得,
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)
(2)应用最小二乘法建立y关于x的线性经验回归方程.
参考公式:经验回归方程中斜率和截距的最小二乘法估计公式分别为:
,
18.某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组,第二组,,第五组(单位:分),得到如下的频率分布直方图.
(1)若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关;
(2)用分层抽样方法,在成绩不低于85的学生中抽取6人,再从这6人中随机选3人发言谈体会,设这3人中成绩在的人数为,求的分布列与数学期望.
附:,.
临界值表:
19.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,得到的实验数据经整理得到如下的折线图:
参考数据:,,, .
参考公式:相关系数 .
回归直线方程,, .
(1)由图可以看出,这种酶的活性与温度具有较强的线性相关性,请用相关系数加以说明;
(2)求关于的线性回归方程,并预测当温度为时,这种酶的活性指标值.(计算结果精确到0.01)
20. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(4)请求出决定系数R2,并说明模型的拟合效果.
附:,;
21.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额和年盈利额的数据通过对比分析,建立了两个函数模型:①,②,其中均为常数,e为自然对数的底数.令,,经计算得如下数据:
26 215 65 2 680
11250 130 12
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程;(系数精确到)
(ii)若希望2021年盈利额y为200亿元,请预测2021年的研发资金投入额x为
多少亿元?(结果精确到)
附:①相关系数,回归直线中:,;②参考数据:,.