(3)成对数据的统计分析-2021-2022学年高二数学人教A版(2019)期末专项练
1.观察下列散点图,其中对两个变量之间的相关关系判断正确的是( )
A.a中为正相关,b中为负相关,c中为不相关
B.a中为负相关,b中为不相关,c中为正相关
C.a中为负相关,b中为正相关,c中为不相关
D.a中为正相关,b中为不相关,c中为负相关
2.如表是一个2×2列联表,则表中a,b的值分别为( )
合计
a 21 73
22 25 47
合计 b 46 120
A.94,72 B.52,50 C.52,74 D.74,52
3.用下列表格中的五对数据求得的线性回归方程为,则实数m的值为( )
x 196 197 200 203 204
y 1 3 6 7 m
A.8 B.8.2 C.8.4 D.8.5
4.如图1,2分别表示样本容量均为7的A、B两组成对数据的散点图,已知A组成对数据的样本相关系数为,B组成对数据的样本相关系数为,则与的大小关系为( )
A. B. C. D.无法判断
5.某校随机调查了110名不同的高中生是否喜欢篮球,得到如下的列联表:
男 女
喜欢篮球 40 20
不喜欢篮球 20 30
附:
0.050 0.010 0.001
3.841 6.635 10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别无关”
C.有99%以上的把握认为“喜欢篮球与性别有关”
D.有99%以上的把握认为“喜欢篮球与性别无关”
6.某组织为研究爱好某项运动是否与性别有关进行了一个调查,得到如下列联表,若这两个变量没有关系,则a的可能值为( )
男性 女性 总计
爱好 100 a
不爱好 120 600 720
总计 220
A.720 B.500 C.300 D.200
7.某研究小组在一项实验中获得一组关于y,t之间的数据,将其整理得到如图所示的散点图,下列函数中最能近似刻画y与t之间关系的是( )
A. B. C. D.
8.已知某产品的营销费用x(单位:万元)与销售额y(单位:万元)的统计数据如表所示:
营销费用x/万元 2 3 4 5
销售额y/万元 15 20 30 35
根据上表可得y关于x的回归直线方程为,则当该产品的营销费用为6万元时,销售额为( )
A.40.5万元 B.41.5万元 C.42.5万元 D.45万元
9.在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下列联表:
优秀 非优秀 合计
甲班 10 50 60
乙班 20 30 50
合计 30 80 110
附:,其中.
0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828
根据独立性检验,可以认为数学考试成绩与班级有关系的把握为( )
A.95% B.99.5% C.99.9% D.99%
10.某调查者在调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:
序号 科研费用支出 利润
1 2 31 155 25
2 11 40 440 121
3 4 30 120 16
4 5 34 170 25
5 3 25 75 9
6 2 20 40 4
合计 30 180 1000 200
则利润y关于科研费用支出x的经验回归方程为( )
参考公式:.
A. B. C. D.
11.若对甲、乙、丙3组不同的成对数据作线性相关性检验,得到这3组成对数据的样本相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的组是________(填“甲”“乙”或“丙”)
12.某工厂为研究某种产品产量(吨)与所需某种原材料(吨)的相关性,在生产过程中收集4组对应数据如表所示:(残差=真实值预测值)
3 4 5 6
2.5 3 4
根据表中数据,得出关于的线性回归方程为.据此计算出在样本点处的残差为,则表中的值为______________.
13.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
单位:人
读书 健身 合计
女 24 31 55
男 8 26 34
合计 32 57 89
在犯错误的概率不超过__________的前提下认为性别与休闲方式有关系.
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
14.某种细胞的存活率y(%)与存放温度x(℃)之间具有线性相关关系,其样本数据如下表所示:
存放温度x/℃ 20 15 10 5 0 -5 -10
存活率y/% 6 14 26 33 43 60 63
计算得,,,,并求得回归直线方程为.经核对,实验人员发现表中数据的对应值录入有误,更正为,则更正后的回归直线方程为_____________.
15.随着城市规模的扩大和人们生活水平的日益提髙,某市近年机动车保有量逐年递增.根据机动车管理部门的统计数据,以5年为一个研究周期,得到机动车每5年纯增数量(单位:万辆)的情况如下表.
年度周期 1995~2000 2000~2005 2005~2010 2010~2015 2015~2020
时间变量 1 2 3 4 5
纯增数量/万辆 3 6 9 15 27
其中,2,3,…,时间变量对应的机动车纯增数量为,且通过数据分析得到时间变量x与对应的机动车纯增数量y(单位:万辆)具有线性相关关系.
(1)求机动车纯增数量y关于时间变量x的回归方程,并预测2025~2030年间该市机动车纯增数量的值;
(2)该市交通管理部门为了了解市民对“单双号限行”的赞同情况,随机采访了220名市民,将他们的意见和是否拥有私家车情况进行了统计,得到的2×2列联表如下表.
赞同限行 不赞同限行 合计
没有私家车 90 20 110
有私家车 70 40 110
合计 160 60 220
根据列联表判断,能否有99%的把握认为对限行是否赞同与拥有私家车有关?
附:回归直线的斜率和截距的最小二乘估计公式分别为,.
,.
0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
答案以及解析
1.答案:D
解析:根据变量的相关性,可知图a中,两个变量成正相关;图b中,两个变量不相关;图c中,两个变量成负相关.故选D.
2.答案:C
解析:.故选C.
3.答案:A
解析:依题意,得,,回归直线必经过点,
所以,解得,故选A.
4.答案:C
解析:由题图1可知,散点几乎在一条直线上,且成正相关,,由题图2可知,散点分散在一条直线附近,也成正相关,.A组成对数据的线性相关程度比B组强些,,故选C.
5.答案:C
解析:由题意,,因此有99%以上的把握认为“喜欢篮球与性别有关”.
故选C.
6.答案:B
解析:结合选项,知当时,,所以这两个变量没有关系,故选B.
7.答案:C
解析:根据图中的特殊点,,通过选项可知只有C:满足题意.故选C.
8.答案:C
解析:由题中表格数据可知,,因为回归直线一定经过点,所以,解得,
所以回归直线方程为,将代入,得.故选C.
9.答案:D
解析:由题表中的数据可得:,因为,所以可以认为数学考试成绩与班级有关系的把握为99%.故选D.
10.答案:A
解析:设经验回归方程为.
由题表中数据得,,
,
经验回归方程为.
11.答案:丙
解析:样本相关系数越接近1,成对数据的线性相关程度就越强,结合题中所给的3组成对数据的样本相关系数知,-0.90的绝对值最接近1,所以丙组成对数据的线性相关程度最强.
12.答案:4.5
解析:由在样本点处的残差为,可得,则,解得,由题意可知,产量的平均数为,由线性回归方程过点,则,则,解得.
13.答案:0.1
解析:由题中列联表中的数据,得,因为,所以在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关系 .
14.答案:
解析:由题意,知更正后,,,,所以,.所以更正后的回归直线方程为.
15.答案:(1),2025~2030年间该市机动车约纯增34.8万辆
(2)有99%的把握认为对限行是否赞同与拥有私家车有关
解析:(1)由机动车的纯增数量表可知
,,
所以,
因为回归直线过样本点的中心,所以,
解得,所以.
当年度周期为2025~2030时,,所以,
所以2025~2030年间该市机动车约纯增34.8万辆.
(2)根据列联表,计算得的观测值.
因为,
所以有99%的把握认为对限行是否赞同与拥有私家车有关.