江苏专版2023_2024学年新教材高中数学第9章统计 同步练习(打包6份)(含解析)

文档属性

名称 江苏专版2023_2024学年新教材高中数学第9章统计 同步练习(打包6份)(含解析)
格式 zip
文件大小 1.9MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2024-01-04 16:06:15

文档简介

9.1.1 变量的相关性
基础达标练
1.(多选题)下列两个变量之间的关系不是函数关系的有(  )
               
A.角度和它的余弦值
B.眼睛的近视程度与看手机的时间
C.正n边形的边数和内角和的度数
D.人的年龄和身高
2.在下列各图中,两个变量具有相关关系的是(  )
A.①②③ B.①③④
C.②③④ D.①②④
3.在如下四个散点图中,两个变量之间正相关的是(  )
4.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的线性相关系数,其数值分别为0.939,0.937,0.948,则(  )
A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱
B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱
C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱
D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱
5.下列两个变量之间具有相关关系的是     .
①正方形的边长a和面积S;
②一个人的身高h和腿长x;
③真空中的自由落体运动其下落的距离h和下落的时间t;
④一个人的身高h和体重x.
6.为了对某班考试成绩进行分析,现从全班同学中随机抽取8位同学,他们的数学、物理成绩对应如表.
学生编号 1 2 3 4 5 6 7 8
数学分数x/分 60 65 70 75 80 85 90 95
物理分数y/分 72 77 80 85 88 90 93 95
根据表中数据分析:是否可以认为变量x与y具有线性相关关系
能力提升练
7.在下列散点图中,两个变量具有正相关关系的是(  )
8.(多选题)从统计学的角度看,下列关于变量间的关系说法不正确的有(  )
A.人体的脂肪含量与年龄之间没有相关关系
B.汽车的重量和汽车每消耗1 L汽油所行驶的平均路程之间有相关关系
C.吸烟量与健康水平之间没有相关关系
D.气温与热饮销售好不好之间没有相关关系
9.(多选题)对于相关系数r,以下说法错误的有(  )
A.r只能是正值,不能为负值
B.|r|≤1,且|r|越接近于1,相关程度越大;相反则越小
C.|r|≤1,且|r|越接近于1,相关程度越小;相反则越大
D.r<0时表示两个变量不相关
10.在关于变量x,y的一组样本数据(a1,b1),(a2,b2),…,(an,bn)(n≥2,a1,a2,…,an不全相等)的散点图中,若所有样本点(ai,bi)(i=1,2,…,n)恰好都在直线y=-2x+1上,则根据这组样本数据推断的变量x,y的相关系数为     .
拓展探究练
11.(多选题)下图所示的是某市2022年4月至2023年3月每月最低气温与最高气温的折线统计图,已知每月最低气温与最高气温的相关系数r=0.83,则下列结论正确的有(若|r|>0.75,则线性相关程度较强)(  )
A.每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关
B.月温差(月最高气温-月最低气温)的最大值出现在10月
C.9月~12月的月温差相对于5月~8月,波动性更大
D.每月最高气温与最低气温的平均值在所统计的前6个月里逐月增加
9.1.1 变量的相关性
  1.BD 函数关系就是变量之间的一种确定性关系.A,C两项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cosθ,h(n)=(n-2)π.B选项中的两个变量之间不是函数关系,眼睛的近视程度受很多因素影响.D选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选BD.
2.A 图①②③中,散点图中的点大致分布在一条直线附近,所以变量间具有线性相关关系;
图④中,散点图中的点分布杂乱无章,不在一条直线附近,所以变量间不具有线性相关关系.
3.A 对于A,散点图中的点呈从左下向右上方向发展的趋势,且在一条直线附近,两个变量之间呈正相关;
对于B,散点图中的点呈从左上向右下方向发展的趋势,且在一条直线附近,两个变量之间呈负相关;
对于C,散点图中的点分布杂乱无章,没有明显的相关性;
对于D,散点图中的点同样分布杂乱无章,没有明显的相关性.
4.D 甲、乙、丙三组数据的线性相关系数分别为0.939,0.937,0.948,所以线性相关系数最大的丙组数据的线性相关性最强,线性相关系数最小的乙组数据的线性相关性最弱.
5.②④ 对于①,正方形的边长a和面积S之间是函数关系,不是相关关系;
对于②,一般情况下,一个人的身高h和腿长x是正相关关系;
对于③,真空中的自由落体运动其下落的距离h和下落的时间t是函数关系,不是相关关系;
对于④,一般情况下,一个人的身高h和他的体重x是正相关关系.
6.解 =×(60+65+70+75+80+85+90+95)=77.5,
=×(72+77+80+85+88+90+93+95)=85,
(xi-)(yi-)=685,(xi-)2=1050,(yi-)2=456, 
所以线性相关系数r==≈0.99,接近于1,
所以可以认为变量x与y具有线性相关关系.
7.B 对于A,是相关关系,但不是正相关关系,不符合题意;
对于B,是相关关系,也是正相关关系,符合题意;
对于C,是相关关系,是负相关关系,不符合题意;
对于D,散点分布杂乱无章,这两个变量不具有线性相关关系,不符合题意.
8.ACD 从统计学的角度看,在一定年龄段内,人体的脂肪含量与年龄之间有相关关系,故A错误;汽车的重量和汽车每消耗1L汽油所行驶的平均路程之间有相关关系,故B正确;吸烟量与健康水平之间有相关关系,故C错误;气温与热饮销售好不好之间有相关关系,故D错误.
9.ACD 由相关系数的性质知B正确,其余均错误.
10.-1 所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1.
11.ABC 每月最低气温与最高气温的相关系数r=0.83,可知每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关.由所给的折线图可以看出月温差(月最高气温-月最低气温)的最大值出现在10月.9月~12月的月温差相对于5月~8月,波动性更大.每月的最高气温与最低气温的平均值在所统计的前5个月里逐月增加,在第6个月开始减少,所以A,B,C正确,D错误.9.1.2 线性回归方程
基础达标练
1.已知变量x,y之间具有线性关系,其散点图如下图所示,则其线性回归方程可能为(  )
               
A.=1.5x+2 B.=-1.5x+2
C.=1.5x-2 D.=-1.5x-2
2.已知线性回归方程为=x+,其中=3且样本点的中心为(1,2),则线性回归方程为(  )
A.=x+3 B.=-2x+3
C.=-x+3 D.=x-3
3.已知变量x和y满足线性回归方程=-0.1x+1,且变量y与z正相关.下列结论中正确的是(  )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
4.(多选题)已知具有相关关系的变量x,y之间的线性回归方程为=-0.7x+10.3,且变量x,y之间的相关数据如表所示,则下列说法错误的有(  )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈正相关关系
B.可以预测,当x=20时,=3.7
C.可求得表中m=4.7
D.由表格数据知,该回归直线必过点(9,4)
5.若线性回归方程中的回归系数=0,则相关系数r=     .
6.由变量x与y相对应的一组样本数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的线性回归方程为=2x+45,则=     .
7.通过市场调查,得到某种产品的资金投入x(单位:万元)与获得的利润y(单位:万元)的数据,如表所示:
资金投入x 2 3 4 5 6
利润y 0.4 0.6 1 1.2 1.8
根据表格提供的数据,用最小二乘法求线性回归方程为=x-0.36,现投入资金15万元,求获得利润的估计值(单位:万元)为     .
8.某地区2016年至2022年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份 2016 2017 2018 2019 2020 2021 2022
年份代号t 1 2 3 4 5 6 7
人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的线性回归方程,分析2016年至2022年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2024年农村居民家庭人均纯收入.
附:线性回归直线的斜率和截距的最小二乘估计公式分别为=,=-,
参考数据:(ti-)2=28,(ti-)(yi-)=14.
9.根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间的对应数据的散点图如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的线性回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量y约为多少.
附:相关系数公式r=.
参考数据:(xi-)(yi-)=6,(xi-)2=20,(yi-)2=2,≈0.95.
回归直线=x+中斜率和截距的最小二乘估计公式分别为=,=-.
能力提升练
10.(多选题)对于线性回归方程=x+(>0),下列说法正确的有(  )
A.当x增加一个单位时,的值平均增加个单位
B.点(,)一定在=x+所表示的直线上
C.当x=t时,一定有=t+
D.当x=t时,y的值近似为t+
11.某研究所为了研究近几年中国留学生回国人数的情况,对2016至2020年留学生回国人数进行了统计,数据如表:
年份 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5
留学生回国人数y/万 36.5 40.9 43.3 48.1 51.9
根据上述统计数据求得留学生回国人数y(单位:万)与年份代码x满足的线性回归方程为=x+32.74,利用回归方程预测2024年留学生回国人数为(  )
A.63.14万 B.64.72万
C.66.81万 D.66.94万
12.某校小卖部为了了解奶茶的销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天卖出的奶茶杯数与当天的气温,得到下表中的数据,并根据该样本数据用最小二乘法建立了线性回归方程=-2x+60,则样本数据中污损的数据y0应为(  )
气温x -1 13 10 18
杯数y y0 34 38 24
A.58 B.64 C.62 D.60
13.(多选题)根据如下样本数据得到的线性回归方程为=x+,则(  )
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
A.>0 B.>0
C.<0 D.<0
14.某工厂为研究某种产品产量x(单位:吨)与所需某种原材料y(单位:吨)的相关关系,在生产过程中收集了4组对应数据(x,y)如下表所示:
x 3 4 5 6
y 2.5 3 4 m
根据表中数据,得出y关于x的线性回归方程为=0.7x+a.据此计算出在样本(4,3)处的随机误差为-0.15,则表中m的值为 .
15.某品牌服装专卖店为了解保暖衬衣的销售量y与平均气温x之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如下表:
时间 二月上旬 二月中旬 二月下旬 三月上旬
旬平均气温x/℃ 3 8 12 17
旬销售量y/件 55 m 33 24
由表中数据算出线性回归方程=x+中的=-2,=10,=38.
(1)表中数据m=     .
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为     件.
16.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
年龄x 2 3 4 5 6
患病人数y 22 22 17 14 10
(1)求y关于x的线性回归方程;
(2)计算相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关性很强.(若|r|∈[0.75,1],则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.3),则x,y相关性较弱)
参考数据:≈5.477.
参考公式:=,
相关系数r=.
拓展探究练
17.已知变量y关于x的非线性回归方程为=,其一组数据如下表所示:
x 1 2 3 4
y e e3 e4 e6
若x=5,则预测y的值可能为(  )
A.e5 B. C.e7 D.
18.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据收集到的数据可知=20,由最小二乘法求得线性回归方程为=0.6x+48,则y1+y2+y3+y4+y5=     .
9.1.2 线性回归方程
1.B
2.C 回归直线一定过样本点的中心,代入可知只有选项C符合.
3.C 因为=-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设z=y+(>0),所以=-0.1x++,-0.1<0,所以x与z负相关.
4.ABC 由x与y的线性回归方程可知,
回归系数为-0.7,且-0.7<0,
∴变量x,y之间呈负相关,故A错误;
当x=20时,代入线性回归方程,得=-0.7×20+10.3=-3.7,故B错误;
由表中数据可知=9,==,
由点(,)必在回归直线上,
得=-0.7×9+10.3,
解得m=5,故C错误;
∵m=5,∴==4,
∴回归直线必过点(9,4),故D正确.
5.0 相关系数r=与=的分子相同,故r=0.
6.63 ∵=(1+5+7+13+19)=9,=2+45,
∴=2×9+45=63.
7.4.74 由表中数据可得=4,=1,
所以=x-0.36过点(4,1),
代入可得=0.34,
所以=0.34x-0.36,
当x=15时,=0.34×15-0.36=4.74,
即获得利润的估计值为4.74万元.
8.解 (1)由所给数据计算得
=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
===0.5,
=-=4.3-0.5×4=2.3,
所求线性回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2016年至2022年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2024年的年份代号t=9代入(1)中的线性回归方程,得=0.5×9+2.3=6.8,
故预测该地区2024年农村居民家庭人均纯收入为6.8千元.
9.解 (1)相关系数r===≈0.95.
因为|r|>0.75,所以可用线性回归模型拟合y与x的关系.
(2)由已知数据可得==5,
==4,
===0.3,
则=4-5×0.3=2.5,
所以线性回归方程为=0.3x+2.5.当x=12时,=0.3×12+2.5=6.1,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.
10.ABD
11.D 由表中数据可得,==3,==44.14,
∵点(,)满足线性回归方程=x+32.74,
∴44.14=×3+32.74,
解得=3.8,
故=3.8x+32.74,
2024年对应的年份代码为9,把x=9代入线性回归方程,则=3.8×9+32.74=66.94,
故预测2024年留学生回国人数为66.94万.
故选D.
12.B 由表中数据易知=10,代入=-2x+60中,
得=40.由=40,得y0=64.
13.AD 作出散点图如下:
观察图象可知,线性回归方程=x+的斜率<0,
当x=0时,=>0.
故>0,<0.
14.4.5 由在样本(4,3)处的随机误差为-0.15,可得=3.15,故3.15=0.7×4+a,解得a=0.35.
由题意可知产量x的平均值=×(3+4+5+6)=4.5.
因为回归直线过点(,),
所以=0.7×4.5+0.35=3.5.
又因为=(9.5+m),
所以m=4.5.
15.(1)40 (2)14 (1)由=(55+m+33+24)=38,
解得m=40.
(2)由=-,得=58,
故=-2x+58.
把x=22代入回归直线方程,得=14.
故三月中旬的销售量约为14件.
16.解 (1)由题意可得==4,==17,
=
==-3.2,
=-=17+3.2×4=29.8,
故y关于x的线性回归方程为=-3.2x+29.8.
(2)r===≈-0.97,
由r<0,可知x,y负相关.
又因为|r|∈[0.75,1],
所以x,y相关性很强.
因此,可以认为该幼儿园去年春季患流感人数与年龄负相关性很强.
17.D 将式子两边取对数,得到ln=x-0.5,
令z=ln,得到z=x-0.5,
列出x,z的取值对应的表格如下:
x 1 2 3 4
z 1 3 4 6
  则==2.5,==3.5.
∵(,)满足z=x-0.5,
∴3.5=×2.5-0.5,解得=1.6,
∴z=1.6x-0.5,∴=e1.6x-0.5,
当x=5时,=e1.6×5-0.5=.
18.300 ∵回归直线过点(,),
∴将=20代入线性回归方程得=60,
∴y1+y2+y3+y4+y5=5=300.9.2 独立性检验
基础达标练
1.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据(  )
               
A.χ2>3.841 B.χ2<3.841
C.χ2>6.635 D.χ2<6.635
2.为了了解某小学的学生爱吃零食是否与性别有关,进行了相应的调查,得到如下表数据:
单位:人   
性别 对零食的喜好程度 合计
爱吃 不爱吃
男 27 34 61
女 12 29 41
合计 39 63 102
根据上述数据分析,我们得出的χ2约为(  )
A.2.072 B.2.334
C.3.957 D.4.514
3.假设有两个分类变量X与Y,它们的可能取值分别为{X1,X2}和{Y1,Y2},其2×2列联表为
  YX   Y1 Y2
X1 10 18
X2 m 26
则当m取下面何值时,X与Y的关系最弱(  )
A.8 B.9 C.14 D.19
4.(多选题)分类变量X和Y的列联表如下:
  YX   Y1 Y2 合计
X1 a b a+b
X2 c d c+d
合计 a+c b+d a+b+c+d
则下列说法不正确的有(  )
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
5.(多选题)某市为了研究该市空气中的PM2.5浓度和SO2浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SO2浓度(单位:μg/m3),得到如下所示的2×2列联表:
  SO2PM2.5   [0,150] (150,475]
[0,75] 64 16
(75,115] 10 10
经计算χ2=≈7.484 4,则可以推断出(  )
附:χ2=
P(χ2≥x0) 0.050 0.010 0.001
x0 3.841 6.635 10.828
A.该市一天空气中PM2.5浓度不超过75 μg/m3,且SO2浓度不超过150 μg/m3的概率估计值是0.64
B.若2×2列联表中的天数都扩大到原来的10倍,χ2的值不会发生变化
C.有超过99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关
D.在犯错误的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与SO2浓度有关
6.在一项打鼾与患心脏病是否有关的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是     的.(填“有关”或“无关”)
7.对某台机器购置后的运营年限x(x=1,2,3,…)与当年利润y进行相关分析知具备线性相关关系,线性回归方程为=10.47-1.3x,估计该台机器使用     年最合算.
8.下表是一次针对高三学生的调查所得数据,试问:能否有97.5%的把握认为学生总成绩不好与数学成绩不好有关系
单位:人
数学成绩 总成绩 合计
不好 好
不好 478 12 490
好 399 24 423
合计 877 36 913
能力提升练
9.下列关于回归分析与独立性检验的说法正确的是(  )
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
10.某机构调查了1 000名成年人,发现480名男人中有38名患有先天性色觉障碍疾病,520名女人中有6名患有先天性色觉障碍疾病.下列说法正确的是(  )
A.男人、女人中患先天性色觉障碍疾病的频率分别为0.038和0.006
B.男、女患先天性色觉障碍疾病的概率分别为,
C.男人中患先天性色觉障碍疾病的比例比女人中患先天性色觉障碍疾病的比例大,可以认为患先天性色觉障碍疾病与性别是有关的
D.调查人数太少,不能说明先天性色觉障碍疾病与性别有关
11.(多选题)某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关联,面向学生开展了一次随机调查,其中参加调查的男生、女生人数相同,男生喜欢攀岩的占80%,女生不喜欢攀岩的占70%,则下列说法正确的有(  )
参考公式:χ2=.
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男生、女生人数均为100,则依据独立性检验的思想认为喜欢攀岩和性别有关联
D.无论参与调查的男生、女生人数为多少,都可以依据独立性检验的思想认为喜欢攀岩和性别有关联
12.下面是一个2×2列联表:
X Y 合计
Y1 Y2
X1 a 21 70
X2 5 c 30
合计 b d 100
则b-d=     ,χ2≈     .(保留小数点后3位)
13.某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练,对提高‘数学应用题’得分率的作用”的试验,其中甲班为试验班(加强“语文阅读理解”训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
平均成绩/分 60以下 61~70 71~80 81~90 91~100
甲班/人 3 11 6 12 18
乙班/人 7 8 10 10 15
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分析估计两个班级的优秀率.
(2)由以上统计数据填写下面2×2列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助
单位:人  
班级 人数 合计
优秀人数 非优秀人数
甲班
乙班
合计
参考公式及数据:
χ2=.
P(χ2≥x0) 0.050 0.010 0.001
x0 3.841 6.635 10.828
拓展探究练
14.(多选题)针对时下的“短视频热”,某校团委对“学生性别和喜欢短视频是否有关”进行了一次调查,其中被调查的男生、女生人数相同,男生喜欢短视频的人数占男生总人数的,女生喜欢短视频的人数占女生总人数的,若有95%的把握认为是否喜欢短视频和性别有关,则调查的男生总人数可能为(  )
附表:
P(χ2≥x0) 0.050 0.010
x0 3.841 6.635
附:χ2=
A.25 B.45 C.60 D.75
9.2 独立性检验
  1.A 把χ2的值与临界值做比较,从而确定A与B有关的可信程度.
当χ2>6.635时,有99%的把握认为A与B有关系;
当χ2>3.841时,有95%的把握认为A与B有关系;
当χ2>2.706时,有90%的把握认为A与B有关系;
当χ2≤2.706时,就没有充分的证据认为A与B有关系.
故选A.
2.B 由公式得χ2=≈2.334.
3.C 若X与Y的关系最弱,
则χ2=0.由χ2计算公式可知当ad-bc=0时,χ2=0,
即10×26=18m,解得m≈14.4,
所以在四个选项中,当m取14时,X与Y的关系最弱.
4.ABD |ad-bc|越小,说明X与Y关系越弱;|ad-bc|越大,说明X与Y关系越强.所以不正确的是A,B,D.
5.ACD 由表中数据可得,该市一天空气中PM2.5浓度不超过75μg/m3,且SO2浓度不超过150μg/m3的概率估计值是=0.64,故A正确;
χ2==
≈74.844≠7.4844,故B错误;
∵7.4844>6.635,
∴有超过99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关,故C,D正确.
故选ACD.
6.有关 ∵χ2=27.63>10.828,
∴有理由认为打鼾与患心脏病是有关的.
7.8 只要预计利润不为负数,使用该机器就算合算,即≥0,所以10.47-1.3x≥0,解得x≤8.05,所以这台机器使用8年最合算.
8.解 提出假设H0:学生总成绩不好与数学成绩不好没有关系.
根据列联表中的数据,经计算得到
χ2=≈6.233>5.024,
所以我们有97.5%的把握认为学生总成绩不好与数学成绩不好有关系.
9.C
10.C 男人中患先天性色觉障碍疾病的比例为=,要比女人中患先天性色觉障碍疾病的比例=大,其差值为-≈0.0676,差值较大,故认为患先天性色觉障碍疾病与性别是有关的.
11.AC 由题意设参加调查的男生、女生人数均为m,则得到如下2×2列联表:
性别 是否喜欢攀岩 合计
喜欢攀岩 不喜欢攀岩
男 0.8m 0.2m m
女 0.3m 0.7m m
合计 1.1m 0.9m 2m
  所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,故A正确,B错误.
由列联表中的数据,计算得到
χ2==,
当m=100时,
χ2==≈50.505>10.828,
所以当参与调查的男生、女生人数均为100时,依据独立性检验,我们有99.9%的把握认为喜欢攀岩和性别有关联,故C正确,D错误.故选AC.
12.8 24.047 由2×2列联表得a=49,b=54,c=25,d=46,
∴b-d=54-46=8,
χ2=≈24.047.
13.解 (1)由题意知,甲、乙两班均有学生50人,
甲班优秀人数为30,优秀率为=60%,
乙班优秀人数为25,优秀率为=50%,
所以甲、乙两班的优秀率分别为60%和50%.
(2)
单位:人      
班级 人数 合计
优秀人数 非优秀人数
甲班 30 20 50
乙班 25 25 50
合计 55 45 100
  提出假设H0:加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助.
因为χ2=≈1.010<3.841,
所以由参考数据知,没有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助.
14.BC 设男生的人数为5n(n∈N*),
根据题意列出2×2列联表如表所示:
单位:人     
是否喜欢短视频 性别 合计
男生 女生
喜欢 4n 3n 7n
不喜欢 n 2n 3n
合计 5n 5n 10n
  则χ2==.
因为有95%的把握认为是否喜欢短视频和性别有关,
所以3.841≤χ2<6.635,
即3.841≤<6.635,
得8.0661≤n<13.9335.
因为n∈N*,
所以n的可能取值有9,10,11,12,13
因此结合选项,调查人数中男生总人数的可能值为45或60.午练25 变量的相关性
1.观察下列各图,两个变量具有相关关系的是(  )
             
① ②
③ ④
A.①②   B.①③  
C.②④   D.②③
2.对两个变量x,y进行分析,计算得到相关系数r=-0.996 2,则下列说法正确的是(  )
A.x与y正相关
B.x与y具有较强的线性相关关系
C.x与y几乎不具有线性相关关系
D.x与y的线性相关关系还需进一步确定
3.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(  )
A.r2B.r4C.r4D.r24.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y,X之间的线性相关系数,r2表示变量U与V之间的线性相关系数,则(  )
A.r1C.r2<05.(多选题)以下各对变量成正相关的有(  )
A.学生的学籍号与学生的数学成绩
B.坚持每天吃早餐的人数与患胃病的人数
C.气温与冷饮销售量
D.电瓶车的质量和行驶每千米的耗电量
6.(多选题)在某地区随机抽取了8对母女的身高数据,如下表:
母亲身高x/cm 154 157 158 159 160 161 162 163
女儿身高y/cm 155 156 159 162 161 164 165 166
下列说法正确的有(  )
A.变量y与变量x呈负相关
B.变量x和变量y的相关系数r约为0.963
C.关于均值为零点()平移后的新样本数据(x1-,y1-),(x2-,y2-),…,(x8-,y8-)与原始样本数据相关性完全相同
D.用相关系数r可以估计总体两个变量的相关系数
7.若已知(yi-)2是(xi-)2的4倍,(xi-)·(yi-)是(xi-)2的1.5倍,则相关系数r的值为    .
8.在一组样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x-3上,则这组样本数据的相关系数r=    .
9.某零售店近5个月的销售额和利润额资料如下表所示:
商店名称
A B C D E
销售额x/千万元 3 5 6 7 9
利润额y/百万元 2 3 3 4 5
(1)根据上表数据作出散点图.
(2)观察散点,判断利润额y关于销售额x是否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关
10.某网站统计了某网红螺蛳粉在2022年7月至11月的总销售量y(单位:万袋),得到以下数据:
月份x 7 8 9 10 11
销售量y 10 12 11 12 20
根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系
午练25 变量的相关性
1.D ①是函数关系,②是相关关系,③是相关关系,④不具有相关关系.
2.B 由r=-0.9962可知,x与y负相关,并且具有较强的线性相关关系.
3.A r1,r3都是正线性相关,所以r1>0,r3>0,并且相关性r1最强,所以r1>r3;
r2,r4都是负线性相关,所以r2<0,r4<0,且r2相关性强,所以|r2|>|r4|,所以r2所以r2故选A.
4.C 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可知变量Y与X之间是正相关,所以r1>0,变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可知U与V之间为负相关,所以r2<0,则r2<05.CD 对于A,学生的学籍号与学生的数学成绩没有相关关系;对于B,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于C,一般情况下,气温与冷饮销售量成正相关关系;对于D,一般情况下,电瓶车的质量和行驶每千米的耗电量成正相关关系.
6.BCD r==≈0.963,B正确;由r≈0.963>0,知变量y与变量x呈正相关关系,A错误;平移后的新样本数据所对应平面直角坐标系中的散点图与原始样本数据所对应的散点图形状完全一致,故相关性完全相同,C正确;根据统计学思想,D正确.故选BCD.
7. 由r=,得r=.
8.-1 由所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x-3上,可得这两个变量是负相关,这组样本数据的相关系数为负值,且有|r|=1,所以其相关系数r=-1.
9.解 (1)散点图如图所示:
(2)由散点图可知,所有散点接近一条直线排列,
所以利润额与销售额是线性相关关系.
由图可知当销售额增加时,利润额呈现增加的趋势,所以是正相关.
10.解 由已知得=9,=13,
(xi-)2=10,(yi-)2=64,(xi-)(yi-)=22,∴r===≈0.870,
∵|r|≈|0.870|∈[0.7,1],
说明y与x的线性相关关系很强,∴可用线性回归模型拟合y与x的关系.午练26 线性回归方程
1.给出下列说法:①回归直线x+恒过样本点的中心(),且至少过一个样本点;②两个变量相关性越强,则相关系数|r|就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程=2-0.5x中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位.其中说法正确的是(  )
             
A.①②④ B.②③④
C.①③④ D.②④
2.某产品的零售价x(元)与每天的销售量y(个)统计如下表:
x 6 7 8 9
y 40 31 24 21
据上表可得回归直线方程为=-6.4x+,则=(  )
A.75.8 B.76.4
C.77 D.75.2
3.在一次实验中,测得(x,y)的五组数值如下表所示:
x 0 1 2 3 4
y 10 15 20 30 35
经计算知,y对x的线性回归方程是=6.5x+,预测当x=6时,=(  )
A.47.5 B.48 C.49 D.49.5
4.某能源汽车制造公司近5年的利润如下表所示:
第x年 1 2 3 4 5
利润y(亿元) 2 3 4 m 7
已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为=1.2x+0.6,则第四年的随机误差为(  )
A.-0.4 B.0 C.0.4 D.4.8
5.(多选题)下列有关回归直线方程x+的叙述正确的有(  )
A.反映与x之间的函数关系
B.反映y与x之间的函数关系
C.表示与x之间不确定关系
D.表示最接近与x之间真实关系的一条直线方程
6.(多选题)某地为响应“扶知识、扶技术、扶方法”的号召,建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如下表:
年份 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5
年借阅量y(万册) 4.9 5.1 5.5 5.7 5.8
根据上表,可得y关于x的线性回归方程为=0.24x+,则下列说法正确的有(  )
A.=4.68
B.根据上面的数据作出散点图,则5个点中至少有1个点在回归直线上
C.y与x的相关系数r>0
D.2023年的借阅量一定不少于6.12万册
7.已知x,y之间具有线性相关关系,若通过10组数据(xi,yi)(i=1,2,…,10)得到的回归方程为=-2.2x+5,且xi=20,则yi=    . 
8.为了研究高三(1)班女生的身高x(单位:cm)与体重y(单位:kg)的关系,从该班随机抽取10名女生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为x+.已知xi=1 600,yi=460,=0.85,若该班某女生的身高为170 cm,则据此估计其体重为    kg.
9.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下表所示.
零件数x/个 10 20 30 40 50 60 70 80 90 100
加工时间y/min 62 68 75 81 89 95 102 108 115 122
(1)画出散点图.
(2)建立加工时间关于零件数的一元线性回归模型(精确到0.001).
(3)关于加工零件的个数与加工时间,你能得出什么结论
10.某校成立了生物兴趣小组,该兴趣小组为了探究一定范围内的温度x与豇豆种子发芽数y之间的关联,在5月份进行了为期一周的实验,实验数据如下表:
日期 星期一 星期二 星期三 星期四 星期五 星期六 星期日
温度x/℃ 20 21 23 15 25 17 19
发芽数y/个 25 27 30 19 31 21 22
该兴趣小组确定的研究方案如下:先从这7组数据中任选5组数据建立y关于x的线性回归方程,并用该方程对剩下的2组数据进行检验.
(1)若选取的是星期一、二、三、六、日这5天的数据,则求出y关于x的线性回归方程.
(2)若由线性回归方程得到的估计数据与选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠
附:回归直线的斜率和截距的最小二乘估计公式分别为. 
午练26 线性回归方程
1.B 对于①,回归直线=x+恒过样本点的中心(,),但不一定过一个样本点,所以不正确;
对于②,根据相关系数的意义,可得两个变量相关性越强,则相关系数|r|就越接近1,所以正确;
对于③,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以正确;
对于④,根据回归系数的含义,可得在回归直线方程=2-0.5x中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位,所以正确.
故选B.
2.C 由题意可得==7.5,
==29,
则-6.4×7.5+=29,解得=77.
故选C.
3.B 因为==2,
==22,
所以样本点的中心为(2,22),代入=6.5x+中,得22=6.5×2+ =9,即=6.5x+9,
当x=6时,=6.5×6+9=48.
故选B.
4.A ==3,==,所以样本点的中心为3,.将其代入回归直线方程中,得=4.2 m=5,当x=4时,y=1.2×4+0.6=5.4,所以第四年的随机误差为5-5.4=-0.4.
故选A.
5.AD =x+表示与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系,故选AD.
6.AC 由表可知=×(1+2+3+4+5)=3,=×(4.9+5.1+5.5+5.7+5.8)=5.4,
所以=-0.24=5.4-0.24×3=4.68,所以A正确;
因为y=0.24x+4.68,把x=1,2,3,4,5分别代入方程可得y=4.92,5.16,5.4,5.64,5.88,
所以B不正确;
因为0.24>0,所以y与x的相关系数r>0,所以C正确;2023年的代码是6,代入可得y=6.12,
根据回归方程得出的仅仅是预测值,所以D不正确.
故选AC.
7.6 ∵xi=20,∴=xi=2,
∵回归方程为=-2.2x+5,
∴=-2.2×2+5=0.6,∴yi=10×0.6=6,
故答案为6.
8.54.5 =xi=160,=yi=46,
故46=0.85×160+,解得=-90,
故回归直线方程为=0.85x-90,则当x=170时,=0.85×170-90=54.5(kg).
故答案为54.5.
9.解 (1)画出散点图如下图所示.
(2)=55,=91.7,
==≈0.668,
=-·=91.7-×55≈54.933,
所以=0.668x+54.933.
(3)根据回归直线方程可知,每多加工1个零件,需要增加0.668分钟加工时间.
10.解 (1)由数据得=20,=25.
因为(xi-)(yi-)=32,=20,
所以==,
所以=-=25-×20=-7,
所以y关于x的线性回归方程为=x-7.
(2)由(1)知,y关于x的线性回归方程为=x-7.
当x=15时,=×15-7=17,|19-17|≤2,
当x=25时,=×25-7=33,|33-31|≤2,
故所得到的线性回归方程=x-7是可靠的.午练27 独立性检验
1.考查棉花种子经过处理跟生病之间的关系得到下表数据:
项目 种子处理 种子未处理 总计
得病 32 101 133
不得病 192 213 405
总计 224 314 538
根据以上数据,则(  )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
2.下面是一个2×2列联表:
y1 y2 总计
x1 a 21 73
x2 8 25 33
总计 b 46
则表中a,b处的值分别为(  )
             
A.94,96 B.52,50
C.52,60 D.54,52
3.某班主任对全班50名学生进行了作业量的评价调查,所得数据如下表所示:
认为作业量大 认为作业量不大 合计
男生 18 9 27
女生 8 15 23
合计 26 24 50
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025,则认为“作业量的大小与学生的性别有关”的犯错误的概率不超过(  )
A.0.01 B.0.025
C.0.10 D.无充分证据
4.在某次独立性检验中,得到如下列联表:
A 总计
B 200 800 1 000
180 a 180+a
总计 380 800+a 1 180+a
若最后发现,没有90%的把握认为A与B有关,则a的值可能是(  )
A.300 B.400
C.500 D.600
5.(多选题)下列说法正确的有(  )
A.公式LW=8中的L和W具有相关关系
B.回归直线x+恒过样本点的中心() 
C.相关系数r的绝对值越接近1,则两个变量的相关性越强
D.对分类变量x与y的随机变量χ2来说,χ2越小,判断“x与y有关系”的把握越大
6.(多选题)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,随机观察了他所在地区的100天中的“日落云里走”的情况和后半夜天气情况,得到如下数据:
下雨 未下雨 合计
出现 25 5 30
未出现 25 45 70
合计 50 50 100
并计算得到χ2≈19.05,则小波对该地区天气的判断正确的有(  )
A.后半夜下雨的概率约为
B.未出现“日落云里走”时,后半夜下雨的概率为
C.有99%的把握认为“‘日落云里走’是否出现”与“后半夜是否下雨”有关
D.若出现“日落云里走”,则后半夜有99%的可能会下雨
7.如下是一个2×2列联表,则m+n=    .
x y 合计
y1 y2
x1 a 35 45
x2 7 b n
合计 m 73 s
8.江苏省从2021年开始将全面推行新高考制度,新高考“3+1+2”中的“1”要求考生从物理、历史中选一科,为了判断学生选修历史、物理与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
物理 历史
男 13 10
女 7 20
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据公式χ2=,则我们有    %把握认为选科与性别有关系.
9.打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:
患心脏病 未患心脏病 合计
每一晚都打鼾 30 224 254
不打鼾 24 1355 1379
合计 54 1579 1633
根据独立性检验,能否有99.9%的把握认为每一晚都打鼾与患心脏病有关系
附:χ2=.
P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001
x0 3.841 5.024 6.635 7.879 10.828
10.有人发现了一个有趣的现象,中国人的邮箱名称里含有数字比较多,而外国人邮箱名称里含有数字比较少.为了研究国籍和邮箱名称里含有数字多少的关系,小明收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立2×2列联表.
(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关联,你能帮他判断一下吗
附:
P(χ2≥x0) 0.15 0.10 0.05 0.025 0.010
x0 2.072 2.706 3.841 5.024 6.635
午练27 独立性检验
1.C 由列联表中的数据可知,种子经过处理,得病的比例明显降低,种子未经过处理,得病的比例要高些,所以可得结论,种子是否经过处理跟是否生病有关.
故选C.
2.C ∵a+21=73,∴a=52,∴b=a+8=52+8=60.
3.B 由表中数据可得χ2=≈5.059>5.024, 
所以有97.5%的把握认为“作业量的大小与学生的性别有关”,即犯错误的概率不超过0.025.故选B.
4.D 当a=300时,χ2=≈52.048>2.706, 
所以有90%的把握认为A与B有关;
当a=400时,χ2=≈24.469>2.706,
所以有90%的把握认为A与B有关;
当a=500时,χ2=≈9.682>2.706,
所以有90%的把握认为A与B有关;
当a=600时,χ2=≈2.471<2.706,
所以没有90%的把握认为A与B有关.
故选D.
5.BC 对于A,在公式LW=8中,L和W关系明确,属于函数关系,不是相关关系,相关关系是一种非确定的关系,故A错误;对于B,回归直线=x+恒过样本点的中心(,),故B正确;对于C,相关系数r的绝对值越接近1,则两个变量的相关性越强,故C正确;对于D,对分类变量x与y,它们的随机变量χ2越大,判断“x与y有关系”的把握越大,故D错误.故选BC.
6.AC 由题意,把频率看作概率,可得后半夜下雨的概率约为=,故A判断正确;未出现“日落云里走”时,后半夜下雨的概率为=,故B判断错误;由χ2≈19.05>6.635,知有99%的把握认为“‘日落云里走’是否出现”与“后半夜是否下雨”有关,故C判断正确;易知D判断错误.
  7.62 根据2×2列联表可知a+35=45,解得a=10,
则m=a+7=17.又由35+b=73,解得b=38,
则n=7+b=45,故m+n=17+45=62.
故答案为62.
8.95 根据表中数据,得到χ2=≈4.844>3.841,∴我们有95%的把握认为选科与性别有关系.故答案为95.
9.解 提出假设H0:每一晚打鼾与患心脏病无关系.
由列联表中的数据,得
χ2=≈68.033>10.828.
因为当H0成立时,χ2≥10.828的概率为0.001,
所以我们有99.9%的把握认为每一晚都打鼾与患心脏病有关系.
10.解 (1)2×2的列联表如下:
中国人 外国人 合计
含数字 43 27 70
无数字 21 33 54
合计 64 60 124
  (2)提出假设H0:国籍和邮箱名称里是否含有数字无关联.
由表中数据得χ2=≈6.201>5.024.
因为当H0成立时,χ2≥5.024的概率约为0.025,所以我们有97.5%的把握认为国籍和邮箱名称里是否含有数字有关联.