中小学教育资源及组卷应用平台
变量间的相关关系(解答题)
一.解答题(共20小题)
1.两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,判断它们是否有相关关系;若具有相关关系,说出它们相关关系的区别.
表1
A 26 18 13 10 4 ﹣1
B 20 24 34 38 50 64
表2
C 0 5 10 15 20 25 30 35
D 541.67 602.66 672.09 704.99 806.71 908.59 975.42 1034.75
2.根据变量x,y的观测数据可得散点图(1);根据变量u,v的观测数据可得散点图(2).由这两个散点图判断x与y,u与v之间的相关关系类型(即指出是正相关还是负相关).
3.为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y=C1x2+C2与模型②:y作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃ 20 22 24 26 28 30 32
产卵数y/个 6 10 21 24 64 113 322
t=x2 400 484 576 676 784 900 1024
Z=lny 1.79 2.30 3.04 3.18 4.16 4.73 5.77
26 692 80 3.57
1157.54 0.43 0.32 0.00012
其中ti=xi2,,zi=lnyi,,
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为:β,αβ.
(1)分别画出y关于t的散点图、z关于x的散点图,根据散点图判断哪一个模型更适宜作为回归方程类型?(给出判断即可,不必说明理由).
(2)根据表中数据,分别建立两个模型下建立y关于x的回归方程;并在两个模型下分别估计温度为30℃时的产卵数.(C1,C2,C3,C4与估计值均精确到小数点后两位)(参考数据:e4.65≈104.58,e4.85≈127.74,e5.05≈156.02)
(3)若模型①、②的相关指数计算分别为R12=0.82,R22=0.96,请根据相关指数判断哪个模型的拟合效果更好.
4.已知某校5个学生的数学和物理成绩如下表:
学生的编号i 1 2 3 4 5
数学xi 80 75 70 65 60
物理yi 70 66 68 64 62
(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?
(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系的,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y与x的回归方程;
(3)利用残差分析回归方程的拟合效果,若残差和在(﹣0.1,0.1)范围内,则称回归方程为“优拟方程”,问:该回归方程是否为“优拟方程”.
参考数据和公式:,其中,;,
残差和公式为:.
5.现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如表所示.
学生号 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108
y 84 64 84 68 69 68 69 46 57 71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:若|r|>0.75,则我们可以认为y与x之间具有较强的线性相关关系.
6.2023年3月6日,中华人民共和国国务院新闻办公室举行“权威部门话开局”系列主题新闻发布会,介绍“加快推进新型工业化做强做优做大实体经济”有关情况.经综合研判,今年我国新能源汽车产业将保持良好的发展态势,生产和销售将实现稳定增长.据统计,去年10月至今年2月某品牌新能源汽车的市场销售量如下表.
月份x 10月 11月 12月 1月 2月
销售量y/万辆 0.6 0.7 1.0 1.3 1.6
(1)根据数据作出散点图;
(2)判断x与y之间的相关关系.
7.某人统计了同一个省6个城市某一年的人均国民生产总值(即人均GDP)(单位:万元)和这一年各城市患白血病的儿童数量,如表:
城市 A B C D E F
人均GDP/万元 10 8 6 4 3 1
患白血病的儿童数 351 312 207 175 132 180
画出散点图,并判定人均GDP(设为变量x)与患白血病的儿童数量(设为变量y)之间是否具有线性相关关系.
8.如表是随机抽取的9名15岁男生的身高、体重:
编号 1 2 3 4 5 6 7 8 9
身高/cm 165 157 155 175 168 157 178 160 163
体重/kg 52 44 45 55 54 47 62 50 53
判断这两个变量之间是否存在相关关系.
9.如表为某十个地区某年1月平均气温与海拔及纬度的数据,试分析1月平均气温与海拔之间、1月平均气温与纬度之间是否具有相关关系(结果保留三位小数).
平均气温xi/℃ 0.84 2.22 3.42 4.92 6.9 8.58 9.54 9.9 11.7 12.66
海拔yi/m 4650 4420 4220 3970 3640 3360 3200 3140 2840 2680
纬度zi 35.3 33.8 35 33.8 32.2 38.9 37.1 38.4 36.3 36.8
10.对下面这组数据:
x 1 2 3 4 10 10
y 1 3 3 5 1 11
计算相关系数,大概在0.5左右.对这组数据大部分点来说,x与y之间有很强的线性相关关系,是什么因素导致相关系数只有0.5左右?
11.试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的耗油量与行驶速度;
(3)真空中自由降落的小球的位移(单位:m)与时间(单位:s);
(4)空气中污染物浓度(单位:μg/m3)与日降雨量(单位:cm).
12.判断下列两个变量之间是否具有相关关系:
(1)家庭月用电量与月平均气温;
(2)一天中的最高气温与最低气温;
(3)某企业生产的一种商品的销量与其广告费用;
(4)谷物的价格与牛肉的价格;
(5)在公式LW=12中的L与W.
13.下列几对变量,哪些有明显的正相关、明显的负相关、接近于0的相关系数?
(1)广告费与销售额;
(2)施肥量与粮食产量;
(3)汽车车速与司机的年龄;
(4)人的体重与身高.
14.近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.
(1)该校教职工有410人,高二学生有620人,高三学生有610人,
①用分层抽样的方法,求高一学生每天抽检人数;
②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级,你认为哪种方案更合理,并给出理由.
(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:
第x天 1 2 3 4 5
用时y(小时) 1.2 1.2 1.1 1.0 1.0
①计算变量x和y的相关系数r(精确到0.01),并说明两变量线性相关的强弱.
②根据①中的计算结果,判定变量x和y是正相关,还是负相关,并给出可能的原因.
参考数据和公式:3.16,相关系数r.
15.在随机调查某校高三男生的身高和臂展时,得到数据:
身高x/cm 176 171 165 178 169 172 176 168 173 171 180 191 179
臂展y/cm 169 162 164 170 172 170 181 161 174 164 182 188 182
(1)绘制身高与臂展的散点图,初步判断二者之间的关系;
(2)判断身高x与臂展y之间的相关关系(结果保留两位小数).
16.下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系?如果是,那么这种相关关系有什么特点?
地区 A B C D E F G H I J K
海拔高度/m 1250 1158 1067 457 701 731 610 670 1493 762 549
鸟的种类/种 36 30 37 11 11 13 17 13 29 4 15
17.随机抽取7家超市,得到其广告支出与销售额数据如下:
超市 A B C D E F G
广告支出/万元 1 2 4 6 10 14 20
销售额/万元 19 32 44 40 52 53 54
请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
18.某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
x 2 4 5 6 8
y 30 40 60 50 70
(Ⅰ)画出散点图;
(Ⅱ)求回归直线方程;
(Ⅲ)试预测广告费支出为10万元时,销售额多大?
19.已知x,y之间的一组数据如表:
x 1 3 6 7 8
y 1 2 3 4 5
(1)分别从集合A=1,3,6,7,8,B=1,2,3,4,5中各取一个数x,y,求x+y≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为与,试根据残差平方和:的大小,判断哪条直线拟合程度更好.
20.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下:
航空公司编号 1 2 3 4 5 6 7 8 9 10
航班正点率/% 81.8 76.8 76.6 75.7 73.8 72.2 71.2 7.08 91.4 68.5
顾客投诉/次 21 58 85 68 74 93 72 122 18 125
顾客投诉次数和航班正点率之间是否呈现出线性相关关系?它们之间的相关程度如何?变化趋势有何特征?
变量间的相关关系(解答题)
参考答案与试题解析
一.解答题(共20小题)
1.两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,判断它们是否有相关关系;若具有相关关系,说出它们相关关系的区别.
表1
A 26 18 13 10 4 ﹣1
B 20 24 34 38 50 64
表2
C 0 5 10 15 20 25 30 35
D 541.67 602.66 672.09 704.99 806.71 908.59 975.42 1034.75
【分析】在坐标系中画出散点图,即可判断变量是否具有线性相关关系.
【解答】解:散点图分别如图1和图2所示:
从图中可以看出两图中的点都分布在一条曲线附近,因此两图中的变量都具有相关关系,
图(1)中A的值由大变小时,B的值却是由小变大,
图(2)中C的值由小变大时,D的值却是由小变大.
【点评】本题考查散点图,属于基础题.
2.根据变量x,y的观测数据可得散点图(1);根据变量u,v的观测数据可得散点图(2).由这两个散点图判断x与y,u与v之间的相关关系类型(即指出是正相关还是负相关).
【分析】根据正相关以及负相关的含义作判断.
【解答】解:在回归与相关分析中,因变量值随自变量值的增大(减小)而增大(减小),
在这种情况下,因变量和自变量的相关系数为正值,即正相关.散点图(1)y值随x值的增大而增大,因此x与y之间正相关;
在回归与相关分析中,因变量值随自变量值的增大(减小)而减小(增大),
在这种情况下,因变量和自变量的相关系数为负值,即负相关.散点图(2)v值随u值的增大而减小,因此v与u之间负相关.
【点评】本题考查正相关以及负相关的含义,考查基本分析判断能力,属基础题.
3.为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y=C1x2+C2与模型②:y作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃ 20 22 24 26 28 30 32
产卵数y/个 6 10 21 24 64 113 322
t=x2 400 484 576 676 784 900 1024
Z=lny 1.79 2.30 3.04 3.18 4.16 4.73 5.77
26 692 80 3.57
1157.54 0.43 0.32 0.00012
其中ti=xi2,,zi=lnyi,,
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为:β,αβ.
(1)分别画出y关于t的散点图、z关于x的散点图,根据散点图判断哪一个模型更适宜作为回归方程类型?(给出判断即可,不必说明理由).
(2)根据表中数据,分别建立两个模型下建立y关于x的回归方程;并在两个模型下分别估计温度为30℃时的产卵数.(C1,C2,C3,C4与估计值均精确到小数点后两位)(参考数据:e4.65≈104.58,e4.85≈127.74,e5.05≈156.02)
(3)若模型①、②的相关指数计算分别为R12=0.82,R22=0.96,请根据相关指数判断哪个模型的拟合效果更好.
【分析】(1)画出y关于t的散点图和z关于x的散点图,结合图形判断模型②更适宜作为回归方程类型;
(2)计算模型①的回归系数,写出回归方程,求出x=30时的值;
计算模型②的回归系数,写出回归方程,求出x=30时的值即可;
(3)根据判断模型②的拟合效果更好.
【解答】解:(1)画出y关于t的散点图如图1,
画出z关于x的散点图如图2;
根据散点图可以判断模型②更适宜作为回归方程类型;
(2)对于模型①,设t=x2,则y=C1x2+C2=C1t+C2,
计算C10.43,
C2C180﹣0.43×692=﹣217.56,
∴所求回归方程为0.43x2﹣217.56,
当x=30时,估计温度为0.43×302﹣217.56=169.44;
对于模型②,设y,
则z=lny=C3x+C4,
计算C30.32,
C4C33.57﹣0.32×26=﹣4.75,
∴所求回归方程为0.32x﹣4.75,
即e0.32x﹣4.75;
当x=30时,估计温度为e0.32×30﹣4.75≈127.74;
(3)∵R12=0.82,R22=0.96,
∴,
∴模型②的拟合效果更好.
【点评】本题考查了散点图以及回归方程和相关指数的应用问题,也考查了分析与判断能力的应用问题,是综合性题目.
4.已知某校5个学生的数学和物理成绩如下表:
学生的编号i 1 2 3 4 5
数学xi 80 75 70 65 60
物理yi 70 66 68 64 62
(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?
(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系的,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y与x的回归方程;
(3)利用残差分析回归方程的拟合效果,若残差和在(﹣0.1,0.1)范围内,则称回归方程为“优拟方程”,问:该回归方程是否为“优拟方程”.
参考数据和公式:,其中,;,
残差和公式为:.
【分析】(1)本题是一个等可能事件的概率,试验发生包含的事件是A55,满足条件的事件是恰好有两个是自己的实际分,共有2C55,根据等可能事件的概率得到结果.
(2)分别做出横标和纵标的平均数,利用最小二乘法做出b的值,再做出a的值,写出线性回归方程,得到结果.
(3)做出残差平方差,得到结果是0,根据所给的残差平方和的范围,得到所求的线性回归方程是一个优拟方程.
【解答】解:(1)由题意知本题是一个等可能事件的概率,
试验发生包含的事件是A55﹣1=119
满足条件的事件是恰好有两个是自己的实际分,共有2C52,
∴恰有两个人是自己的实际分的概率是.
(2)70,66,
b0.36,
a=40.8,
∴回归直线方程为0.36x+40.8.
(3)0.36x+40.8,
0.36×80+40.8=69.6,0.36×75+40.8=67.8,
0.36×70﹣40.8=66,0.36×65+40.8=64.2,
0.36×60+40.8=62.4,
∴(70﹣69.6)+(66﹣67.8)+(68﹣66)+(64﹣64.2)+(62﹣62.4)=0,
∵残差和公式为:0,
∵0∈(﹣0.1,0.1),
∴回归方程为优拟方程.
【点评】本题考查变量间的相关关系,考查回归分析的应用,考查新定义问题,是一个基础题,注意题目的数字运算不要出错.
5.现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如表所示.
学生号 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108
y 84 64 84 68 69 68 69 46 57 71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:若|r|>0.75,则我们可以认为y与x之间具有较强的线性相关关系.
【分析】根据已知条件,结合相关系数的公式,即可求解.
【解答】解:由表中的数据可得,
(120+108+…+99+108)=107.8,
(84+64+…+57+71)=68,
1202+1082+…+992+1082=116584,
842+642+…+572+712=47384,
120×84+108×64+…+108×71=73796,
故相关系数r0.7506>0.75,
故这10名学生的两次数学成绩具有较强的线性相关关系.
【点评】本题主要考查相关系数的求解,需要学生熟练掌握公式,属于基础题.
6.2023年3月6日,中华人民共和国国务院新闻办公室举行“权威部门话开局”系列主题新闻发布会,介绍“加快推进新型工业化做强做优做大实体经济”有关情况.经综合研判,今年我国新能源汽车产业将保持良好的发展态势,生产和销售将实现稳定增长.据统计,去年10月至今年2月某品牌新能源汽车的市场销售量如下表.
月份x 10月 11月 12月 1月 2月
销售量y/万辆 0.6 0.7 1.0 1.3 1.6
(1)根据数据作出散点图;
(2)判断x与y之间的相关关系.
【分析】(1)根据表格信息画出散点图即可;
(2)根据散点图判断即可.
【解答】解:(1)作出散点图如下:
(2)由散点图可知,5组样本数据呈正相关关系.
【点评】本题主要考查了散点图的应用,考查了变量间的相关关系,属于基础题.
7.某人统计了同一个省6个城市某一年的人均国民生产总值(即人均GDP)(单位:万元)和这一年各城市患白血病的儿童数量,如表:
城市 A B C D E F
人均GDP/万元 10 8 6 4 3 1
患白血病的儿童数 351 312 207 175 132 180
画出散点图,并判定人均GDP(设为变量x)与患白血病的儿童数量(设为变量y)之间是否具有线性相关关系.
【分析】首先根据已知表格中的数据画出散点图,再根据散点图可知,有5个点大致分布在一条直线的附近,即可得出结论.
【解答】解:根据表中数据画散点图,如图所示:
从图中可以看出,有5个点大致分布在一条直线的附近,
所以这两个变量具有线性相关关系.
【点评】本题主要考查了两个变量间的线性相关关系,考查了散点图的应用,属于基础题.
8.如表是随机抽取的9名15岁男生的身高、体重:
编号 1 2 3 4 5 6 7 8 9
身高/cm 165 157 155 175 168 157 178 160 163
体重/kg 52 44 45 55 54 47 62 50 53
判断这两个变量之间是否存在相关关系.
【分析】以x轴表示身高,以y轴表示体重,得到相应的散点图,再根据散点图判断即可.
【解答】解:以x轴表示身高,以y轴表示体重,得到相应的散点图,如图所示,
我们会发现,随着身高的增加,体重基本上呈增长的趋势,所以体重与身高之间存在相关关系,并且是正相关.
【点评】本题主要考查了两个变量相关关系的判断,属于基础题.
9.如表为某十个地区某年1月平均气温与海拔及纬度的数据,试分析1月平均气温与海拔之间、1月平均气温与纬度之间是否具有相关关系(结果保留三位小数).
平均气温xi/℃ 0.84 2.22 3.42 4.92 6.9 8.58 9.54 9.9 11.7 12.66
海拔yi/m 4650 4420 4220 3970 3640 3360 3200 3140 2840 2680
纬度zi 35.3 33.8 35 33.8 32.2 38.9 37.1 38.4 36.3 36.8
【分析】求出平均数,,,将成对数据分别以(,)、(,)为零点进行平移,作出散点图,观察分析相关性.
【解答】解:依题意,气温x的平均数xi≈12.7333,
海拔y的平均数yi≈3371.6667,
纬度z的平均数xi≈35.8417,
将成对数据(x1,y1),(x2,y2),…,(x12,y12)以为零点进行平移,
得到平移后的成对数据,,,,…,,,
作出其散点图得气温与海拔的散点图,如图:
将成对数据(x1,z1),(x2,z2),…,(x12,z12)以为零点进行平移,
得到平移后的成对数据,,…,,
作出其散点图得气温与纬度的散点图,如图:
观察散点图知,气温与海拔的散点图中的点大多数分布在第一、三象限,呈一定的正相关性,相关关系一般,
气温与纬度的散点图在4个象限均有,并且很散,气温与纬度相关关系很弱.
【点评】本题主要考查变量间的相关关系,属于基础题.
10.对下面这组数据:
x 1 2 3 4 10 10
y 1 3 3 5 1 11
计算相关系数,大概在0.5左右.对这组数据大部分点来说,x与y之间有很强的线性相关关系,是什么因素导致相关系数只有0.5左右?
【分析】根据各对数据之间的关系进行说明.
【解答】解:这组数据共有6对数据,第1,2,3,4,6对数据相关性很强,
绝对值在1以内,但第5对数据相差很大,两个数据相差9,
在散点图中,第1,2,3,4,6对数据对应的点几乎在一条直线附近,
而第5对数据对应的点远远偏移这条直线,
在计算相关系数时,对结果影响较大,
从而得出相关系数大约为0.5.
【点评】本题考查相关关系等基础知识,考查运算求解能力,是基础题.
11.试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的耗油量与行驶速度;
(3)真空中自由降落的小球的位移(单位:m)与时间(单位:s);
(4)空气中污染物浓度(单位:μg/m3)与日降雨量(单位:cm).
【分析】(1)根据相关关系的定义判断;
(2)根据相关关系的定义判断;
(3)根据相关关系的定义判断;
(4)根据相关关系的定义判断.
【解答】解:(1)商品的销售价格与其供应量之间具有相关关系,一般来说,在品质相当的情况下,供应量越大,价格就越低;供应量越小,价格就越高,某些品牌商品限量供应,就是保持较高价位的销售策略;
(2)汽车的耗油量与行驶速度之间具有相关关系,通常情况下,当速度很慢或速度很快时,耗油较多,而在中等车速(不同的汽车范围不一定一样)时,速度稍高,耗油反而较少;
(3)根据自由落体运动方程,自由降落的小球的位移与时间之间是函数关系;
(4)空气中污染物浓度与日降雨量之间具有相关关系,通常情况下,降雨量越大,空气中污染物浓度就越低.
【点评】本题主要考查了两变量间的相关关系,属于基础题.
12.判断下列两个变量之间是否具有相关关系:
(1)家庭月用电量与月平均气温;
(2)一天中的最高气温与最低气温;
(3)某企业生产的一种商品的销量与其广告费用;
(4)谷物的价格与牛肉的价格;
(5)在公式LW=12中的L与W.
【分析】根据相关关系的定义逐一判断即可.
【解答】解:(1)月平均气温的高低不受家庭月用电量的影响,两个变量之间不具有相关关系;
(2)一天中的最高气温不受最低气温的影响,两个变量之间不具有相关关系;
(3)企业生产的一种商品的销量除了受其广告费用影响,还受其它因素影响,比如商品的质量等,因此这两个变量之间具有相关关系;
(4)谷物的价格不受牛肉的价格影响,两个变量之间不具有相关关系;
(5)在公式LW=12中,给定L一个值,W有唯一确定的值与之对应,是函数关系,不具有相关关系.
【点评】本题主要考查了变量间的相关关系,属于基础题.
13.下列几对变量,哪些有明显的正相关、明显的负相关、接近于0的相关系数?
(1)广告费与销售额;
(2)施肥量与粮食产量;
(3)汽车车速与司机的年龄;
(4)人的体重与身高.
【分析】(1)根据相关关系的定义判断;
(2)根据相关关系的定义判断;
(3)根据相关关系的定义判断;
(4)根据相关关系的定义判断.
【解答】解:(1)广告费用高了,销售额也高了,因此是正相关;
(2)合理范围内,施肥量大,粮食产量高,它们是正相关;
(3)汽车车速与司机的年龄之间相关关系不太明显,是接近于0的相关系数;
(4)在一定范围内,身高越高,体重越大,它们是正相关.
【点评】本题主要考查了变量间的相关关系,属于基础题.
14.近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.
(1)该校教职工有410人,高二学生有620人,高三学生有610人,
①用分层抽样的方法,求高一学生每天抽检人数;
②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级,你认为哪种方案更合理,并给出理由.
(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:
第x天 1 2 3 4 5
用时y(小时) 1.2 1.2 1.1 1.0 1.0
①计算变量x和y的相关系数r(精确到0.01),并说明两变量线性相关的强弱.
②根据①中的计算结果,判定变量x和y是正相关,还是负相关,并给出可能的原因.
参考数据和公式:3.16,相关系数r.
【分析】(1)①首先求出高一年级的总人数,即可求出高一学生每天抽检人数;②显然分散抽检更合理;
(2)①根据相关系数公式求出r,即可判断线性相关关系;②根据相关系数的正负判断即可,再给出合理解析即可;
【解答】(1)解:①高一学生每天抽检人数为(人);
②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛査工作;
(2)解:①,
所以,,
变量x和y的相关系数为,
因为|r|>0.75,可知两变量线性相关性很强;
(2)由r<0可知变量x和y是负相关;
可能的原因:随着抽检工作的开展,学校相关管理协调工作效率提高,因此用时缩短;
【点评】本题考查了分层抽样,相关系数r的作用,属于中档题.
15.在随机调查某校高三男生的身高和臂展时,得到数据:
身高x/cm 176 171 165 178 169 172 176 168 173 171 180 191 179
臂展y/cm 169 162 164 170 172 170 181 161 174 164 182 188 182
(1)绘制身高与臂展的散点图,初步判断二者之间的关系;
(2)判断身高x与臂展y之间的相关关系(结果保留两位小数).
【分析】(1)根据给定数据画出散点图,再作大致判断作答.
(2)计算x,y之间的相关系数,利用相关系数的大小作出判断作答.
【解答】解:(1)身高与臂展的散点图如下:
初步判断身高与臂展呈线性相关关系,臂展随着身高的增加而增加.
(2)身高的平均数 (176+171+…+191+179)≈174.5,
臂展的平均值172.2,
,
所以身高与臂展的相关系数 ,
说明x与y具有很强的线性相关关系.
【点评】本题考查了散点图的应用以及相关系数的计算与应用,属于中档题.
16.下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系?如果是,那么这种相关关系有什么特点?
地区 A B C D E F G H I J K
海拔高度/m 1250 1158 1067 457 701 731 610 670 1493 762 549
鸟的种类/种 36 30 37 11 11 13 17 13 29 4 15
【分析】由表中数据计算相关系数即可得出结果.
【解答】解:设鸟的种类数为y,海拔高度为x,
,
,
∴,
当r>0时,且0.75<r≤1时,两变量正相关,相关性较强,
所以由数据可知,鸟类的种数随海拔高度增加而增加,两者呈正相关,相关性较强.
【点评】本题考查了相关系数的应用,属于中档题.
17.随机抽取7家超市,得到其广告支出与销售额数据如下:
超市 A B C D E F G
广告支出/万元 1 2 4 6 10 14 20
销售额/万元 19 32 44 40 52 53 54
请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
【分析】作出成对数据的散点图,由数据计算相关系数即可得出结果.
【解答】解:成对数据的散点图如图所示:
从散点图上可得,超市的销售额与广告支出之间呈现出线性相关关系,
由数据可得,
,
,
∴,
由此可推断,销售额与广告支出之间具有相关关系,相关程度较强,且销售额与广告支出的变化趋势相同.
【点评】本题考查了散点图和变量间的相关关系,属于中档题.
18.某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
x 2 4 5 6 8
y 30 40 60 50 70
(Ⅰ)画出散点图;
(Ⅱ)求回归直线方程;
(Ⅲ)试预测广告费支出为10万元时,销售额多大?
【分析】本题考查的知识点是散点图及回归直线方程的求法,
(1)根据表中数据描点即可得到散点图.
(2)由表中数据,我们不难求出x,y的平均数,及xi2的累加值,及xiyi的累加值,代入回归直线系数计算公式,即可求出回归直线方程.
(3)将预报值10万元代入回归直线方程,解方程即可求出相应的销售额.
【解答】解:(Ⅰ)根据表中所列数据可得散点图如下:
(Ⅱ)5,
50
又已知,.
于是可得:
50﹣6.5×5=17.5
因此,所求回归直线方程为:6.5x+17.5
(Ⅲ)根据上面求得的回归直线方程,当广告费支出为10万元时,
6.5×10+17.5=82.5(万元)
即这种产品的销售收入大约为82.5万元
【点评】用二分法求回归直线方程的步骤和公式要求大家熟练掌握,线性回归方程必过样本中心点.是两个系数之间的纽带,希望大学注意.
19.已知x,y之间的一组数据如表:
x 1 3 6 7 8
y 1 2 3 4 5
(1)分别从集合A=1,3,6,7,8,B=1,2,3,4,5中各取一个数x,y,求x+y≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为与,试根据残差平方和:的大小,判断哪条直线拟合程度更好.
【分析】(1)由题意知这是一个古典概型,试验发生包含的所有事件是分别从集合A,B中各取一个数组成数对(x,y),共有5×5对,满足x+y≥10的可以列举出来,根据概率公式得到结果.
(2)根据所给的两条直线的方程和五个坐标点,求出用作为拟合直线时,所得y的实际值与y的估计值的差的平方和,用作为拟合直线时,所得y的实际值与y的估计值的差的平方和,比较得到结果.
【解答】解:(1)由题意知这是一个古典概型,
试验发生包含的所有事件是分别从集合A,B中各取一个数组成数对(x,y),共有25对,
其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对
故使x+y≥10的概率为.
(2)用作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:.
用作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:.
∵S2<S1,
故用直线拟合程度更好.
【点评】这是一个综合题,考查统计问题和概率问题,又是一个基础题,考查最基本的古典概型和判断直线的拟合效果,残差平方和越小,拟合效果越好.
20.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下:
航空公司编号 1 2 3 4 5 6 7 8 9 10
航班正点率/% 81.8 76.8 76.6 75.7 73.8 72.2 71.2 7.08 91.4 68.5
顾客投诉/次 21 58 85 68 74 93 72 122 18 125
顾客投诉次数和航班正点率之间是否呈现出线性相关关系?它们之间的相关程度如何?变化趋势有何特征?
【分析】根据y与x的线性相关性求出回归系数和,即可得线性回归方程,根据参考公式和已知数据求得相关系数r≈﹣0.87.
【解答】解:设顾客投诉次数为y,正点率为53978.3,57975.1,65796,
设经验回归方程为,
(81.8+76.8+76.6+75.7+73.8+72.2+71.2+70.8+91.4+68.5)=75.88.
68+74+93+72+122+18+125)=73.6,
4.705,
将代入经验回归方程可得430.615,
所以经验回归方程为4.705x+430.615,
所以呈现出线性相关关系,样本相关系数r0.87,
r的绝对值越接近1,相关性越强,所以相关程度较高.变化趋势是正点率提高一个百分点,顾客投诉次数减少约为4.7.
【点评】本题主要考查相关系数以及回归方程的求解,考查计算能力,属于中档题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)