单元素养评价(一)(第一章)
(120分钟 150分)
一、选择题(每小题5分,共60分)
1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则
( )
A.p1=p2
B.p2=p3C.p1=p3D.p1=p2=p3
2.下列哪种工作不能使用抽样方法进行
( )
A.测定一批炮弹的射程
B.测定海洋水域的某种微生物的含量
C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
D.检测某学校全体高三学生的身高和体重的情况
3.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是
( )
A.简单随机抽样法
B.系统抽样法
C.分层抽样法
D.抽签法
4.2013年至2019年我国二氧化硫的年排放量(单位:万吨)如表,则以下结论中错误的是
( )
年份
2013
2014
2015
2016
2017
2018
2019
排放量
2
217.9
2
118
2
043.9
1
974.4
1
859.1
1
102.86
1
014.6
A.二氧化硫排放量逐年下降
B.2018年二氧化硫减排效果最为显著
C.2017年至2018年二氧化硫减排量比2013年至2016年二氧化硫减排量的总和大
D.2019年二氧化硫减排量比2018年二氧化硫减排量有所增加
5.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177
cm,有一名候选人的身高记录不清楚,其末位数为x,那么x的值是
( )
A.5
B.6
C.7
D.8
6.某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15
℃,B点表示四月的平均最低气温约为5
℃.下面叙述不正确的是
( )
A.各月的平均最低气温都在0
℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20
℃的月份有5个
7.甲、乙两名同学在5次体育测试中的成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是X甲,X乙,则下列结论正确的是
( )
A.X甲B.X甲>X乙;甲比乙成绩稳定
C.X甲>X乙;乙比甲成绩稳定
D.X甲8.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是
( )
A.3.5
B.-3
C.3
D.-0.5
9.甲乙两名同学6次考试的成绩统计如图,甲乙两组数据的平均数分别为,,标准差分别为s甲,s乙,则
( )
A.<,s甲B.<,s甲>s乙
C.>,s甲D.>,s甲>s乙
10.某市2015年至2019年新能源汽车年销量y(单位:百台)与年份代号x的数据如表:
年份
2015
2016
2017
2018
2019
年份代号x
0
1
2
3
4
年销量y
10
15
20
m
35
若根据表中的数据用最小二乘法求得y关于x的线性回归方程为y=6.5x+9,则表中m的值为
( )
A.22
B.25.5
C.28.5
D.30
11.新冠肺炎疫情暴发以来,在以习近平总书记为核心的党中央领导下,全党全军全国各族人民众志成城、共克时艰,疫情防控取得了阶段性成效,彰显了中国特色社会主义制度的优越性.下面的图表给出了4月18日至5月5日全国疫情每天新增病例的数据统计情况
下列说法中不正确的是
( )
A.每天新增疑似病例的中位数为2
B.在对新增确诊病例的统计中,样本容量为18
C.每天新增确诊与新增疑似病例之和不超过20例的天数为13
D.在对新增确诊病例的统计中,样本是4月18日至5月5日
12.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…;第六组,成绩大于等于18秒且小于等于19秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y的值分别为
( )
A.90%,35
B.90%,45
C.10%,35
D.10%,45
二、填空题(每小题5分,共20分)
13.某校有下列问题:①高三毕业班500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为研究血型与色弱的关系,需从中抽取一个容量为20的样本;②高二年级足球队有11名运动员,要从中抽出2人调查学习负担情况.
方法:Ⅰ.随机抽样法,Ⅱ.系统抽样法,Ⅲ.分层抽样法.其中问题与方法能配对的是________.?
14.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
?
15.如图①是某城市三月份1至10日的最低气温随时间变化的图象.
(1)根据图①提供的信息,在图②中补全直方图;
(2)这10天最低气温的众数是________℃,最低气温的中位数是________℃,最低气温的平均数是________℃.?
16.对具有线性相关关系的变量x和y,测得一组数据如下:
x
2
4
5
6
8
y
30
40
60
50
70
若已求得它们的回归方程的斜率为6.5,则这条直线的回归方程为______________.?
三、解答题(共70分)
17.(10分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录,抽查数据如下:
甲:102,101,99,98,103,98,99;
乙:110,115,90,85,75,115,110.
(1)这种抽样方法是哪一种?
(2)估计甲、乙两车间包装的肥料重量的平均值与方差,并说明哪个车间产品较稳定?
18.(12分)在京广高速公路北京测速站,按同样的方式每隔2分钟测一辆汽车的行驶速度(千米/时)并记录车牌号,共测了n辆汽车,测得的速度统一分组后画出了如下频率分布直方图,其中速度在[85,115)内的频数为46.
(1)求n的值;
(2)求速度在[90,95)内的汽车的数量;
(3)左起第四组和第六组分别有10辆和3辆汽车挂有北京牌照,问这两组中哪组挂有北京牌照的汽车通过该测速站的频率较高?
19.(12分)(2018·全国卷Ⅲ改编)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.
(2)求40名工人完成生产任务所需时间的中位数m.
20.(12分)为促进农业发展,加快农村建设,某地政府扶持兴建了一批“超级蔬菜大棚”,为了解大棚的面积与年利润之间的关系,随机抽取了其中的7个大棚,并对当年的利润进行统计整理后得到了如下数据对比表:
大棚面积x(亩)
4.5
5.0
5.5
6.0
6.5
7.0
7.5
年利润y(万元)
6
7
7.4
8.1
8.9
9.6
11.1
由所给数据的散点图可以看出,各样本点都分布在一条直线附近,并且y与x有很强的线性相关关系.
(1)求y关于x的线性回归方程;(结果保留三位小数);
(2)小明家的“超级蔬菜大棚”面积为8.0亩,估计小明家的大棚当年的利润为多少;
(3)另外调查了近5年的不同蔬菜亩平均利润(单位:万元),其中无丝豆为:1.5,1.7,2.1,2.2,2.5;彩椒为:1.8,1.9,1.9,2.2,2.2,请分析种植哪种蔬菜比较好?
参考数据:xiyi=359.6,=259.
参考公式:b=,a=y-b.
21.(12分)在某中学举行的信息知识竞赛中,将高二年级两个班的参赛学生成绩(得分均为整数)进行整理后分成五组,绘制出如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)
【补偿训练】
“你低碳了吗?”这是某市为倡导建设节约型社会而发布的公益广告里的一句话.活动组织者为了了解这则广告的宣传效果,随机抽取了120名年龄在[10,20)
,[20,30)
,…,
[50,60]
的市民进行问卷调查,由此得到的样本的频率分布直方图如图所示.
(1)根据直方图填写下面频率分布统计表;
(2)根据直方图,试估计受访市民年龄的中位数(保留整数);
(3)按分层抽样的方法在受访市民中抽取n名市民作为本次活动的获奖者,若在[10,20)的年龄组中随机抽取了6人,则n的值为多少?
分组(Δxi)
频数(ni)
频率(fi)
[10,20)
18
0.15
[20,30)
30
[30,40)
[40,50)
0.2
[50,60]
6
0.05
22.(12分)
(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
PAGE单元素养评价(一)(第一章)
(120分钟 150分)
一、选择题(每小题5分,共60分)
1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则
( )
A.p1=p2B.p2=p3C.p1=p3D.p1=p2=p3
【解析】选D.在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为,所以p1=p2=p3.
2.下列哪种工作不能使用抽样方法进行
( )
A.测定一批炮弹的射程
B.测定海洋水域的某种微生物的含量
C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
D.检测某学校全体高三学生的身高和体重的情况
【解析】选D.抽样是为了用总体中的部分个体(即样本)来估计总体的情况,选项A,B,C都是从总体中抽取部分个体进行检验,选项D是检测全体学生的身体状况,所以,要对全体学生的身体都进行检验,而不能采取抽样的方法.
3.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是
( )
A.简单随机抽样法
B.系统抽样法
C.分层抽样法
D.抽签法
【解析】选B.根据各种抽样方法的定义进行判断.
4.2013年至2019年我国二氧化硫的年排放量(单位:万吨)如表,则以下结论中错误的是
( )
年份
2013
2014
2015
2016
2017
2018
2019
排放量
2
217.9
2
118
2
043.9
1
974.4
1
859.1
1
102.86
1
014.6
A.二氧化硫排放量逐年下降
B.2018年二氧化硫减排效果最为显著
C.2017年至2018年二氧化硫减排量比2013年至2016年二氧化硫减排量的总和大
D.2019年二氧化硫减排量比2018年二氧化硫减排量有所增加
【解析】选D.A正确,根据数据可知,二氧化硫排放量逐年下降;
B正确,从2017年到2018年,下降了756.24万吨,是所有相邻年份二氧化硫减排量最大的,所以2018年二氧化硫减排效果最为显著;
C正确,2017年至2018年二氧化硫减排量为756.24万吨,2013年至2016年二氧化硫减排量的总和为2
217.9-1
974.4=243.5万吨,所以243.5<756.24,故C正确;
D错,2017年至2018年二氧化硫减排量为756.24万吨,2018年至2019年二氧化硫减排量为1
102.86-1
014.6=88.26万吨,故2019年二氧化硫减排量比2018年二氧化硫减排量有所减少.
5.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177
cm,有一名候选人的身高记录不清楚,其末位数为x,那么x的值是
( )
A.5
B.6
C.7
D.8
【解析】选D.设这名候选人的身高为m
cm,
则=177.
解得m=178.所以x=8.
6.某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15
℃,B点表示四月的平均最低气温约为5
℃.下面叙述不正确的是
( )
A.各月的平均最低气温都在0
℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20
℃的月份有5个
【解析】选D.由题干图可知0
℃均在虚线框内,所以各月的平均最低气温都在
0
℃以上,A正确;由题干图可知七月的平均温差大于7.5
℃
,而一月的平均温差小于7.5
℃,所以七月的平均温差比一月的平均温差大,B正确;由题干图可知三月和十一月的平均最高气温大约都在10
℃
,基本相同,C正确;由题干图可知平均最高气温高于20
℃的月份有3个,所以D不正确.
7.甲、乙两名同学在5次体育测试中的成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是X甲,X乙,则下列结论正确的是
( )
A.X甲B.X甲>X乙;甲比乙成绩稳定
C.X甲>X乙;乙比甲成绩稳定
D.X甲【解析】选A.因为甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95,
所以X甲==81,
X乙==86.8,所以X甲从茎叶图中数据的分布情况看,乙同学的成绩更集中于平均数附近,这说明乙比甲成绩稳定.
8.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是
( )
A.3.5
B.-3
C.3
D.-0.5
【解析】选B.少输入90,=3,平均数少3,求出的平均数减去实际的平均数等于-3.
9.甲乙两名同学6次考试的成绩统计如图,甲乙两组数据的平均数分别为,,标准差分别为s甲,s乙,则
( )
A.<,s甲B.<,s甲>s乙
C.>,s甲D.>,s甲>s乙
【解析】选C.由折线图得:>,σ甲<σ乙.
10.某市2015年至2019年新能源汽车年销量y(单位:百台)与年份代号x的数据如表:
年份
2015
2016
2017
2018
2019
年份代号x
0
1
2
3
4
年销量y
10
15
20
m
35
若根据表中的数据用最小二乘法求得y关于x的线性回归方程为y=6.5x+9,则表中m的值为
( )
A.22
B.25.5
C.28.5
D.30
【解析】选D.因为==2,
代入线性回归方程y=6.5x+9,可得=6.5×2+9=22,
结合表中数据可知=22,
解得m=30.
11.新冠肺炎疫情暴发以来,在以习近平总书记为核心的党中央领导下,全党全军全国各族人民众志成城、共克时艰,疫情防控取得了阶段性成效,彰显了中国特色社会主义制度的优越性.下面的图表给出了4月18日至5月5日全国疫情每天新增病例的数据统计情况
下列说法中不正确的是
( )
A.每天新增疑似病例的中位数为2
B.在对新增确诊病例的统计中,样本容量为18
C.每天新增确诊与新增疑似病例之和不超过20例的天数为13
D.在对新增确诊病例的统计中,样本是4月18日至5月5日
【解析】选D.对于A选项,每天新增疑似病例数由小到大依次为0,0,0,0,1,1,2,2,2,2,2,2,3,3,3,3,3,5,中位数为2,A选项正确;
对于B选项,由于共统计了18天,则在对新增确诊病例的统计中,样本容量为18,B选项正确;
对于C选项,从4月18日至5月5日中每天新增确诊与新增疑似病例之和分别为36,23,38,16,40,15,11,16,14,7,24,7,15,5,5,8,4,5,其中,每天新增确诊与新增疑似病例之和不超过20例的天数为13,C选项正确;
对于D选项,在对新增确诊病例的统计中,样本是4月18日至5月5日每天新增确诊病例的数据,D选项错误.
12.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…;第六组,成绩大于等于18秒且小于等于19秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y的值分别为
( )
A.90%,35
B.90%,45
C.10%,35
D.10%,45
【解析】选A.成绩小于17秒的人数占全班总人数的百分比为(0.02+0.18+
0.36+0.34)×100%=90%;成绩大于等于15秒且小于17秒的人数为(0.36+0.34)
×100%×50=35.
二、填空题(每小题5分,共20分)
13.某校有下列问题:①高三毕业班500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为研究血型与色弱的关系,需从中抽取一个容量为20的样本;②高二年级足球队有11名运动员,要从中抽出2人调查学习负担情况.
方法:Ⅰ.随机抽样法,Ⅱ.系统抽样法,Ⅲ.分层抽样法.其中问题与方法能配对的是________.?
【解析】①应为分层抽样,②应为简单随机抽样.
答案:①Ⅲ,②Ⅰ
【拓展延伸】三种常用的抽样方法
简单随机抽样、系统抽样和分层抽样.在使用它们的过程中,每一个个体被抽到的可能性是一样的.应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数是相等的,当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,抽样间隔为k=,如果总体容量N不能被样本容量n整除,先用简单随机抽样法剔除多余个数、抽样间隔为k=.
(3)几种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体容量较大,样本容量也较大时,可采用系统抽样法;当总体由差异明显的几部分组成时,可采用分层抽样法.
14.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
?
【解题指南】先求出平均数,然后求方差.
【解析】样本数据的平均数为5.1,所以方差为
s2=×[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]
=×[(-0.4)2+(-0.3)2+02+0.32+0.42]
=×(0.16+0.09+0.09+0.16)=×0.5=0.1.
答案:0.1
15.如图①是某城市三月份1至10日的最低气温随时间变化的图象.
(1)根据图①提供的信息,在图②中补全直方图;
(2)这10天最低气温的众数是________℃,最低气温的中位数是________℃,最低气温的平均数是________℃.?
【解析】(1)略 (2)由直方图可知众数为2
℃,中位数是0
℃,平均数计算可得为0
℃.
答案:(1)如图:
(2)2 0 0
16.对具有线性相关关系的变量x和y,测得一组数据如下:
x
2
4
5
6
8
y
30
40
60
50
70
若已求得它们的回归方程的斜率为6.5,则这条直线的回归方程为______________.?
【解析】设回归方程为y=6.5x+a.
由已知,=×(2+4+5+6+8)=5.
=×(30+40+60+50+70)=50.
所以a=-6.5=50-6.5×5=17.5.所以y=6.5x+17.5.
答案:y=6.5x+17.5
三、解答题(共70分)
17.(10分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录,抽查数据如下:
甲:102,101,99,98,103,98,99;
乙:110,115,90,85,75,115,110.
(1)这种抽样方法是哪一种?
(2)估计甲、乙两车间包装的肥料重量的平均值与方差,并说明哪个车间产品较稳定?
【解析】(1)这种抽样方法是系统抽样.
(2)==100(kg),
=×[(102-100)2+(101-100)2+(99-100)2
+(98-100)2+(103-100)2+(98-100)2
+(99-100)2]≈3.428
6,
==100(kg),
=×[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2
+(110-100)2]≈228.57,因为=,<,所以甲车间产品较稳定.
【误区警示】本题易发生由于对方差的大小理解不到位造成判断失误.
18.(12分)在京广高速公路北京测速站,按同样的方式每隔2分钟测一辆汽车的行驶速度(千米/时)并记录车牌号,共测了n辆汽车,测得的速度统一分组后画出了如下频率分布直方图,其中速度在[85,115)内的频数为46.
(1)求n的值;
(2)求速度在[90,95)内的汽车的数量;
(3)左起第四组和第六组分别有10辆和3辆汽车挂有北京牌照,问这两组中哪组挂有北京牌照的汽车通过该测速站的频率较高?
【解析】(1)依题意,速度在[85,115)内的频率为1-0.016×5=0.92,所以所测汽车的总辆数n==50.
(2)根据频率分布直方图,速度在[90,95)内的频率为0.04×5=0.2,所以速度在[90,95)内的汽车的数量为0.2×50=10.
(3)左起第四组汽车的总数量为0.08×5×50=20,其中挂有北京牌照的频率为=;
左起第六组汽车的总数量为0.02×5×50=5,
其中挂有北京牌照的频率为=0.6,故左起第六组挂有北京牌照的汽车通过该测速站的频率较高.
19.(12分)(2018·全国卷Ⅲ改编)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.
(2)求40名工人完成生产任务所需时间的中位数m.
【解析】(1)第二种生产方式的效率更高.
理由如下:
方法一:由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80
min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79
min.因此第二种生产方式的效率更高.
方法二:由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5
min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5
min.因此第二种生产方式的效率更高.
方法三:由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80
min;用第二种生产方式的工人完成生产任务平均所需时间低于80
min,因此第二种生产方式的效率更高.
方法四:由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
(2)由茎叶图知m==80.
20.(12分)为促进农业发展,加快农村建设,某地政府扶持兴建了一批“超级蔬菜大棚”,为了解大棚的面积与年利润之间的关系,随机抽取了其中的7个大棚,并对当年的利润进行统计整理后得到了如下数据对比表:
大棚面积x(亩)
4.5
5.0
5.5
6.0
6.5
7.0
7.5
年利润y(万元)
6
7
7.4
8.1
8.9
9.6
11.1
由所给数据的散点图可以看出,各样本点都分布在一条直线附近,并且y与x有很强的线性相关关系.
(1)求y关于x的线性回归方程;(结果保留三位小数);
(2)小明家的“超级蔬菜大棚”面积为8.0亩,估计小明家的大棚当年的利润为多少;
(3)另外调查了近5年的不同蔬菜亩平均利润(单位:万元),其中无丝豆为:1.5,1.7,2.1,2.2,2.5;彩椒为:1.8,1.9,1.9,2.2,2.2,请分析种植哪种蔬菜比较好?
参考数据:xiyi=359.6,=259.
参考公式:b=,a=y-b.
【解析】(1)=6,=8.3,7
=348.6.
b=
==≈1.571,
a=-b=8.3-1.571×6=-1.126,
那么线性回归方程为:y=1.571x-1.126.
(2)将x=8.0代入方程得y=1.571×8.0-1.126=11.442,即小明家的“超级蔬菜大棚”当年的利润大约为11.442万元.
(3)近5年来,无丝豆亩平均利润的平均数为m==2,
方差=[++++]=0.128.
彩椒亩平均利润的平均数为n==2.
方差为=[++++]
=0.028.
因为m=n,>,所以种植彩椒比较好.
21.(12分)在某中学举行的信息知识竞赛中,将高二年级两个班的参赛学生成绩(得分均为整数)进行整理后分成五组,绘制出如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)
【解析】(1)因为各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05,所以第二小组的频率为1.00-(0.30+0.15+0.10+0.05)=0.40.
因为第二小组的频率为0.40,所以落在59.5~69.5内的第二小组的小长方形的高===0.04,由此可补全频率分布直方图(如图阴影部分所示).
(2)设高二年级两个班参赛的学生人数为x人,因为第二小组的频数为40,频率为0.40,所以=0.40.
解得x=100(人).
所以高二年级两个班参赛的学生人数为100人.
(3)高二年级两个班参赛学生的成绩的中位数应落在第二小组内.
【补偿训练】
“你低碳了吗?”这是某市为倡导建设节约型社会而发布的公益广告里的一句话.活动组织者为了了解这则广告的宣传效果,随机抽取了120名年龄在[10,20)
,[20,30)
,…,
[50,60]
的市民进行问卷调查,由此得到的样本的频率分布直方图如图所示.
(1)根据直方图填写下面频率分布统计表;
(2)根据直方图,试估计受访市民年龄的中位数(保留整数);
(3)按分层抽样的方法在受访市民中抽取n名市民作为本次活动的获奖者,若在[10,20)的年龄组中随机抽取了6人,则n的值为多少?
分组(Δxi)
频数(ni)
频率(fi)
[10,20)
18
0.15
[20,30)
30
[30,40)
[40,50)
0.2
[50,60]
6
0.05
【解析】(1)频率分布统计表如表.
分组(Δxi)
频数(ni)
频率(fi)
[10,20)
18
0.15
[20,30)
30
0.25
[30,40)
42
0.35
[40,50)
24
0.2
[50,60]
6
0.05
(2)由已知得受访市民年龄的中位数为
30+=30+=30+≈33.
(3)由=,解得n=40.
22.(12分)
(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:(1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
PAGE