人教A版(2019)必修第二册 9.2 用样本估计总体 同步练习
一、单选题
1.如图所示是小王与小张二人参加某射击比赛的预赛的五次测试成绩的折线图,设小王与小张成绩的样本平均数分别为和,方差分别为和,则( )
A., B., C., D.,
2.10名工人某天生产同一零件,生产的件数是15、17、14、10、15、17、17、16、14、12.设其平均数为a,中位数为b,众数为c,则有( )
A. B. C. D.
3.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下扇形统计图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入略有增加
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入不变
D.新农村建设后,种植收入在经济收入中所占比重大幅下降
4.甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3,若,,分别表示他们测试成绩的标准差,则( )
A. B.
C. D.
5.如果,…的方差为2,则的方差为( )
A.2 B.4 C.8 D.16
6.某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
7.甲、乙两名射击运动爱好者在相同条件下各射击次,中靶环数情况如图所示.则甲、乙两人中靶环数的方差分别为( )
A., B., C., D.,
8.我们正处于一个大数据飞速发展的时代,对于大数据人才的需求也越来越大,大数据的相关岗位大致可分为四类:数据开发、数据分析、数据挖掘、数据产品.某市2019年这几类工作岗位的薪资(单位:万元/月)情况如下表所示:
数据开发 8% 25% 32% 35%
数据分析 15% 36% 32% 17%
数据挖掘 9% 12% 28% 51%
数据产品 7% 17% 41% 35%
由表中数据可得该市大数据相关的各类岗位的薪资水平高低情况为( )A.数据挖掘>数据开发>数据产品>数据分析 B.数据挖掘>数据产品>数据开发>数据分析
C.数据挖掘>数据开发>数据分析>数据产品 D.数据挖掘>数据产品>数据分析>数据开发
9.2020年广东12月份天气预报历史记录中1号至8号的数据如表所示,则( )
日期 最高气温/ 最低气温/
12月1日 23 14
12月2日 23 13
12月3日 20 11
12月4日 19 10
12月5日 21 9
12月6日 21 15
12月7日 23 12
12月8日 23 11
A.这8天的最高气温的极差为 B.这8天的最高气温的中位数为
C.这8天的最低气温的极差为 D.这8天的最低气温的中位数为
10.某乡镇实现脱贫目标后,在奔小康的道路上,继续大步前进,依托本地区苹果种植的优势,经过3年的发展,苹果总产量翻了一番,统计苹果的品质得到了如下饼图:70,80是指苹果的外径,则以下说法中不正确的是( )
A.80以上优质苹果所占比例增加
B.经过3年的努力,80以上优质苹果产量实现翻了一番的目标
C.70~80的苹果产量翻了一番
D.70以下次品苹果产量减少了一半
11.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为,,,,.根据频率分布直方图,估计这200名学生每周的自习时间数据的第30百分位数为( )
A.22 B.21.25 C.22.5 D.25
12.为了鼓励学生积极锻炼身体,强健体魄,某学校决定每学期对体育成绩在年级前100名的学生给予专项奖励.已知该校高三年级共有500名学生,如图是该年级学生本学期体育测试成绩的频率分布直方图.据此估计,能够获得该项奖励的高三学生的最低分数为( )
A.89 B.88 C.87 D.86
13.第18届国际篮联篮球世界杯(世界男子篮球锦标赛更名为篮球世界杯后的第二届世界杯)于2019年8月31日至9月15日在中国的北京、广州、南京、上海、武汉、深圳、佛山、东莞八座城市举行.中国队12名球员在第一场和第二场得分的茎叶图如图所示,则下列说法错误的是( )
A.第一场得分的中位数为 B.第二场得分的平均数为
C.第一场得分的极差大于第二场得分的极差 D.第一场与第二场得分的众数相等
14.某工厂一年中各月份的收入、支出情况的统计如图所示,下列说法中错误的是( )
A.收入最高值与收入最低值的比是
B.结余最高的月份是7月
C.1至2月份的收入的变化率与4至5月份的收入的变化率相同
D.前6个月的平均收入为40万元
15.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,众数为0
C.丙地:中位数为2,众数为3 D.丁地:总体均值为1,中位数为1
二、填空题
16.若一组数据的平均数是30,另一组数据的平均数是则第三组数据的平均数是___________.
17.将某校全体高一年级学生期末数学成绩分为6组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100]加以统计,得到如图所示的频率分布直方图,现需要随机抽取60名学生进行问卷调查,采用按成绩分层随机抽样,则应抽取成绩不少于60分的学生人数为_______________.
18.某校100名学生期中考试数学成绩的频率分布直方图如所示,其中成绩分组区间是: ,,,,.
(1)___________;
(2)样本数据落在的频率为______________;
(3)根据频率分布直方图,估计这100名学生数学成绩的平均分为__________.
三、解答题
19.在一次高三年级统一考试中,数学试卷有一道满分为10分的选做题,学生可以从A,B两道题目中任选一题作答,某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名学生的选做题成绩中随机抽取一个容量为10的样本,为此将900名学生的选做题成绩随机编号为001,002,…,900.若采用分层随机抽样,按照学生选择A题目或B题目,将成绩分为两层,且样本中选择A题目的成绩有8个,平均数为7,方差为4;样本中选择B题目的成绩有2个,平均数为8,方差为1.试用样本估计该校900名学生的选做题得分的平均数与方差.
20.统计某公司名推销员的月销售额(单位:千元)得到如下频率分布直方图.
(1)同一组数据用该区间的中间值作代表,求这名推销员的月销售额的平均数与方差;
(2)请根据这组数据提出使的推销员能够完成销售指标的建议;
(3)现有两种奖励机制:
方案一:设,销售额落在左侧,每人每月奖励千元;销售额落在内,每人每月奖励千元;销售额落在右侧,每人每月奖励千元.
方案二:每人每月奖励其月销售额的.
用统计的频率进行估算,选择哪一种方案公司需提供更多的奖励金?(参考数据:)
记:(其中为对应的频率).
21.某地区拟举办汉字听写大赛,某校为了选拔优秀的学生参加比赛,在本校举行了次汉字听写大赛,其中甲、乙两位同学的成绩最优异,由甲、乙两位同学的成绩绘制的茎叶图如图所示.已知甲成绩的中位数小于乙成绩的中位数.
(1)求的值;
(2)若要从甲、乙中选择一名同学参加该地区举办的汉字听写大赛,试从统计学的角度分析,选哪位同学比较合适.
22.某校有高中生2000人,其中男女生比例约为,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽收了样本容量为的样本,得到频数分布表和频率分布直方图.方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.
身高(单位:)
频数 6 4
(1)根据图表信息,求,并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)
(2)计算方案二中总样本的均值及方差;
(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.C
根据图形分析数据的整体水平和分散程度.
【详解】
观察题图可知,实线中的数据都大于或等于虚线中的数据,所以小王成绩的平均数大于小张成绩的平均数,即;
显然实线中的数据波动都大于或等于虚线中的数据波动,所以小王成绩的方差大于小张成绩的方差,即.
故选:C.
此题考查根据数据特征辨析平均数和方差,关键在于准确分析图形反映的数据特征而并非计算.
2.B
将样本数据由小到大进行排列,根据定义求出,即可得出结论.
【详解】
解:将生产的件数由小到大排列为:10、12、14、14、15、15、16、17、17、17,
∴ ,中位数为,
众数为,
因此,,
故选:B.
3.C
根据扇形统计图,逐项判断,即可得出结果.
【详解】
因为该地区经过一年的新农村建设,农村的经济收入增加了一倍,不妨设建设前的经济收入为,则建设后的经济收入为,
A选项,从扇形统计图中可以看到,新农村建设后,种植收入比建设前增加,故A正确;
B选项,新农村建设后,其他收入比建设前增加,即增加了一倍以上,故B正确;
C选项,养殖收入的比重在新农村建设前与建设后相同,但建设后总收入为之前的2倍,所以建设后的养殖收入也是建设前的2倍,故C错误;
D选项,新农村建设后,种植收入在经济收入中所占比重由建设前的降为,故D正确;
故选:C.
4.D
先分别求出甲,乙,丙三名运动员射击成绩的平均分,然后根据方差公式求出相应的方差,比较大小可得标准差的大小.
【详解】
甲的平均成绩为,
其方差为
乙的平均成绩为,
其方差为丙的平均成绩为
其方差为.
所以
故选: D
5.C
设原数据的平均数为,则新数据的平均数为,利用方差的定义,进行整体代换即可.
【详解】
设原数据的平均数为,则新数据的平均数为,
则原数据的方差为,
新数据的方差为
故选:C.
6.A
首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.
【详解】
设新农村建设前的收入为M,而新农村建设后的收入为2M,
则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;
新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;
新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;
新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;
故选A.
点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.
7.D
求出平均数,利用方差公式即可求解.
【详解】
实线的数字为:,
虚线的数字为:,
所以,
,
.
故选:D
8.B
根据题意和表格的数据分别计算数据开发、数据分析、数据产品的平均薪资,进而比较大小即可.
【详解】
由题中选项知数据挖掘的平均薪资最高,故只需计算并比较其他三类工作岗位的平均薪资.估计数据开发的平均薪资为;
估计数据分析的平均薪资为;
估计数据产品的平均薪资为.
故数据挖掘>数据产品>数据开发>数据分析.
故选:B.
9.D
由极差等于一组数据中的最大值与最小值的差,并根据中位数的定义,求最高、最低气温数据的中位数即可判断各项的正误.
【详解】
这8天的最高气温的极差为,这8天的最高气温的中位数为,这8天的最低气温的极差为,这8天的最低气温的中位数为,故选:D.
10.D
设原苹果总产量为,从而3年后苹果总产量为;根据饼图,分别计算出3年前和3年后各类苹果的产量,从而可判断选项.
【详解】
设原苹果总产量为,则经过3年的发展,苹果总产量为,
3年前80以上优质苹果所占比例,3年后80以上优质苹果所占比例,所占比例增加,故选项A正确;
3年前80以上优质苹果的产量为,3年后80以上优质苹果的产量为,故80以上优质苹果产量实现翻了一番的目标,选项B正确;
3年前70~80苹果的产量为,3年后70~80苹果的产量为,故70~80的苹果产量翻了一番,选项C正确;
3年前70以下次品苹果的产量为,3年后70以下次品苹果的产量为,故70以下次品苹果的产量没变,选项D错误.
故选:D.
11.C
由频率分布直方图计算,找出累计频率值为0.3处对应的自习时间值即可.
【详解】
由频率分布直方图可知,区间在对应的频率为,区间在对应的频率为,,0.3处对应自习时间值恰为22.5,故这200名学生每周的自习时间数据的第30百分位数为22.5.
故选:C
12.B
根据题意确定出前100名的频率,进而判断出第100名的区间,然后根据频率求出答案.
【详解】
由题意,,的频率为:0.02×5=0.1,的频率为:0.05×5=0.25,则0.1<0.2<0.25,则第100名在中,设分数为x,的频率为:,
所以.
故选:B.
13.C
根据茎叶图按顺序排列第一场、第二场得分分数,中间两数的平均数即为中位数,出现次数最多的数为众数,最大数减最小数为极差,求出相应数据即可判断各项正误.
【详解】
由茎叶图可知第一场得分为:0,0,0,0,0,2,3,7,10,12,17,19,中位数为,众数为0,极差为19,第二场得分为:0,0,0,0,3,6,7,7,9,10,10,24,众数为0,平均数为,极差为24,所以选项C的说法是错误的.
故选:C
本题考查茎叶图,根据茎叶图计算样本数据的中位数、众数及平均数,属于基础题.
14.D
根据统计图对选项逐一分析,由此确定说法错误的选项.
【详解】
最高收入万元,最低收入万元,所以A正确.
结余最高的为月,结余万元,所以B正确.
根据两点连线的斜率可知,1至2月份的收入的变化率与4至5月份的收入的变化率相同,所以C正确.
前个月的平均收入为万元,所以D选项错误.
故选:D
15.D
利用平均数、中位数、众数的定义及计算公式,对四个选项逐一分析判断即可.
【详解】
解:对A:∵平均数和中位数不能限制某一天的病例超过7人,如0,0,0,0,4,4,4,4,6,8,
∴A不正确;
对B:∵平均数和众数不能限制某一天的病例超过7人,如0,0,0,0,0,0,0,0,0,10,
∴B不正确;
对C:∵中位数和众数不能限制某一天的病例超过7人,如0,0,0,0,2,2,3,3,3,8,
∴C不正确;
对D:假设过去10天新增疑似病例数据存在一个数据x,x≥8,而总体平均数为1,则过去10天新增疑似病例数据中至少有7个0,故中位数不可能为1,
所以假设不成立,故符合没有发生大规模群体感染的标志,
∴D正确;
故选:D.
16.161
根据数据平均数计算公式可得.
【详解】
数据共有个,其平均数为
因此
故数据的平均数是.
故答案为:161
17.48
根据频率分布直方图,求出成绩不少于分的频率,然后根据频数频率总数,即可求出结果.
【详解】
根据频率分布直方图,成绩不低于(分)的频率为,
由于需要随机抽取名学生进行问卷调查,利用样本估计总体的思想,则应抽取成绩不少于60分的学生人数为人.
故答案为:.
18. 0.3 73
(1)利用每个小矩形面积和为1,列方程求解即可;
(2)根据频率直方图可得答案;
(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均数.
【详解】
(1)依题意,,解得.
(2)样本数据落在的频率为.
(3)平均分为.
故答案为:;0.3;73.
方法点睛:本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.
19.平均数约为7.2,方差约为3.56
样本中选择A题目的成绩有8个,平均数为7,方差为4;样本中选择B题目的成绩有2个,平均数为8,方差为1,代入计算公式,由此能用样本估计900名学生的选做题得分的平均数与方差.
【详解】
设样本中选择A题目的成绩的平均数为,方差为;
样本中选择B题目的成绩的平均数为,方差为,
则,
所以样本的平均数为,
方差为.
故该校900名学生的选做题得分的平均数约为7.2,方差约为3.56.
本题考查分层抽样方法,离散型随机变量的期望与方差,考查期望与方差的计算,属于基础题.
20.(1)(万元);方差为;(2)将销售指标定为千元时,才能够使的推销员完成销售指标;(3)选择方案一,公司需提供更多的奖励金.
(1)根据频率分布直方图得到频率求均值与方差即可;
(2)设月销售额为时,计算对应概率0.3,即可求解;
(3)分别计算不同方案需提供的奖金,比较即可求解.
【详解】
(1)由频率分布直方图可得,这名推销员的月销售额的平均数为
(万元)
方差为
(2),
设月销售额为,则,
则,解得,
故根据这组数据可知:将销售指标定为千元时,才能够使的推销员完成销售指标.
(3)方案一:由(1)可得,,,
则当时,,
当时,,
当时,,
共计(千元),
方案二:(千元),
因为,所以选择方案一,公司需提供更多的奖励金.
21.(1)0;(2)乙同学比较合适.
(1)由乙的中位数为91,甲的中位数(90+x)小于91得解;
(2)计算甲乙二人三次成绩的平均数、方差等特征数据,再分析选择.
【详解】
(1)由茎叶图可知,乙同学成绩的中位数为.
又由茎叶图可得甲同学成绩的中位数大于或等于,
且甲成绩的中位数小于乙成绩的中位数,所以甲同学成绩的中位数只能为,
故.
(2)甲同学成绩的平均数为,
乙同学成绩的平均数为,
所以甲、乙成绩的平均数相等.
甲同学成绩的方差,
乙同学成绩的方差,
,所以乙同学的成绩更稳定,选乙同学比较合适.
22.(1),,频率分布直方图见解析,身高均值(2)均值为,方差为;(3)总样本均值的差为,不合适,理由见解析.
(1)利用身高在区间的频率和频数即可求的值,进而可得的值,求出各组的频率即可补全频率分布直方图,由平均数的计算公式即可求身高均值;
(2)把男生样本记为:,其均值为,方差为,把女生样本记为:,其均值为,方差为,则总体样本均值为,
根据方差公式和平均数公式变形即可得样本总体方差.
(3)两个方案的均值相减即可求均值差,由于没有进行等比例的分层抽样,每个个体被抽到的可能性不同,代表性较差,因此不合适.
【详解】
(1)因为身高在区间的频率为,频数为,
所以样本容量为,,,
,
所以身高在的频率为,小矩形的高为,
所以身高在的频率为,小矩形的高为,
由此补全频率分布直方图:
由频率分布直方图可知:样本的身高均值为:
,
所以由样本估计总体可知,估计该校高中生的身高均值为
(2)把男生样本记为:,其均值为,方差为,
把女生样本记为:,其均值为,方差为,
总体样本均值记为,方差记为,
所以,
又因为,
所以,
同理可得:,
所以
,
(3)两种方案总样本均值的差为,
所以用方案二总体样本均值作为总体均值的估计不合适,原因是没有进行等比例的分层抽样,每个个体被抽到的可能性不同,因此代表性较差.
答案第1页,共2页
答案第1页,共2页