必修第二册 9.2 用样本估计总体 同步练习
一、单选题
1.在某次测量中得到的样本数据如下17,22,37,42,31,58,61,若B样本数据恰好是样本数据都减2后所得数据,则,两样本的下列数字特征对应相同的是( )
A.平均数 B.众数 C.中位数 D.方差
2.为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校高二年级体育组教师在高二年级随机抽取部分男生,测试了立定跳远项目,依据测试数据绘制了如图所示的频率直方图.已知立定跳远以上成绩为及格,以上成绩为优秀,根据图中的数据估计该校高二年级男生立定跳远项目的及格率和优秀率分别是( )
A. B. C. D.
3.某同学5天上学途中所花的时间(单位:分钟)分别为12,8,10,9,11,则这组数据的方差为( )
A.4 B.2 C.9 D.3
4.通过抽样调查得到某栋居民楼24户居民的月均用水量数量(单位:),将其按从小到大排序如下:
2.1 3.2 3.2 4.3 4.3 5.5 6.7 8.9 9.4 9.5 9.5 9.9
10.1 10.5 11.1 11.2 12.5 14.8 15.2 15.3 18.4 19.0 20.8 22.4
则估计这24户居民的月均用水量的第25百分位数为( )
A.4.3 B.5.5 C.6.1 D.6.7
5.为检测疫苗的有效程度,某权威部门对某种疫苗进行的三期临床效果比较明显的受试者,按照年龄进行分组,绘制了如图所示的样本频率分布直方图,其中年龄在内的有1400人,在内有800人,则频率分布直方图中的值为( )
A.0.008 B.0.08 C.0.006 D.0.06
6.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,众数为0
C.丙地:中位数为2,众数为3 D.丁地:总体均值为1,中位数为1
7.在某次测量中得到的样本数据如下:.若样本数据恰好是样本数据都加2后所得数据,则两样本的下列数字特征对应相同的是( )
A.众数 B.平均数 C.标准差 D.中位数
8.2020年宿州市某中学参加高中数学建模(应用)能力测试,高一年级有60人,高二年级有40人.高一的平均成绩为70分,高二的平均成绩为80分,则参加测试的100名学生的平均成绩为( )
A.72分 B.73分 C.74分 D.75分
9.对全班45名同学的数学成绩进行统计,得到平均数为80,方差为25,现发现数据收集时有两个错误,其中一个95分记录成了75分,另一个60分记录成了80分.纠正数据后重新计算,得到平均数为,方差为,则( )
A., B.,
C., D.,
10.某高中为了解学生课外知识的积累情况,随机抽取名同学参加课外知识测试,测试共道题,每答对一题得分,答错得分.已知每名同学至少能答对道题,得分不少于分记为及格,不少于分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是( )
A.该次课外知识测试及格率为
B.该次课外知识测试得满分的同学有名
C.该次测试成绩的中位数大于测试成绩的平均数
D.若该校共有名学生,则课外知识测试成绩能得优秀的同学大约有名
11.甲 乙 丙 丁四位同学组成的数学学习小组进行了一次小组竞赛,共测试了5道题,每位同学各题得分情况如下表:
题目 学生 第1题 第2题 第3题 第4题 第5题
甲 10 10 10 20 0
乙 10 10 5 15 10
丙 10 10 15 15 10
丁 0 10 10 20 20
下列说法正确的是( )A.甲的平均得分比丙的平均得分高
B.乙的得分极差比丁的得分极差大
C.对于这4位同学,因为第4题的平均得分比第2题的平均得分高,所以第4题相关知识一定比第2题相关知识掌握好
D.对于这4位同学,第3题得分的方差比第5题得分的方差小
12.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A. B. C.36 D.
13.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是( )
A.甲的化学成绩领先年级平均分最多.
B.甲有2个科目的成绩低于年级平均分.
C.甲的成绩最好的前两个科目是化学和地理.
D.对甲而言,物理、化学、地理是比较理想的一种选科结果.
14.为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在内的产品为一等品,则该企业生产的产品为一等品的概率约为( )
A.0.38 B.0.61
C.0.122 D.0.75
15.3个数1,3,5的方差是( )
A. B. C.2 D.
二、填空题
16.海水养殖场对某水产品的网箱养殖方法的产量进行调查,收获时随机抽取了100个网箱,测量各网箱水产品的产量(单位:kg)后制成频率分布直方图如图所示.估计网箱养殖方法的箱产量数据的第61百分位数为______.
17.某中学有初中学生1800人,高中学生1200人.为了解学生本学期课外阅读情况,现采用分层随机抽样的方法,从中抽取了100名学生,先统计了他们的课外阅读时间,然后按初中学生和高中学生分为两组,再将每组学生的阅读时间(单位:h)分为5组:, ,,, ,并分别加以统计,得到如图所示的频率分布直方图,试估计该校所有学生中,阅读时间不小于30h的学生人数为 _______
18.已知一组数据,,…,的方差是2,且,则这组数据的平均数___________.
三、解答题
19.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
(3)样本中不达标的学生人数是多少?
(4)第三组的频数是多少?
20.为了选拔参加自行车比赛的选手,对自行车运动员甲、乙两人在相同条件下进行了6次测试,测得他们的最大速度(单位:)的数据如下:
甲 27 38 30 37 35 31
乙 33 29 38 34 28 36
(1)画出茎叶图;
(2)估计甲、乙两运动员的最大速度的均值和方差,并判断谁参加比赛更合适.
21.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到频数分布表和频率分布直方图如下.
组号 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18) 2
合计 100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的频率;
(2)求频率分布直方图中的a,b的值.
22.从参加环保知识竞赛的学生中抽出40名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示,观察图形,回答下列问题.
(1)80~90这一组的频数 频率分别是多少?
(2)估计这次环保知识竞赛成绩的平均数 众数 中位数(不要求写过程).
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.D
B样本数据是样本数据都减2后所得的,则A、B两样本数据的平均数、众数、中位数都发生改变,由方差的统计学意义可知, A、B的方差不变.
【详解】
由数据A : 17,22,37,42,31,58,61得到数据B: 15,20,35,40,29,56,59,
所以B的平均数、众数、中位数比A的平均数、众数、中位数均小2;
因为A、B的离散程度相同, 所以A、B的方差相同.
故选:D
(1) 平均数:是指在一组数据中所有数据之和再除以这组数据的个数,表示一组数据集中趋势的量数;
(2) 方差:是各个数据分别与其平均数之差的平方的和的平均数,数据和其数学期望(即均值)之间的偏离程度,反映数据离散程度.两组数据的离散程度相同, 所以他们的方差相同.
2.C
根据频率分布直方图可直接求出.
【详解】
由频率分布直方图可得,
优秀率为
,
及格率,
故选:C
3.B
先求平均值,再结合方差公式求解即可.
【详解】
解:由题意可得,
由方差公式可得:,
故选:B.
本题考查了样本数据的方差,属基础题.
4.C
利用百分位数的定义求解即可
【详解】
,因为第6个和第7个数据分别为5.5和6.7,
所以估计这24户居民的月均用水量的第25百分位数为.
故选:C
5.A
根据频率分布直方图,及年龄在内的有1400人,可知总人数,进而确定答案.
【详解】
假设总人数为,则,解得,
∴,解得,
故选:A.
6.D
利用平均数、中位数、众数的定义及计算公式,对四个选项逐一分析判断即可.
【详解】
解:对A:∵平均数和中位数不能限制某一天的病例超过7人,如0,0,0,0,4,4,4,4,6,8,
∴A不正确;
对B:∵平均数和众数不能限制某一天的病例超过7人,如0,0,0,0,0,0,0,0,0,10,
∴B不正确;
对C:∵中位数和众数不能限制某一天的病例超过7人,如0,0,0,0,2,2,3,3,3,8,
∴C不正确;
对D:假设过去10天新增疑似病例数据存在一个数据x,x≥8,而总体平均数为1,则过去10天新增疑似病例数据中至少有7个0,故中位数不可能为1,
所以假设不成立,故符合没有发生大规模群体感染的标志,
∴D正确;
故选:D.
7.C
分别求两个样本的数字特征,再判断选项.
【详解】
A样本数据是:,
样本数据是:,
A样本的众数是48,B样本的众数是50,故A错;
A样本的平均数是 ,
B样本的平均数是,故B错;
A样本的标准差
B样本的标准差,
,故C正确;
A样本的中位数是,B样本的中位数是,故D错.
故选:C
8.C
根据平均值的计算公式,由题中条件直接计算,即可得出结果.
【详解】
由题意可得,参加测试的100名学生的平均成绩为.
故选:C.
9.C
根据数据纠正前后的数据总和不变,波动性变大,结合平均数、方差的意义分析,可得结果.
【详解】
因为,所以纠正数据前后的数据总和不变,故平均数不变;
但是,在对错误的数据进行纠正后,显然数据的波动性变大,故方差变大.
故选:C.
关键点点睛:本题的关键点是:依题意得出“数据纠正前后的总和不变,波动性变大”.
10.C
由百分比图知,成绩为100分、80分、60分、40分的百分比分别为,结合各项的描述即可判断其正误.
【详解】
由图知,及格率为,故A错误.
该测试满分同学的百分比为,即有名,B错误.
由图知,中位数为分,平均数为分,故C正确.
由题意,名学生成绩能得优秀的同学有,故D错误.
故选:C
11.D
根据题意计算对应平均值、极差和方差,进行比较,逐一判断选项正误即可.
【详解】
选项A中,甲的平均分为,丙的平均分为,故甲的平均得分比丙的平均得分低,故错误;
选项B中,乙的得分极差为,丁的得分极差为,极差相等,故错误;
选项C中,不清楚两题的具体分值是否相同,所以不能通过平均分判断第4题相关知识一定比第2题相关知识掌握好,故错误;
选项D中,第3题得分的平均值为,
故方差为,
第5题得分的平均分为,
故方差为,
故第3题得分的方差比第5题得分的方差小.故正确.
故选:D.
12.B
根据茎叶图中的数据,去掉最大值和最小值,然后计算平均值,从而求得x,按照方差公式计算方差即可.
【详解】
由图可知去掉的两个数是87,99,
所以87+90×2+91×2+94+90+x=91×7,解得x=4.
故方差为:s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
故选:B.
13.A
根据雷达图,对四个选项逐个分析,可选出答案.
【详解】
根据雷达图,可知物理成绩领先年级平均分最多,即A错误;
甲的政治、历史两个科目的成绩低于年级平均分,即B正确;
甲的成绩最好的前两个科目是化学和地理,即C正确;
对甲而言,物理成绩比年级平均分高,历史成绩比年级平均分低,而化学、生物、地理、政治中优势最明显的两科为化学和地理,故物理、化学、地理的成绩是比较理想的一种选科结果,即D正确.
故选:A.
本题考查统计知识,涉及到雷达图的识别及应用,考查学生识图能力、数据分析能力,是一道容易题.
14.B
利用频率组距,即可得解.
【详解】
根据频率分布直方图可知,质量指标值在内的概率
故选:B
15.D
由题得3个数的平均数为3,再利用方差公式求解.
【详解】
由题得3个数的平均数为3,
所以.
故选:D
16.49.75##
由频率分布直方图算出前几组数据对应频率,当频率累计值到时,求出对应横坐标值即可.
【详解】
由题可知,组距在的概率为,在的概率为,在的概率为,在的概率为,在的概率为,
因为,,故当频率值累计为0.61时,对应横坐标值为,
所以故计网箱养殖方法的箱产量数据的第61百分位数为49.75
故答案为:49.75
17.870
由分层抽样求出初中高中各被抽取的人数,再由频率分布直方图计算出频率,然后计算阅读时间不小于30h的人数,相加可得.
【详解】
由分层随机抽样,知抽取的初中生有60名,高中生有40名.因为初中学生中阅读时间不小于30h的频率为,所以该校所有的初中学生中,阅读时间不小于30h的学生人数约为,同理,高中学生中阅读时间不小于30h的频率为,故该校所有的高中学生中,阅读时间不小于30h的学生人数约为.所以该校所有学生中,阅读时间不小于30h的学生人数约为.
故答案为:870.
本题考查分层抽样,考查频率分布直方图,属于基础题.
18.-3或9
利用方差公式和平均数公式即可求解.
【详解】
由题意可知,,
因为,即,
所以,
因为,
所以,解得或.
故答案为:-3或9.
19.(1)0.08,150;
(2)88%;
(3)18;
(4)51.
频率分布直方图以面积的形式反映数据落在各小组内的频率大小,所以计算面积之比即为所求小组的频率.可用此方法计算(1),(2),由公式直接计算可得(1)中样本容量;根据(2)问中的达标率,可计算不达标率,从而求出不达标人数,可得(3);单独计算第三组的频率,由公式计算频数,可求出(4).
(1)
频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为=0.08.
所以样本容量==150.
(2)
由直方图可估计该校高一年级学生的达标率为×100%=88%.
(3)
由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12.
所以样本中不达标的学生人数为150×0.12=18(人).
(4)
第三小组的频率为=0.34.
又因为样本量为150,
所以第三组的频数为150×0.34=51.
20.(1)茎叶图见解析;(2)派乙更合适
(1)根据茎叶图的画法可画出茎叶图;
(2)利用平均数公式分别求得甲、乙的平均数,利用方差公式分别求得甲、乙的方差,比较平均数与方差的大小,根据平均数与方差的实际意义可得结论.
【详解】
(1)茎叶图如下:
(2)甲的平均数为:=33,
乙的平均数为:(28+29+33+34+36+38)=33,
甲的方差为:,
乙的方差为:,
甲、乙的平均数相等,乙的方差更小,则乙的发挥更稳定,故乙参加比赛更合适.
21.(1)0.9;(2),.
(1)由频数分布表得,课外阅读时间不少于12小时的共有10(名),即可求解样本中学生该周课外阅读时间少于12小时的频率;
(2)由频数分布表得,课外阅读时间落在[4,6)的人数为17,则频率是=0.17,进而可计算频率分布直方图中的值.
【详解】
(1)由频数分布表得,100名学生课外阅读时间不少于12小时的共有6+2+2=10(名),
所以样本中学生该周课外阅读时间少于12小时的频率P=1–=0.9;
则从该校随机选取一名学生,估计这名学生该周课外阅读时间少于12小时的频率是0.9;
(2)由频数分布表得,课外阅读时间落在[4,6)的人数为17,则频率是=0.17,
所以由频率分布直方图得,a==0.085,
同理可得,b==0.125.
本题主要考查了频率分布直方图的应用,其中解答中熟记在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以所有小长方形的面积的和等于1,且每个小矩形的高度为是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.
22.(1)频数为,频率为;(2)平均数为,众数为,中位数为.
(1)根据频率分布直方图中所有频率和为1可求得,得结论;
(2)用每组数据中间值乘以频率相加得平均值,频率最大的一组数据的中间值为众数,频率0.5对应的值为中位数.
【详解】
(1)根据题意,这一组的频率为,
这一组的频率为
这一组的频率为
这一组的频率为,
则这一组的频率为其频数为
(2)这次竞赛成绩的平均数为
这一组的频率最大,人数最多,则众数为
70分左右两侧的频率为则中位数为
答案第1页,共2页
答案第1页,共2页