北师大版高中数学必修第一册第六章统计4.1样本的数字特征4.2分层随机抽样的均值与方差4.3百分位数课件(共46张PPT)+学案+课时作业含答案(教师用)

文档属性

名称 北师大版高中数学必修第一册第六章统计4.1样本的数字特征4.2分层随机抽样的均值与方差4.3百分位数课件(共46张PPT)+学案+课时作业含答案(教师用)
格式 zip
文件大小 1.1MB
资源类型 试卷
版本资源 北师大版(2019)
科目 数学
更新时间 2025-09-08 11:33:14

文档简介

(共46张PPT)
§4 用样本估计总体的
数字特征
4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义,提升数学运算、数据分析的核心素养.2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),提升数学运算、数据分析的核心素养.3.理解百分位数的统计含义,能够用样本计算百分位数,提升数学抽象与数学运算的核心素养.
【课程标准要求】
知识点一 样本的数字特征
出现次数
[思考1] 一组数据的中位数是唯一的吗 是不是数据中的数
提示:一组数据的中位数只有唯一一个,不一定是数据中的数.
知识点二 分层随机抽样的平均数
权重
[思考2] 分层随机抽样的平均数公式与加权平均数公式有什么关系
知识点三 分层随机抽样的方差
知识点四 百分位数
一般地,当总体是 时,给定一个百分数p∈ ,总体的p分位数有这样的特点:总体数据中的任意一个数 它的可能性是p.
25%,50%,75%分位数是三个常用的百分位数,也称为总体的 .其他常用的百分位数有1%,5%,10%,90%,95%,99%.
连续变量
(0,1)
小于或等于
四分位数
[思考3] 总体的p分位数通常是未知的,用样本的p分位数去估计它时,估计的准确率与样本容量有什么关系
提示:样本容量越大,估计越准确.
『知识拓展』
(1)一组数据的众数可能有一个,也可能有多个,若数据中有两个或两个以上出现次数的最多,且出现次数一样多,则这些数据都是众数.
(2)在实际的比赛中,去掉一个最高分与一个最低分的目的是消除极端分数对比赛的影响.
(3)标准差、方差的意义.
①标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
②标准差、方差的取值范围:[0,+∞).
③当一组数据都相等时,该组数据的方差是0,说明该组数据没有波动.
题型一 样本的数字特征
[例1](1)PM2.5是衡量空气质量的重要指标,如图是某地6月1日至10日的PM2.5日均值(单位:μg/m3)的折线图,则下列关于这10天中PM2.5日均值的说法错误的是(   )
A.众数为30 B.中位数为31.5
C.平均数小于中位数 D.极差为109
C
(2)(多选题)有一组样本数据x1,x2,x3,…,xn,由这组数据得到新样本数据x1+2,
x2+2,x3+2,…,xn+2,则下列结论正确的是(   )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
CD
·解题策略·
(1)在一组数据中求中位数的方法是将数据从小到大排列后,最中间一个或最中间两个数的平均数;在一组数据中出现次数最多的数即是众数.
(2)根据统计图表中的数据研究中位数、众数、平均数问题,首先要根据统计图表的特征从统计图表中提取数据后求解.
·解题策略·
(3)标准差(方差)的两个作用.
①判断数据的离散程度.标准差(方差)较大,说明数据的离散程度较大,标准差(方差)较小,说明数据的离散程度较小.
②在实际应用中,常常把平均数与方差或标准差结合起来进行决策.在平均数相等的情况下,比较方差或标准差来确定稳定性.
[变式训练] (1)有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛.小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的(   )
A.平均数 B.众数
C.中位数 D.方差
C
【解析】 (1)把13名同学的成绩按由小到大排列,取成绩较高的6名同学进入决赛,即最中间一个数之后的6名同学进入决赛,13名同学的成绩按由小到大排列时,最中间一个数即是中位数.故选C.
(2)在一次数学测试中,高二某班40名学生成绩的平均数为82,方差为10.2,则下列四个数中不可能是该班数学成绩的是(   )
A.100 B.85 C.65 D.55
D
题型二 分层随机抽样的平均数与方差
[例2] 为了解某班学生每周购买文具的支出情况,利用分层随机抽样的方法抽取了15人进行调查,调查结果如下表所示,则估算全班学生每周购买文具的支出的方差是(   )
B
项目 人数 平均支出/元 方差
男生 9 40 6
女生 6 35 4
A.10.3 B.11.2 C.12 D.13.4
·解题策略·
[变式训练] 为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,若样本中有20名男员工,30名女员工,且男员工的平均体重为70 kg,标准差为4,女员工的平均体重为50 kg,标准差为6,则所抽取样本的方差为    .
124
题型三 百分位数
[例3] (1)某同学统计了他最近10次的数学考试成绩,得到的数据分别为92,85,
87,91,95,90,88,83,98,96,则这组数据的60%分位数是(   )
A.92 B.91.5
C.91 D.90
B
(2)某科技攻关青年团队共有20人,他们的年龄分布如下表所示.
年龄 45 40 36 32 30 29 28
人数 2 3 3 5 2 4 1
下列说法正确的是(   )
A.29.5是这20人年龄的25%分位数
B.29.5是这20人年龄的75%分位数
C.36.5是这20人年龄的中位数
D.这20人年龄的众数是5
A
·解题策略·
计算一组n个数据的p分位数的一般步骤
第一步,按照从小到大排列原始数据.
第二步,计算i=np.
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
[变式训练] (1)抽样统计甲射击运动员10次的训练成绩分别为86,85,88,86,90,
89,88,87,85,92,则这10次成绩的80%分位数为(   )
A.88.5 B.89 C.91 D.89.5
D
(2)某校为了解学生课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时长进行了统计,统计数据如下表所示.
锻炼时长/h 7 8 9 10 11
人数 6 10 9 8 7
则该校学生一周进行课外锻炼的时长的40%分位数是(   )
A.8.5 B.8 C.7 D.9
A
【学海拾贝】
频率分布直方图中样本数字特征的计算方法
(1)中位数:中位数在频率分布直方图左右两边直方图的面积应相等,也就是累积频率为0.5时对应的样本数据,求解时常借助比例法求解.
(2)百分位数:首先理解频率分布直方图中各组数据频率的计算方法,估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解.
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘每个小矩形底边中点的横坐标之和.
(4)方差:先利用每组中值乘频率(即每个小矩形的面积)求和得平均数,再将平均数减去每组的组中值平方后乘该组的频率求和.
[典例探究] (1)对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的中位数为(   )
A.2.5 B.2.02 C.2 D.2.25
B
【解析】 (1)中位数是频率为0.5的分界点,由频率分布直方图可知前4组的频率之和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x,则(x-2)×0.5=0.01,则x=2.02.故选B.
(2)某班50名学生的某次物理考试成绩(满分:100分)的频率分布直方图如图所示,则这50名学生的物理成绩的方差为    .
84
【解析】 (2)由题意可知这50名学生的物理成绩的平均数为65×0.2+75×0.3
+85×0.4+95×0.1=79,
方差s2=(65-79)2×0.2+(75-79)2×0.3+(85-79)2×0.4+(95-79)2×0.1=84.
[应用探究] 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档:月用电量不超过200 kW·h的部分按0.5元/(kW·h)收费,超过200 kW·h但不超过400 kW·h的部分按0.8元/(kW·h)收费,超过
400 kW·h的部分按1.0元/(kW·h)收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:kW·h)的函数解
析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;
(3)根据(2)中求得的数据估计月用电量的75%分位数.
【解】 (3)设75%分位数为m,
因为月用电量低于300 kW·h的居民所占比例为(0.001 0+0.002 0+0.003 0)×
100=60%,
月用电量不超过400 kW·h的居民占80%,
所以75%分位数m在[300,400)内,
所以0.6+(m-300)×0.002 0=0.75,
解得m=375,
即估计月用电量的75%分位数为375 kW·h.
当堂检测
1.数据1,1,3,3,4的众数和中位数分别是(   )
A.1和3,3 B.3,2 C.1或3,2 D.3,3
A
【解析】 因为1和3都出现了2次且次数最多,所以众数为1和3,中位数为3.故选A.
2.射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人成绩的平均数和方差如下表.根据表格中的数据判断,参赛较为合适的是
(   )
C
A.甲 B.乙 C.丙 D.丁
【解析】 由题表可知,乙和丙的平均成绩较高,但丙发挥比较稳定,应选丙去参赛更合适.故选C.
3.某公司有营销部门、宣传部门以及人事部门,其中营销部门有50人,平均工资为5千元,方差为4,宣传部门有40人,平均工资为3千元,方差为8,人事部门有10人,平均工资为3千元,方差为6,则该公司所有员工工资的方差为(   )
A.6.4 B.6.6 C.6.7 D.6.8
D
4.在某市高三年级期中联合考试中,某校数学单科前10名的学生成绩依次是143,140,144,142,142,145,148,147,147,150,这10名同学数学成绩的60%分位数是    .
1464.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
基础巩固
1.假设有一组数据为6,8,3,6,4,6,5,这些数据的众数与中位数分别是(  )
A.5,6 B.6,6
C.6,5 D.以上都不正确
【答案】 B
【解析】 一组数据为6,8,3,6,4,6,5.由数据看出,该组数据的众数是6;把该组数据由小到大排列为3,4,5,6,6,6,8.由数据看出其中位数是6.故选B.
2.若一组数据a1,a2,a3的平均数为4,方差为3,那么数据2a1+2,2a2+2,2a3+2的平均数和方差分别是(  )
A.10,12 B.10,14
C.4,3 D.6,3
【答案】 A
【解析】 因为一组数据a1,a2,a3的平均数为4,方差为3,所以数据2a1+2,2a2+2,2a3+2的平均数为2×4+2=10,方差为22×3=12.故选A.
3.有一笔统计资料,共有10个数据如下:90,92,92,93,93,94,95,96,99,100,则这组数据的75%分位数为(  )
A.92 B.95
C.95.5 D.96
【答案】 D
【解析】 因为75%×10=7.5,则这组数据的75%分位数为该组数据从小到大排列后的第8个,即为96.故选D.
4.为了增强学生的体质,某中学每年都要举行一次全校一分钟跳绳测试.已知某次跳绳测试中,某班学生的一分钟跳绳次数的频数分布直方图如图所示,则该班学生一分钟跳绳次数的中位数的估计值为(结果精确到整数)(  )
A.127 B.136 C.133 D.138
【答案】 D
【解析】 由题图可知该班的总人数为6+8+12+18+6=50,因为6+8=14<25,14+12=26>25,所以中位数位于第三组,由120+×(140-120)≈138.3,得中位数的估计值为138.故选D.
5.如图是根据某市1月1日至1月10日的最低气温(单位: ℃)的情况绘制的折线图,由图可知这 10天的最低气温的第40百分位数是(  )
A.2 B.-1
C.-0.5 D.-2
【答案】 C
【解析】 由题图可知,这10天的最低气温按照从小到大排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×40%=4,则这10天的最低气温的第40百分位数是=-0.5.故选C.
6.按从小到大顺序排列的两组数据:甲组:30,31,37,m,42,60;乙组:28,n,33,44,48,70,若这两组数据的30%分位数,50%分位数都分别对应相等,则m+n等于(  )
A.60 B.65
C.70 D.71
【答案】 D
【解析】 因为6×30%=1.8,6×50%=3,则由题意得甲组数据的30%分位数为31,乙组数据的30%分位数为n,所以n=31;甲组数据的50%分位数为,乙组数据的50%分位数为=,所以=,解得m=40,则m+n=40+31=71.故选D.
7.已知一组数据6,7,8,8,9,10,则该组数据的方差是    .
【答案】
【解析】 由题意,该组数据的平均数为=8,所以该组数据的方差是×[(6-8)2
+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.
8.已知一个样本容量为7的样本的平均数为5,方差为3,现样本加入新数据3,5,7,则此时方差s2=    .
【答案】 2.9
【解析】 设这个样本容量为7的样本数据分别为x1,x2,…,x7,则=5,所以x1+x2+…+x7=35,[(x1-5)2+(x2-5)2+…+(x7-5)2]=3,所以(x1-5)2+(x2-5)2+…+(x7-5)2=21.当加入新数据3,5,7后,平均数===5,
方差s2=[(x1-5)2+(x2-5)2+…+(x7-5)2+(3-5)2+(5-5)2+(7-5)2]=×(21+4+0+4)=2.9.
9.在2024中国成都世界园艺博览会期间,某工厂生产A,B,C三种纪念品,每一种纪念品均有精品型和普通型两种,某一天产量如下表:(单位:个)
项目 纪念品A 纪念品B 纪念品C
精品型 100 150 n
普通型 300 450 600
现采用分层随机抽样的方法在这一天生产的纪念品中抽取200个,其中A种纪念品有40个.
(1)求n的值;
(2)从B种精品型纪念品中抽取5个,其某种指标的数据分别如下:x,y,10,11,9,把这5个数据看作一个样本,其均值为10,方差为2,求|x-y|的值.
【解】 (1)根据题意,该工厂一天所生产的纪念品总数为100+300+150+450+n+600=n+
1 600.
现采用分层随机抽样的方法在这一天生产的纪念品中抽取200个,其中A种纪念品有40个,
则有=,解得n=400.
(2)根据题意,在5个数据的样本中,其均值为10,方差为2,
则有=10,得x+y=20.
由于总体的方差为2,
则=2,
可得x2+y2=208,
所以|x-y|====4.
10.甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取9次,记录如下:
甲 82 81 79 78 95 88 93 84 85
乙 92 95 80 75 83 80 90 85 85
(1)求甲成绩的80%分位数;
(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪名学生参加合适 请说明理由.
【解】 (1)将甲的成绩从低到高排列如下:78,79,81,82,84,85,88,93,95,
因为9×80%=7.2不是整数,所以选择第8个数作为80%分位数,即93.
(2)甲成绩的平均数为=×(78+79+81+82+84+85+88+93+95)=85,
甲成绩的方差为
=×[(78-85)2+(79-85)2+(81-85)2+…+(93-85)2+(95-85)2]≈31.6,
乙成绩的平均数为=×(92+95+80+75+83+80+90+85+85)=85,
乙成绩的方差为
=×[(92-85)2+(95-85)2+(80-85)2+…+(85-85)2+(85-85)2]≈36.4.
因为=,<,即甲、乙水平相当,但甲的成绩比较稳定,所以派甲参加比较合适.
能力提升
11.(多选题)某高中举行数学史知识答题比赛,对参赛的2 000名考生的成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),
[90,100],若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是(  )
A.考生参赛成绩的平均分约为72.5分
B.考生参赛成绩的75%分位数约为81.5分
C.分数在区间[60,70)内的频率为0.2
D.用分层随机抽样的方法从该校学生中抽取一个容量为200的样本,则成绩在区间[70,80)的应抽取30人
【答案】 AC
【解析】 由题图中数据可知,0.05×45+0.15×55+0.2×65+0.3×75+0.2×85+0.1×95=72.5分,故A正确;分数在区间[80,90)内的频率为0.2,分数在区间[90,100]内的频率为0.1,则考生参赛成绩的75%分位数位于[80,90),则75%分位数约为80+=82.5分,故B错误;分数在区间[60,70)内的频率为10×0.02=0.2,故C正确;分数在区间[70,80)内的频率为0.03×10=0.3,样本容量为200,则成绩在区间[70,80)应抽取0.3×200=60(人),故D错误.故选A,C.
12.已知A,B两组数据,其中A:2,3,4,5,6;B:11,a,13,14,12;A组数据的方差为    ,若A,B两组数据的方差相同,试写出一个a的值  .
【答案】 2 10(或15)
【解析】 由题意可知,A组的平均数为
==4,
所以A组的方差为
s2==2,
因为B组的平均数为
==,
所以B组的方差为
s′2=-()2=2,
解得a=10或15.
13.用比例分配的分层随机抽样从某校高二年级800名学生的体育成绩(满分为100分,成绩都是整数)中抽取一个样本量为100的样本,其中男生成绩数据40个,女生成绩数据60个.再将40个男生成绩样本数据分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],绘制得到如图所示的频率分布直方图.
(1)估计男生成绩样本数据的第80百分位数;
(2)若成绩不低于80分的为“优秀”成绩,用样本的频率分布估计总体,估计高二年级男生中成绩优秀人数;
(3)已知男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,求总样本的平均数和方差.
【解】 (1)在[40,80)内的成绩占比为0.01×10+0.015×10+0.015×10+0.03×10=0.7<0.8,
在[40,90)内的成绩占比为0.7+0.025×10=0.95>0.8,因此第80百分位数一定位于[80,90)内.因为80+10×=84,所以估计第80百分位数是84.
(2)成绩不低于80分的频率为(0.025+0.005)×10=0.3,所以高二年级男生中成绩优秀人数估计为0.3×40×8=96,所以估计高二年级男生中成绩优秀人数为96.
(3)设男生成绩样本平均数为=71,方差为=187.75,女生成绩样本平均数=73.5,方差为=119,总样本的平均数为,方差为s2,
=+=72.5.
s2=[+(-)2]+[+(-)2]
=×[187.75+(71-72.5)2]+×[119+(73.5-72.5)2]=148.
所以总样本的平均数和方差分别为72.5和148.
应用创新
14.某校高二年级有男生400人和女生600人,为分析期末物理成绩,按照男女比例通过分层随机抽样的方法取到一个样本,样本中男生的平均成绩为80分,方差为10,女生的平均成绩为60分,方差为20,由此可以估计该校高二年级期末物理成绩的方差为    .
【答案】 112
【解析】 由400∶600=2∶3,不妨设样本由男生2人(x1,x2)和女生3人(y1,y2,y3)组成.由题设得(x1+x2)=80,即x1+x2=160;
(y1+y2+y3)=60,即y1+y2+y3=180,
所以样本的平均分=×(160+180)=68,
样本的方差s2=×[10+(80-68)2]+×[20+(60-68)2]=112,即估计该校高二年级期末物理成绩的方差为112.
21世纪教育网(www.21cnjy.com)4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
【课程标准要求】 1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义,提升数学运算、数据分析的核心素养.2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),提升数学运算、数据分析的核心素养.3.理解百分位数的统计含义,能够用样本计算百分位数,提升数学抽象与数学运算的核心素养.
知识点一 样本的数字特征
 给定一组数据x1,x2,…,xn,
平均数:=,是指一组数据的平均值.
方差:s2=.
由于方差的单位是原始数据单位的平方,而刻画离散程度的一种理想度量应当具有与原始数据相同的单位.为此,计算方差的算术平方根,得s==,称之为标准差.
方差和标准差都刻画一组数据偏离平均数的离散程度.
极差:数据中最大值和最小值的差,从最值方面刻画数据的离散程度.
中位数:将一组数据按从小到大的顺序排列后,“中间”的那个数据为这组数据的中位数[当n为奇数时,中位数是第项,当n为偶数时,中位数是第项和第(+1)项的平均数],它使数据被分成的两部分的数据量是一样的.
众数:一组数据中出现次数最多的数据,反映一组数据的多数水平.
[思考1] 一组数据的中位数是唯一的吗 是不是数据中的数
提示:一组数据的中位数只有唯一一个,不一定是数据中的数.
知识点二 分层随机抽样的平均数
 一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·.于是,当已知上述两层构成的新样本中每层的平均数分别为 和 时,可得这个新样本的平均数为 +.记w1=,w2=,则这个新样本的平均数为w1+w2,其中w1,w2称为权重.
更一般地,设样本中不同层的平均数和相应权重分别为 ,,…,和w1,w2,…,wn,则这个样本的平均数为w1+w2+…+wn,记作w1+w2+…+wn=wi.
[思考2] 分层随机抽样的平均数公式与加权平均数公式有什么关系
提示:二者是一般与特殊的关系.当w1=w2=…=wn=,f1=f2=…=fn=1时,二者是一致的,都是平均数公式=.
知识点三 分层随机抽样的方差
 设样本中不同层的平均数分别为,,…,,方差分别为,,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+],其中为这个样本的平均数.
知识点四 百分位数
 一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
25%,50%,75%分位数是三个常用的百分位数,也称为总体的四分位数.其他常用的百分位数有1%,5%,10%,90%,95%,99%.
[思考3] 总体的p分位数通常是未知的,用样本的p分位数去估计它时,估计的准确率与样本容量有什么关系
提示:样本容量越大,估计越准确.
知识拓展
(1)一组数据的众数可能有一个,也可能有多个,若数据中有两个或两个以上出现次数的最多,且出现次数一样多,则这些数据都是众数.
(2)在实际的比赛中,去掉一个最高分与一个最低分的目的是消除极端分数对比赛的影响.
(3)标准差、方差的意义.
①标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
②标准差、方差的取值范围:[0,+∞).
③当一组数据都相等时,该组数据的方差是0,说明该组数据没有波动.
(4)关于平均数、方差的有关性质及规律.
①若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数是m+a.
②数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等.
③若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
题型一 样本的数字特征
[例1](1)PM2.5是衡量空气质量的重要指标,如图是某地6月1日至10日的PM2.5日均值(单位:μg/m3)的折线图,则下列关于这10天中PM2.5日均值的说法错误的是(  )
A.众数为30 B.中位数为31.5
C.平均数小于中位数 D.极差为109
(2)(多选题)有一组样本数据x1,x2,x3,…,xn,由这组数据得到新样本数据x1+2,x2+2,x3+2,…,
xn+2,则下列结论正确的是(  )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【答案】 (1)C (2)CD
【解析】 (1)众数即是出现次数最多的数据,由折线图可得,众数为30,A正确;将折线图中数据由小到大依次排序得17,25,30,30,31,32,34,38,42,126;处在中间位置的两个数据是31,32,因此中位数为=31.5,B正确;由折线图可得,
平均数为=40.5>31.5,C错误;根据极差概念,126-17=109,D正确.故选C.
(2)数据x1,x2,x3,…,xn的平均数为=,新数据x1+2,x2+2,x3+2,…,xn+2的平均数为==+2,故A错误;若数据x1,x2,x3,…,xn的中位数为xi,则新数据x1+2,x2+2,x3+2,…,xn+2的中位数为xi+2,故B错误;数据x1,x2,x3,…,xn的标准差为s=,新数据x1+2,x2+2,x3+2,…,xn+2的标准差为s1==s,故C正确;若数据x1,x2,x3,…,xn中的最大值为xa,最小值为xb,则极差为xa-xb,则数据x1+2,x2+2,x3+2,…,xn+2的极差为xa+2-xb-2=xa-xb,故D正确.故选C,D.
(1)在一组数据中求中位数的方法是将数据从小到大排列后,最中间一个或最中间两个数的平均数;在一组数据中出现次数最多的数即是众数.
(2)根据统计图表中的数据研究中位数、众数、平均数问题,首先要根据统计图表的特征从统计图表中提取数据后求解.
(3)标准差(方差)的两个作用.
①判断数据的离散程度.标准差(方差)较大,说明数据的离散程度较大,标准差(方差)较小,说明数据的离散程度较小.
②在实际应用中,常常把平均数与方差或标准差结合起来进行决策.在平均数相等的情况下,比较方差或标准差来确定稳定性.
[变式训练] (1)有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛.小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的(  )
A.平均数 B.众数
C.中位数 D.方差
(2)在一次数学测试中,高二某班40名学生成绩的平均数为82,方差为10.2,则下列四个数中不可能是该班数学成绩的是(  )
A.100 B.85 C.65 D.55
【答案】 (1)C (2)D
【解析】 (1)把13名同学的成绩按由小到大排列,取成绩较高的6名同学进入决赛,即最中间一个数之后的6名同学进入决赛,13名同学的成绩按由小到大排列时,最中间一个数即是中位数.故选C.
(2)因为方差s2==10.2,n=40,
所以(xi-)2=10.2×40=408.
若存在x=55,则(x-)2=(55-82)2=729>408=(xi-)2,导致方差必然大于10.2,不符合题意.所以55不可能是该班数学成绩.故选D.
题型二 分层随机抽样的平均数与方差
[例2] 为了解某班学生每周购买文具的支出情况,利用分层随机抽样的方法抽取了15人进行调查,调查结果如下表所示,则估算全班学生每周购买文具的支出的方差是(  )
项目 人数 平均支出/元 方差
男生 9 40 6
女生 6 35 4
A.10.3 B.11.2
C.12 D.13.4
【答案】 B
【解析】 估算全班学生每周购买文具的支出的平均数为=×(9×40+6×35)=38,
方差s2=×[6+(40-38)2]+×[4+(35-38)2]=11.2.故选B.
(1)计算分层随机抽样的平均数的两种方法.
①利用加权平均数公式.
=.
②利用分层随机抽样的平均数公式=w1+w2+…+wn.
(2)计算分层随机抽样的方差的方法.
直接利用分层随机抽样的方差的计算公式s2=wi[+].
[变式训练] 为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,若样本中有20名男员工,30名女员工,且男员工的平均体重为70 kg,标准差为4,女员工的平均体重为50 kg,标准差为6,则所抽取样本的方差为    .
【答案】 124
【解析】 由题意知,样本的平均数为
==58,
故样本的方差s2=×[42+(70-58)2]+×[62+(50-58)2]=124.
题型三 百分位数
[例3] (1)某同学统计了他最近10次的数学考试成绩,得到的数据分别为92,85,87,91,95,
90,88,83,98,96,则这组数据的60%分位数是(  )
A.92 B.91.5
C.91 D.90
(2)某科技攻关青年团队共有20人,他们的年龄分布如下表所示.
年龄 45 40 36 32 30 29 28
人数 2 3 3 5 2 4 1
下列说法正确的是(  )
A.29.5是这20人年龄的25%分位数
B.29.5是这20人年龄的75%分位数
C.36.5是这20人年龄的中位数
D.这20人年龄的众数是5
【答案】 (1)B (2)A
【解析】 (1)将10次的数学考试成绩由小到大排序依次为83,85,87,88,90,91,92,95,96,98,因为10×0.6=6,因此,这组数据的60%分位数是=91.5.故选B.
(2)20×25%=5,25%分位数为=29.5,A正确;20×75%=15,75%分位数为=38,B错误;这20人年龄的中位数是=32,C错误;这20人年龄的众数是32,D错误.故选A.
计算一组n个数据的p分位数的一般步骤
第一步,按照从小到大排列原始数据.
第二步,计算i=np.
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
[变式训练] (1)抽样统计甲射击运动员10次的训练成绩分别为86,85,88,86,90,89,88,87,85,92,则这10次成绩的80%分位数为(  )
A.88.5 B.89 C.91 D.89.5
(2)某校为了解学生课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时长进行了统计,统计数据如下表所示.
锻炼时长/h 7 8 9 10 11
人数 6 10 9 8 7
则该校学生一周进行课外锻炼的时长的40%分位数是(  )
A.8.5 B.8 C.7 D.9
【答案】 (1)D (2)A
【解析】 (1)甲射击运动员10次的训练成绩从小到大排列为85,85,86,86,87,88,88,89,90,92.且10×80%=8,所以这10次成绩的80%分位数为=89.5.故选D.
(2)抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故40%分位数为所有数据从小到大排序的第16项与第17项数据的平均数,即=8.5.故选A.
【学海拾贝】
频率分布直方图中样本数字特征的计算方法
(1)中位数:中位数在频率分布直方图左右两边直方图的面积应相等,也就是累积频率为0.5时对应的样本数据,求解时常借助比例法求解.
(2)百分位数:首先理解频率分布直方图中各组数据频率的计算方法,估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解.
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘每个小矩形底边中点的横坐标之和.
(4)方差:先利用每组中值乘频率(即每个小矩形的面积)求和得平均数,再将平均数减去每组的组中值平方后乘该组的频率求和.
[典例探究] (1)对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的中位数为(  )
A.2.5 B.2.02 C.2 D.2.25
(2)某班50名学生的某次物理考试成绩(满分:100分)的频率分布直方图如图所示,则这50名学生的物理成绩的方差为    .
【答案】 (1)B (2)84
【解析】 (1)中位数是频率为0.5的分界点,由频率分布直方图可知前4组的频率之和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x,则(x-2)×0.5=0.01,则x=2.02.故选B.
(2)由题意可知这50名学生的物理成绩的平均数为65×0.2+75×0.3+85×0.4+95×0.1=79,
方差s2=(65-79)2×0.2+(75-79)2×0.3+(85-79)2×0.4+(95-79)2×0.1=84.
[应用探究] 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档:月用电量不超过200 kW·h的部分按0.5元/(kW·h)收费,超过200 kW·h但不超过400 kW·h的部分按0.8元/(kW·h)收费,超过400 kW·h的部分按1.0元/(kW·h)收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:kW·h)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;
(3)根据(2)中求得的数据估计月用电量的75%分位数.
【解】 (1)当0≤x≤200时,y=0.5x;
当200当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y关于x的函数解析式为
y=
(2)由(1)可知,当y=260时,x=400,即月用电量不超过400 kW·h的居民占80%,
结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设75%分位数为m,
因为月用电量低于300 kW·h的居民所占比例为(0.001 0+0.002 0+0.003 0)×100=60%,
月用电量不超过400 kW·h的居民占80%,
所以75%分位数m在[300,400)内,
所以0.6+(m-300)×0.002 0=0.75,
解得m=375,
即估计月用电量的75%分位数为375 kW·h.
当堂检测
1.数据1,1,3,3,4的众数和中位数分别是(  )
A.1和3,3 B.3,2 C.1或3,2 D.3,3
【答案】 A
【解析】 因为1和3都出现了2次且次数最多,所以众数为1和3,中位数为3.故选A.
2.射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人成绩的平均数和方差如下表.根据表格中的数据判断,参赛较为合适的是(  )
项目 甲 乙 丙 丁
成绩的平均数 8.5 8.8 8.8 8
成绩的方差s2 3.5 3.5 2.1 8.7
A.甲 B.乙 C.丙 D.丁
【答案】 C
【解析】 由题表可知,乙和丙的平均成绩较高,但丙发挥比较稳定,应选丙去参赛更合适.故选C.
3.某公司有营销部门、宣传部门以及人事部门,其中营销部门有50人,平均工资为5千元,方差为4,宣传部门有40人,平均工资为3千元,方差为8,人事部门有10人,平均工资为3千元,方差为6,则该公司所有员工工资的方差为(  )
A.6.4 B.6.6 C.6.7 D.6.8
【答案】 D
【解析】 所有人的平均工资为=4千元,故该公司所有员工工资的方差为×{50×[4+(5-4)2]+40×[8+(3-4)2]+10×[6+(3-4)2]}=6.8.故选D.
4.在某市高三年级期中联合考试中,某校数学单科前10名的学生成绩依次是143,140,144,
142,142,145,148,147,147,150,这10名同学数学成绩的60%分位数是    .
【答案】 146
【解析】 对10名同学的成绩从小到大进行排列为140,142,142,143,144,145,147,147,148,
150,根据10×60%=6,故取第6项和第7项的数据分别为145,147;这10名同学数学成绩的60%分位数为=146.
基础巩固
1.假设有一组数据为6,8,3,6,4,6,5,这些数据的众数与中位数分别是(  )
A.5,6 B.6,6
C.6,5 D.以上都不正确
【答案】 B
【解析】 一组数据为6,8,3,6,4,6,5.由数据看出,该组数据的众数是6;把该组数据由小到大排列为3,4,5,6,6,6,8.由数据看出其中位数是6.故选B.
2.若一组数据a1,a2,a3的平均数为4,方差为3,那么数据2a1+2,2a2+2,2a3+2的平均数和方差分别是(  )
A.10,12 B.10,14
C.4,3 D.6,3
【答案】 A
【解析】 因为一组数据a1,a2,a3的平均数为4,方差为3,所以数据2a1+2,2a2+2,2a3+2的平均数为2×4+2=10,方差为22×3=12.故选A.
3.有一笔统计资料,共有10个数据如下:90,92,92,93,93,94,95,96,99,100,则这组数据的75%分位数为(  )
A.92 B.95
C.95.5 D.96
【答案】 D
【解析】 因为75%×10=7.5,则这组数据的75%分位数为该组数据从小到大排列后的第8个,即为96.故选D.
4.为了增强学生的体质,某中学每年都要举行一次全校一分钟跳绳测试.已知某次跳绳测试中,某班学生的一分钟跳绳次数的频数分布直方图如图所示,则该班学生一分钟跳绳次数的中位数的估计值为(结果精确到整数)(  )
A.127 B.136 C.133 D.138
【答案】 D
【解析】 由题图可知该班的总人数为6+8+12+18+6=50,因为6+8=14<25,14+12=26>25,所以中位数位于第三组,由120+×(140-120)≈138.3,得中位数的估计值为138.故选D.
5.如图是根据某市1月1日至1月10日的最低气温(单位: ℃)的情况绘制的折线图,由图可知这 10天的最低气温的第40百分位数是(  )
A.2 B.-1
C.-0.5 D.-2
【答案】 C
【解析】 由题图可知,这10天的最低气温按照从小到大排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×40%=4,则这10天的最低气温的第40百分位数是=-0.5.故选C.
6.按从小到大顺序排列的两组数据:甲组:30,31,37,m,42,60;乙组:28,n,33,44,48,70,若这两组数据的30%分位数,50%分位数都分别对应相等,则m+n等于(  )
A.60 B.65
C.70 D.71
【答案】 D
【解析】 因为6×30%=1.8,6×50%=3,则由题意得甲组数据的30%分位数为31,乙组数据的30%分位数为n,所以n=31;甲组数据的50%分位数为,乙组数据的50%分位数为=,所以=,解得m=40,则m+n=40+31=71.故选D.
7.已知一组数据6,7,8,8,9,10,则该组数据的方差是    .
【答案】
【解析】 由题意,该组数据的平均数为=8,所以该组数据的方差是×[(6-8)2
+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.
8.已知一个样本容量为7的样本的平均数为5,方差为3,现样本加入新数据3,5,7,则此时方差s2=    .
【答案】 2.9
【解析】 设这个样本容量为7的样本数据分别为x1,x2,…,x7,则=5,所以x1+x2+…+x7=35,[(x1-5)2+(x2-5)2+…+(x7-5)2]=3,所以(x1-5)2+(x2-5)2+…+(x7-5)2=21.当加入新数据3,5,7后,平均数===5,
方差s2=[(x1-5)2+(x2-5)2+…+(x7-5)2+(3-5)2+(5-5)2+(7-5)2]=×(21+4+0+4)=2.9.
9.在2024中国成都世界园艺博览会期间,某工厂生产A,B,C三种纪念品,每一种纪念品均有精品型和普通型两种,某一天产量如下表:(单位:个)
项目 纪念品A 纪念品B 纪念品C
精品型 100 150 n
普通型 300 450 600
现采用分层随机抽样的方法在这一天生产的纪念品中抽取200个,其中A种纪念品有40个.
(1)求n的值;
(2)从B种精品型纪念品中抽取5个,其某种指标的数据分别如下:x,y,10,11,9,把这5个数据看作一个样本,其均值为10,方差为2,求|x-y|的值.
【解】 (1)根据题意,该工厂一天所生产的纪念品总数为100+300+150+450+n+600=n+
1 600.
现采用分层随机抽样的方法在这一天生产的纪念品中抽取200个,其中A种纪念品有40个,
则有=,解得n=400.
(2)根据题意,在5个数据的样本中,其均值为10,方差为2,
则有=10,得x+y=20.
由于总体的方差为2,
则=2,
可得x2+y2=208,
所以|x-y|====4.
10.甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取9次,记录如下:
甲 82 81 79 78 95 88 93 84 85
乙 92 95 80 75 83 80 90 85 85
(1)求甲成绩的80%分位数;
(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪名学生参加合适 请说明理由.
【解】 (1)将甲的成绩从低到高排列如下:78,79,81,82,84,85,88,93,95,
因为9×80%=7.2不是整数,所以选择第8个数作为80%分位数,即93.
(2)甲成绩的平均数为=×(78+79+81+82+84+85+88+93+95)=85,
甲成绩的方差为
=×[(78-85)2+(79-85)2+(81-85)2+…+(93-85)2+(95-85)2]≈31.6,
乙成绩的平均数为=×(92+95+80+75+83+80+90+85+85)=85,
乙成绩的方差为
=×[(92-85)2+(95-85)2+(80-85)2+…+(85-85)2+(85-85)2]≈36.4.
因为=,<,即甲、乙水平相当,但甲的成绩比较稳定,所以派甲参加比较合适.
能力提升
11.(多选题)某高中举行数学史知识答题比赛,对参赛的2 000名考生的成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),
[90,100],若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是(  )
A.考生参赛成绩的平均分约为72.5分
B.考生参赛成绩的75%分位数约为81.5分
C.分数在区间[60,70)内的频率为0.2
D.用分层随机抽样的方法从该校学生中抽取一个容量为200的样本,则成绩在区间[70,80)的应抽取30人
【答案】 AC
【解析】 由题图中数据可知,0.05×45+0.15×55+0.2×65+0.3×75+0.2×85+0.1×95=72.5分,故A正确;分数在区间[80,90)内的频率为0.2,分数在区间[90,100]内的频率为0.1,则考生参赛成绩的75%分位数位于[80,90),则75%分位数约为80+=82.5分,故B错误;分数在区间[60,70)内的频率为10×0.02=0.2,故C正确;分数在区间[70,80)内的频率为0.03×10=0.3,样本容量为200,则成绩在区间[70,80)应抽取0.3×200=60(人),故D错误.故选A,C.
12.已知A,B两组数据,其中A:2,3,4,5,6;B:11,a,13,14,12;A组数据的方差为    ,若A,B两组数据的方差相同,试写出一个a的值  .
【答案】 2 10(或15)
【解析】 由题意可知,A组的平均数为
==4,
所以A组的方差为
s2==2,
因为B组的平均数为
==,
所以B组的方差为
s′2=-()2=2,
解得a=10或15.
13.用比例分配的分层随机抽样从某校高二年级800名学生的体育成绩(满分为100分,成绩都是整数)中抽取一个样本量为100的样本,其中男生成绩数据40个,女生成绩数据60个.再将40个男生成绩样本数据分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],绘制得到如图所示的频率分布直方图.
(1)估计男生成绩样本数据的第80百分位数;
(2)若成绩不低于80分的为“优秀”成绩,用样本的频率分布估计总体,估计高二年级男生中成绩优秀人数;
(3)已知男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,求总样本的平均数和方差.
【解】 (1)在[40,80)内的成绩占比为0.01×10+0.015×10+0.015×10+0.03×10=0.7<0.8,
在[40,90)内的成绩占比为0.7+0.025×10=0.95>0.8,因此第80百分位数一定位于[80,90)内.因为80+10×=84,所以估计第80百分位数是84.
(2)成绩不低于80分的频率为(0.025+0.005)×10=0.3,所以高二年级男生中成绩优秀人数估计为0.3×40×8=96,所以估计高二年级男生中成绩优秀人数为96.
(3)设男生成绩样本平均数为=71,方差为=187.75,女生成绩样本平均数=73.5,方差为=119,总样本的平均数为,方差为s2,
=+=72.5.
s2=[+(-)2]+[+(-)2]
=×[187.75+(71-72.5)2]+×[119+(73.5-72.5)2]=148.
所以总样本的平均数和方差分别为72.5和148.
应用创新
14.某校高二年级有男生400人和女生600人,为分析期末物理成绩,按照男女比例通过分层随机抽样的方法取到一个样本,样本中男生的平均成绩为80分,方差为10,女生的平均成绩为60分,方差为20,由此可以估计该校高二年级期末物理成绩的方差为    .
【答案】 112
【解析】 由400∶600=2∶3,不妨设样本由男生2人(x1,x2)和女生3人(y1,y2,y3)组成.由题设得(x1+x2)=80,即x1+x2=160;
(y1+y2+y3)=60,即y1+y2+y3=180,
所以样本的平均分=×(160+180)=68,
样本的方差s2=×[10+(80-68)2]+×[20+(60-68)2]=112,即估计该校高二年级期末物理成绩的方差为112.
21世纪教育网(www.21cnjy.com)