课件66张PPT。第一章统计§5 用样本估计总体§6 统计活动:结婚年龄的变化自主预习学案据汽车工业协会统计,2014年上半年汽车生产952.92万辆,同比增长4.08%,同比增幅提高1.6个百分点;汽车销售959.81万辆,同比增长2.93%,同比增幅下降0.4个百分点. 1、2季度汽车销售分别为479.55万辆和480.62万辆,1季度同比下降3.89%,2季度同比增长10.03%,2季度较1季度增速提高了13.92个百分点. 6月汽车生产153.13万辆,同比增长9.09%,环比下降2.37%;销售157.75万辆,同比增长9.86%,环比下降1.66%.
以上数据就是通过用样本来估计总体来实现对总体的估计,这就是我们本节要学习的内容. 1.估计总体的分布
(1)要估计总体频率分布情况,我们常用_____________、_________________、_____________来估计.
(2)在频率分布直方图中,每个小矩形的宽度为_________(分组的宽度),高为______,小矩形的面积恰为相应的频率_______,所有小矩形的面积之和等于_____.频率分布表 频率分布直方图 频率折线图 Δxi fi 1 (3)在频率分布直方图中,按照分组的原则,再在左边和右边各加一个区间,从所加的左边区间的_______开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就得到一条折线,我们称之为_____________.
(4)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的_______.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越准确.
(5)随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之_______,相应的频率折线图就会越来越接近于一条___________.中点 频率折线图 概率 减小 光滑曲线 样本平均数 样本标准差 估计 1.下列关于频率分布直方图中小矩形的高的说法正确的是( )
A.表示该组上的个体在样本中出现的频率
B.表示取某数的频率
C.表示该组上的个体数与组距的比值
D.表示该组上的个体在样本中出现的频率与组距的比值
[解析] 频率分布直方图中小矩形的高是频率与组距的比,面积才表示频率,故选D.D2.一个容量为32的样本,已知某组样本的频率为0.062 5,则该组样本的频数为( )
A.2 B.4
C.6 D.8A40 4.为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得的数据画出样本的频率分布直方图(如图所示),那么在这100株树木中,底部周长小于110 cm的株数是_______.70 [解析] 底部周长小于110 cm的株数是落在前三个区间的数目,相对应的小长方形的面积的和为(0.01+0.02+0.04)×10=0.7,此即为100株树木中底部周长小于110 cm的株数的频率,故所求株数为100×0.7=70.5.调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 158 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.[解析] (1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;
确定组距为4,组数为8,频率分布表如下:(2)频率分布直方图如图所示.互动探究学案命题方向1 ?频率分布表与频率分布直方图 已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27, 29,25,28.
(1)列出样本的频率分布表;
(2)画出频率分布直方图.
[思路分析] 由题目可获取以下主要信息:
①样本数据给出,容量为20;
②样本数据中,最大值是30,最小值是21,解答本题可根据极差,选择适当的组距进行分组,然后列表、画图即可. 列出频率分布表如下:(2)样本的频率分布直方图如下:『规律总结』 1.掌握画频率分布直方图的步骤,频率分布直方图的处理与坐标系的单位长度有关,为了图形的直观性,要注意单位长度.
2.要掌握频率分布直方图的特点,尤其是面积表示频率.
3.由频率分布直方图得到的频率是不准确的,只能估计出可能性,它把原始数据特征丢失了,只能分析出哪部分数据出现的较多或较少,分析不出具体的数据.
〔跟踪练习1〕 有一容量为200的样本,数据的分组以及各组的频数如下:
[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)求样本数据不足0的频率.[解析] (1)频率分布表如下:(2)频率分布直方图如下图所示.命题方向2 ?折线图及应用 抽查100袋洗衣粉,测量它们的净重如下(单位:g):
494 498 493 505 496 492 485 483 508 511
495 494 483 485 511 493 505 488 501 491
493 509 509 512 484 509 510 495 497 498
504 498 483 510 503 497 502 511 497 500
493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489
494 501 509 498 502 500 508 491 509 509
499 495 493 509 496 509 505 499 486 491
492 496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501 496
(1)列出样本的频率分布表;
(2)画频率分布直方图及频率分布折线图;
(3)估计净重在494.5~506.5 g之间的频率.(2)频率分布直方图及频率分布折线图如下图:
(3)净重在494.5~506.5 g之间的频率为0.21+0.14+0.09=0.44.『规律总结』 (1)频率折线图能直观地反映数据的增减或变化趋势.
(2)按照步骤绘制频率分布直方图和频率分布折线图,分组要尽量取整,当数据为30~100个时应分5~12组为宜.
(3)画图时,横轴和纵轴的单位可不一致.〔跟踪练习2〕 有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.[解析] (1)样本的频率分布表为(2)频率分布直方图和频率分布折线图如下图.
(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,
故起始月薪低于2 000元的频率的估计是0.94.命题方向3 ?频率分布直方图的应用 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示).已知从左到右各长方形的高的比为2︰3︰4︰6︰4︰1,第三组的频数为12.请解答下列问题:(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,这两组哪组获奖率较高?
[思路分析] 本题给出了频率分布直方图,长方形高的比即面积比,以及第三组的频数为12.
解答时可先由第三小组入手,再利用长方形高的比即面积比,从而得到各小组频率的比解决问题.
〔跟踪练习3〕 为了解小学生的体能情况,抽取了某小学同一年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如下图,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.
(1)求第四小组的频率.
(2)问参加这次跳绳测试的学生人数n是多少?
(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?
[解析] (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2.
(2)n=第一小组的频数÷第一小组的频率=5÷0.1=50.
(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内.命题方向4 ?用样本的数字特征估计总体的数字特征 下面是60名男生每分钟脉搏跳动的次数:
72,70,66,74,81,70,74,53,57,62,58,92,72,67,62,91,73,64,65,80,78,67,75,80,83,61,72,69,70,76,74,65,84,79,80,76,72,68,65,82,79,71,86,77,69,72,59,70,62,76,56,86,63,73,70,75,73,89,64.
(1)作出上述数据的频率分布直方图;
(2)根据频率分布直方图的各组中值估计总体平均数,并将所得结果与实际的总体平均数相比较,计算误差;
(3)估计每分钟脉搏跳动次数的范围. [思路分析] 列频率分布表→画频率分布直方图→利用中值估计平均数→计算平均数→求标准差s→结论列表:『规律总结』 1.利用频率分布直方图求数字特征:
(1)在频率分布直方图中,众数是最高的矩形的底边的中点.
(2)在频率分布直方图中,中位数左边和右边的直方图的面积相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.〔跟踪练习4〕 从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.[解析] (1)由众数的概念可知,众数是出现次数最多的数. 在直方图中高度最高的小矩形框的中间值的横坐标即为所求,所以众数应为75.
在频率分布直方图中,中位数的左右两边频数应相等.,即频率也相等,从而矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
因为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,所以前三个小矩形面积的和为0.3.
而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
所以中位数应位于第四个小矩形内,设其底边为x,高为0.03,
所以令0.03x=0.2,得x≈6.7,
故中位数应为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”, 即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
所以平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)≈74.
综上(1)众数是75,中位数约为76.7;
(2)平均成绩为74.频率分布直方图理解不正确 中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如右图所示.从左至右五个小组的频率之比依次是5︰7︰12︰10︰6,则全市高一学生视力在[3.95,4.25)范围内的学生约有多少人?统计活动中的数据分析 某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变,有关数据如表所示:
(1)该风景区称调整前后这5个景点门票的平均收费不变,日平均收入持平,问风景区是怎样计算的?
(2)另一方面,游客认为调整收费后风景区的日平均总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的?
(3)你认为风景区和游客哪一个的说法较能反映整体实际?
[思路分析] 按照以下步骤操作:列出五个景点门票调整前后的价格,求调整前后的平均价格,统计日平均人数,计算日平均收入,分析数据.『规律总结』 (1)统计活动中的数据分析,可以分析数据中的平均值、方差、标准差、中位数、众数等数字特征数,从而全面把握总体情况.
(2)统计活动中的数据分析,可以采用图表来分析,如条形图、扇形图、折线图、直方图以及茎叶图等,这样得到的结果更直观,更能体现出各部分所占的分量.1.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是( )
A.总体的容量越大,估计越准确
B.总体的容量越小,估计越准确
C.样本的容量越大,估计越准确
D.样本的容量越小,估计越准确
[解析] 根据样本的频率分布可知,样本的频率分布反映的是总体中部分个体的频率分布,只有当样本的容量越大时,估计才越准确.C2.有一个容量为66的样本,数据的分组及各组的数据如下:估计数据落在[31.5,43.5]的概率是( )B3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )CA.6 B.8
C.12 D.184.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=_____;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为____________.3 6 000
[解析] 由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3,消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.5.在一次人才招聘会上,某公司的招聘人员告诉你:“我们公司员工的收入水平很高.去年,在50名员工中,最高年收入达到100万元,他们年收入的平均数是3.5万元”,如果你希望获得年收入2.5万元.
(1)判断自己能否成为此公司的一名高收入者?
(2)如果招聘人员继续告诉你:“员工年收入的变化范围是从0.5万元到100万元”,这个信息能否足以使你作出自己是否受聘的决定?为什么?
(3)如果招聘人员继续给你提供了如下的信息:“员工中年收入在中间50%(即去掉最少的25%和最多的25%后所剩下的)在变化范围是从1万元到3万元”,你又该如何使用这条信息来作出自己是否受聘的决定?
(4)你能估计出该公司员工年收入的中位数是多少吗?为什么平均数比估计出的中位数高很多?第一章 §5 §6
A级 基础巩固
一、选择题
1.有一个容量为200的样本,其频率分布直方图如图所示,则样本数据在[8,10)内的频数为( C )
A.38 B.57
C.76 D.95
[解析] 样本数据在[8,10)外的频率为(0.02+0.05+0.09+0.15)×2=0.62,所以样本数据在[8,10)内的频率为1-0.62=0.38,所以样本数据在[8,10)内的频数为0.38×200=76,故选C.
2.下列叙述中正确的是( C )
A.从频率分布表可以看出样本数据对于平均数的波动大小
B.频数是指落在各个小组内的数据
C.每小组的频数与样本容量之比是这个小组的频率
D.组数是样本平均数除以组距
[解析] A中表示样本数据对于平均数波动大小的为方差与标准差;B中频数为落在各小组内数据的个数;D中组数是极差除以组距.
3.从一堆苹果中任取10只,称得它们的质量如下(单位:克):
125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5)内的频率为( C )
A.0.2 B.0.3
C.0.4 D.0.5
[解析] 数据落在[114.5,124.5)内的有:120,122,116,120,共4个,故所求频率为=0.4,故选C.
4.容量为20的样本数据,分组后的频数如下表:
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
频数
2
3
4
5
4
2
则样本数据落在区间[10,40)的频率为( B )
A.0.35 B.0.45
C.0.55 D.0.65
[解析] 本题考查了频数的运算,
由表可知样本数据落在[10,40)的频数为2+3+4=9,故频率为=0.45.
求频率要准确确定其频数及该样本的容量.
5.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( D )
A.56 B.60
C.120 D.140
[解析] 由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.
6.已知样本:10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12.那么频率为0.2的范围是( D )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
[解析] 只要列出频率分布表,就可找到答案,频率分布表如下表.
分组
频数累计
频数
频率
5.5~7.5
2
0.1
7.5~9.5
正一
6
0.3
9.5~11.5
正
8
0.4
11.5~13.5
4
0.2
合计
20
1
从表中可以知道频率为0.2的范围是11.5~13.5.
二、填空题
7.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽样的100根中,有_30__根棉花纤维的长度小于20 mm.
[解析] 本题主要考查频率分布直方图的应用,从而考查考生的识图与用图能力,同时也考查了考生的数据处理能力和分析解决问题的能力.
由题意知,棉花纤维的长度小于20 mm的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20 mm的有0.3×100=30(根).
8.将容量为n的样本中的数据分成6组,绘制成频率分布直方图.若第一组至第六组数据的频率之比为2︰3︰4︰6︰4︰1,且前三组数据的频数之和等于27,则n等于_60__.
[解析] 设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,解得x=,所以前三组数据的频率分别是,,,故前三组数据的频数之和等于++=27,解得n=60.
三、解答题
9.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].
(1)求出x的值;
(2)已知样本中身高小于100厘米的人数是36,求出样本总量N的数值;
(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.
[解析] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,且频率之和等于1,
∴0.050×2+0.100×2+0.125×2+0.150×2+x×2=1,
∴x=0.075.
(2)样本中身高小于100厘米的频率为
(0.050+0.100)×2=0.3.
∴样本容量N==120.
(3)样本中身高大于或等于98厘米并且小于104厘米的频率为(0.100+0.150+0.125)×2=0.75.
∴学生数为120×0.75=90人.
B级 素养提升
一、选择题
1.对某校400名学生的体重(单位:kg)进行统计,得到如图所示的频率分布直方图,则学生体重在60 kg以上的人数为( B )
A.200 B.100
C.40 D.20
[解析] 由频率分布直方图可知学生体重在60 kg以上的频率为(0.04+0.01)×5=0.25,故学生体重在60 kg以上的人数为400×0.25=100.
2.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则b等于( A )
分组
[100,200]
(200,300]
(300,400]
(400,500]
(500,600]
(600,700]
频数
10
30
40
80
20
m
频率
0.05
0.15
0.2
0.4
a
b
A.0.1 B.0.2
C.0.25 D.0.3
[解析] 样本容量n==200,∴m=20.
又=a,∴a=0.1.
则b=1-(0.05+0.15+0.2+0.4+0.1)=0.1.
二、填空题
3.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是_600__.
[解析] 由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,
故3 000名学生中成绩低于60分的学生数为:3 000×0.2=600(人).
4.为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:kg)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1︰2︰3,其中第2小组的频数为12.则该校报考飞行员的总人数为_48__.
[解析] 设报考飞行员的总人数为n,
设第一小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,
解得a=0.125,
所以第2小组的频率为0.25.
又第2小组的频数为12,
则有0.25=,所以n=48.
三、解答题
5.某市2017年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
[解析] (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111)
2
(2)频率分布直方图,如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
6.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
B地区用户满意度评分的频数分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
B地区用户满意度评分的频率分布直方图
(2)根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
[解析] (1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值,B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区的用户的满意度等级为不满意的概率大.
记CA表示事件“A地区的用户的满意度等级为不满意”;CB表示事件“B地区的用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.所以A地区的用户的满意度等级为不满意的概率大.