6.3 用样本估计总体分布 课件-2022-2023学年高一上学期数学北师大版(2019)必修第一册(共29张PPT)

文档属性

名称 6.3 用样本估计总体分布 课件-2022-2023学年高一上学期数学北师大版(2019)必修第一册(共29张PPT)
格式 pptx
文件大小 2.1MB
资源类型 教案
版本资源 北师大版(2019)
科目 数学
更新时间 2022-09-09 21:49:21

图片预览

内容文字预览

(共29张PPT)
6.3 用样本估计总体分布
我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准,用水量不超过的部分按平价收费,超出的部分按议价收费.如果希望85%以上的居民的日常生活不受影响,那么标准定为多少比较合理 你认为较为合理地确定出这个标准,需要做哪些工作
1.从频数到频率
【答案】“100个玉米种子中有10个不合格”与“黏玉米种子的发芽率是1%”,当数量较大时是大不相同的,因此只知道某个指标的频数是不够的,还需要用频率来刻画.
【问题情境】小明的妈妈在某种子公司买了一包黏玉米的种子,经试种发现有10粒是不发芽的,小明根据黏玉米种子的数量说黏玉米种子的发芽率是1%.
【问题】上面哪一个数据能更好地反映种子发芽的情况
频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数.在实际问题中,如果总体容量比较小,频数也可以较客观地反映总体分布;当总体容量较大时,频率就能更客观地反映总体分布.
在统计中,经常要用样本数据的频率去估计总体中相应的频率,即对总体分布进行估计
抽象概括
【例1】下面是某批乒乓球质量检查结果表:
学以致用
抽取球数 50 100 200 500 1000 2000
优等品数 45 92 194 470 954 1902
优等品出 现的频率
在上表中填上优等品出现的频率.
【解析】如下表所示:
学以致用
抽取球数 50 100 200 500 1000 2000
优等品数 45 92 194 470 954 1902
优等品出 现的频率 0.9 0.92 0.97 0.94 0.954 0.951
【方法小结】频率是事件发生的次数与试验总次数的比值,利用此公式可求出事件的频率.
【针对训练】某市共有5000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成频率分布表:
根据上面的频率分布表,可得①处的数值为_______,②处的数值为_______,③处的数值为________,④处的数值为_________.
分组/分 频数 频率
[80,90) ① ②
[90,100) 0.050
[100,110) 0.200
[110,120) 36 0.300
[120,130) 0.275
[130,140) 12 ③
[140,150] 0.050
合计 ④
【解析】由位于[110,120)的频数为36,频率,得样本容量,即④处的数值为120,所以[130,140)的频率,即③处的数值为0.100.
②处的数值,①处的数值为.
2.频率分布直方图
【问题情境】已知下列数据:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48,70.
【问题1】上述45个数据中最大值与最小值的差是多少
【答案】70-42=28.
【问题2】若将上述数据分成下列几组:
[41.5,46.5),[46.5,51.5),[51.5,56.5),[56.5,61.5),[61.5,66.5),[66.5,71.5).
各组中的数据个数分别是多少
【答案】各组中数据的个数分别为4,11,14,9,4,3.
2.频率分布直方图
【问题情境】已知下列数据:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48,70.
【问题3】我们初中学过的频数分布图和频数分布表能清楚地知道数据分布在各个小组的个数,那么如何刻画各个小组数据在样本量中所占的比例大小呢
【答案】利用频率分布表和频率分布直方图.
1.一般地,当总体很大或不便获取时,用样本的频率分布估计总体的频率分布.把反映总体频率分布的表格称为频率分布表.
2.把表示样本数据分布规律的图形称为频率分布直方图.
3.制作频率分布表与频率分布直方图的一般步骤:
(1)求极差,即计算最大值与最小值的差.
(2)决定组距与组数.当样本量不超过100时,常分成5~12组,为了方便起见,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表.一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本量,频率合计是1.
(5)画频率分布直方图.横轴表示分组,纵轴表示.小长方形的面积.各小长方形的面积和等于1.
4.在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
抽象概括
【例2】某农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度(单位:cm)如下:
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表,绘制出频率分布直方图和频率折线图,并估计在这块试验田里长度在5.75 cm~6.35 cm之间的麦穗所占的百分比.
学以致用
学以致用
【解析】(1)计算极差:7.4-4.0=3.4.
决定组距与组数:若取组距为0.3,则(3"." 4)/(0"." 3)≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.
决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
列频率分布表:
分组 频数 频率
[3.95,4.25) 1 0.01
[4.25,4.55) 1 0.01
[4.55,4.85) 2 0.02
[4.85,5.15) 5 0.05
[5.15,5.45) 11 0.11
[5.45,5.75) 15 0.15
[5.75,6.05) 28 0.28
[6.05,6.35) 13 0.13
学以致用
【解析】(续表)
分组 频数 频率
[6.35,6.65) 11 0.11
[6.65,6.95) 10 0.10
[6.95,7.25) 2 0.02
[7.25,7.55] 1 0.01
合计 100 1.00
学以致用
【解析】(2)绘制频率分布直方图如图.
绘制频率折线图如图.
学以致用
【解析】(3)从表中看到,样本数据落在5.75 cm~6.35 cm之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75 cm~6.35 cm之间的麦穗约占41%
【方法小结】绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
【针对训练】下表给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm)
(1)列出样本频率分布表,频率精确到0.01;
(2)画出频率分布直方图和频率折线图;
(3)估计身高小于134 cm的人数占总人数的百分比.
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)
人数 5 8 10 22 33
区间界限 [142,146) [146,150) [150,154) [154,158]
人数 20 11 6 5
【解析】(1)样本频率分布表如下:
分组 频数 频率
[122,126) 5 0.04
[126,130) 8 0.07
[130,134) 10 0.08
[134,138) 22 0.18
[138,142) 33 0.28
[142,146) 20 0.17
[146,150) 11 0.09
[150,154) 6 0.05
[154,158] 5 0.04
合计 120 1.00
【解析】(2)其频率分布直方图如下:
其频率折线图如下:
(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,
所以我们估计身高小于134 cm的人数占总人数的19%
【例3】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组、频数分布表和频率分布直方图如下:
探究:频率分布直方图的应用
组号 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18] 2
合计 100
(1)求频率分布直方图中的,的值.
(2)在区间[10,12)上的小矩形的高度低于[8,10)上的小矩形的高度,说明什么
探究:频率分布直方图的应用
【方法指导】(1)根据频率分布直方图的性质建立等式求解;(2)根据小矩形高的统计意义解释.
探究:频率分布直方图的应用
【解析】(1)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以.
(2)在区间[10,12)上的小矩形的高度低于[8,10)上的小矩形的高度,说明在区间[10,12)上频率与组距的比值小于[8,10)上的频率与组距的比值,即区间[10,12)上的频率小于[8,10)上的频率.
【探究小结】一般用频率分布直方图反映样本的频率分布,其中,
(1)频率分布直方图中纵轴表示;
(2)频率分布直方图中,各个小长方形的面积等于频率,各个小长方形的面积之和为1;
(3)长方形的高的比也就是频率之比.
【针对训练】某工厂对一批产品进行了抽样检测.如图所示的是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本容量等于_______;样本中净重大于或等于98克并且小于104克的产品的个数为________.
【解析】产品净重小于100克的频率为,已知样本中产品净重小于100克的个数是36,则,所以,
净重大于或等于98克并且小于104克的产品的个数是.
120
90
1.有一个容量为100的样本,其数据的分组与各组的频数如下:
2.某电子商务公司对10000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
分组 [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70)
频数 12 13 24 15 16 13 7
则样本数据落在[10,40)上的频率为(  ).
A.0.13 B.0.39 C.0.52 D.0.64
(1)频率分布直方图中的=_______;
(2)在这些购物者中,消费金额在区间[0.5,0.9]
内的购物者的人数为________.
3.从高三参加数学竞赛的学生中抽取50名学生的成绩(单位:分),成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在80分以下的学生比例.
【解析】样本数据落在[10,40)上的频数为,故其频率为.
1.有一个容量为100的样本,其数据的分组与各组的频数如下:
分组 [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70)
频数 12 13 24 15 16 13 7
则样本数据落在[10,40)上的频率为(  ).
A.0.13 B.0.39 C.0.52 D.0.64
C
【解析】由频率分布直方图及频率和等于1可得,解得,消费金额在区间[0.5,0.9]内的频率为,所以消费金额在区间[0.5,0.9]内的购物者的人数为.
2.某电子商务公司对10000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)频率分布直方图中的=_______;
(2)在这些购物者中,消费金额在区间[0.5,0.9]
内的购物者的人数为________.
3.0
6000
【解析】(1)频率分布表如下:
3.从高三参加数学竞赛的学生中抽取50名学生的成绩(单位:分),成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在80分以下的学生比例.
成绩分组 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 10 0.2
[70,80) 15 0.3
[80,90) 12 0.24
[90,100] 8 0.16
合计 50 1
【解析】(2)频率分布直方图如图所示.
频率折线图如图所示.
【解析】(3)样本中成绩在[60,90)分的学生比例为.由样本估计总体,成绩在[60,90)分的学生约占74%.
(4)样本中成绩在80分以下的学生比例为由样本估计总体,成绩在80分以下的学生约占60%.