(新课标)人教A版数学必修3(课件+教案+练习)第2章 2.2 2.2.1 用样本的频率分布估计总体分布:59张PPT

文档属性

名称 (新课标)人教A版数学必修3(课件+教案+练习)第2章 2.2 2.2.1 用样本的频率分布估计总体分布:59张PPT
格式 zip
文件大小 3.0MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-10-15 13:56:11

文档简介

课件59张PPT。第二章 统计2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
最大值与最小值分组不小于k的最小整数左闭又开频数累计频数合计样本容量1频率/组距各小长方形的面积1频率上端的中点组数光滑曲线茎叶小到大较少记录较多频率分布直方图的绘制 频率分布直方图的应用 茎叶图的绘制及应用 点击右图进入…Thank you for watching !2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
学 习 目 标
核 心 素 养
1.会用频率分布表,画频率分布直方图表示样本数据.(难点)
2.能通过频率分布表和频率分布直方图对数据做出总体统计.(重点)
3.理解茎叶图的概念,会画茎叶图.(重点)
1.通过频率分布直方图和茎叶图的学习,培养数据分析素养.
2.借助图表中的数据运算,提升数学运算素养.
1.频率分布直方图的画法
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图.
(2)总体密度曲线:
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
3.茎叶图
(1)茎叶图的制作方法(以两位数据为例):
将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.
(2)茎叶图的优缺点
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,茎叶就会很长.
思考:通过抽样获取的原始数据有何缺点?
[提示] 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.
1.下列关于茎叶图的叙述正确的是(  )
A.将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面
B.茎叶图只可以分析单组数据,不能对两组数据进行比较
C.茎叶图更不能表示三位数以上的数据
D.画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出
A [由茎叶图的概念可得.]
2.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为(  )
A.10组      B.9组
C.8组 D.7组
A [由题意知,=9.2,故应分成10组.]
3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有(  )
A.30辆 B.40辆
C.60辆 D.80辆
C [由直方图知,时速在[50,60)内的频率为0.03×10=0.3,故此段内汽车有200×0.3=60辆.]
4.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.
5
1 5
6
0 3 4 4 6 7 8 8 9
7
3 5 5 5 6 7 9
8
0 2 3 3 5 7
9
1
4% 51 [由茎叶图知,样本容量为25,90分以上有1人,故优秀率为×100%=4%,最低分为51分.]
频率分布直方图的绘制
[探究问题]
1.要做频率分布表,需要对原始数据做哪些工作?
[提示] 分组、频数累计、计算频数和频率.
2.画频率分布直方图时,如何决定组数与组距?
[提示] 若为整数,则=组数.
若不为整数,则+1=组数.
注意:[x]表示不大于x的最大整数.
3.同一组数据,如果组距不同,得到的频率分布直方图也会不同吗?
[提示] 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.
【例1】 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据上面的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;
(3)分析频率分布直方图,你能得出什么结论?
思路点拨:按画频率分布直方图的步骤进行绘制.
[解] (1)这次测验成绩的最低分是32分,最高分是97分.
(2)根据题意,列出样本的频率分布表如下:
分组
频数
频率
[30,40)
1
0.02
[40,50)
6
0.12
[50,60)
12
0.24
[60,70)
14
0.28
[70,80)
9
0.18
[80,90)
6
0.12
[90,100]
2
0.04
合计
50
1.00
频率分布直方图如图所示.
(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.
1.(变条件)美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图.
[解] 以4为组距,列表如下:
频率分布直方图如下:
2.(变结论)本例条件不变,若把所给数据去掉一个最高分和一个最低分后分成5组,试画出这48名学生智力测验成绩的频率分布直方图.
[解] 列出频率分布表如下:
频率分布直方图如下:
绘制频率分布直方图应注意的问题
(1)组数与样本容量有关,一般地,样本容量越大,所分组数越多.当样本容量不超过100时,按数据的多少,常分成5~12组.
(2)在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.
(3)一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,纵轴是频率/组距,而不是频率.
频率分布直方图的应用
【例2】 如图所示是总体的一个样本频率分布直方图,且在[15,18)内频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本容量;
(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.
思路点拨:紧扣频率分布直方图的性质,结合已知数据求解.
[解] 由样本频率分布直方图可知组距为3.
(1)由样本频率分布直方图得样本在[15,18)内的频率等于×3=.
(2)∵样本在[15,18)内频数为8,由(1)可知,样本容量为=8×=50.
(3)∵在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内频数为8,故在[18,33)内的频数为47-8=39.
频率分布直方图的性质
(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)=样本容量.
1.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)求直方图中x的值;
(2)在这些用户中,求用电量落在区间[100,250)内的户数.
[解] (1)由频率分布直方图知[200,250)小组的频率为1-(0.002 4+0.003 6+0.006 0+0.002 4+0.001 2)×50=0.22,于是x==0.004 4.
(2)∵数据落在[100,250)内的频率为(0.003 6+0.006 0+0.004 4)×50=0.7,
∴所求户数为0.7×100=70.
茎叶图的绘制及应用
【例3】 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107.
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
思路点拨:题中可以用十位数字为茎,个位数字为叶作茎叶图.然后由茎叶图的特点分析两人的成绩.
[解] 甲、乙两人数学成绩的茎叶图如图所示:
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.
绘制茎叶图的注意点
(1)绘制茎叶图时需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一.
(2)茎叶图可用于确定数据的中位数,判断数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等.
2.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.
96 92 乙 [由茎叶图知,甲班最高分是96分,乙班的最高分是92.甲班的成绩集中在60~80间,乙班的成绩集中在70~90间,故乙班的平均成绩较高.]
1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.
2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
1.判断下列结论的正误(正确的打“√”,错误的打“×”)
(1)用样本的频率分布可以估计总体分布. (  )
(2)频率分布直方图的纵轴表示频率. (  )
(3)只有两位的数据能用茎叶图表示. (  )
[答案] (1)√ (2)× (3)×
2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)内的频率为(  )
A.0.1 B.0.2 C.0.3 D.0.4
C [由图可得,新生儿体重在[2 700,3 000)内的频率为0.001×300=0.3.]
3.如图所示的茎叶图表示的是一台自动售货机的销售情况,则茎叶图中9表示的销售额为(  )

A.9 B.49 C.29 D.1 349
C [观察茎叶图,分清楚茎和叶即可.分开茎、叶的竖线左侧仅有一列,表示茎,右侧有多列,表示叶,所以9表示的销售额为29.]
4.某班50名同学参加数学测验,成绩的分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图.
[解] (1)频率分布表如下:
分组
频数
频率
[40,50)
2
0.04
[50,60)
3
0.06
[60,70)
10
0.2
[70,80)
15
0.3
[80,90)
12
0.24
[90,100]
8
0.16
(2)频率分布直方图如下:
课时分层作业(十二) 用样本的频率分布估计总体分布
(建议用时:60分钟)
[基础达标练]
一、选择题
1.下列命题正确的是(  )
A.频率分布直方图中每个小矩形的面积等于相应组的频数
B.频率分布直方图的面积为对应数据的频率
C.频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比
D.用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26
C [在频率分布直方图中,横轴表示样本数据,纵轴表示,由于小矩形的面积=组距×=频率,所以各小矩形面积等于相应各组的频率.]
2.如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于(  )
A.0.120   B.0.180
C.0.012 D.0.018
D [由图可知纵坐标表示频率/组距,故x=0.1-0.054-0.010-0.006×3=0.018.]
3.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知(  )


0
8
9
5
0
1
2
4
7
8
9
3
2
2
1
9
9
8
7
5
4
2
1
3
3
6
9
4
4
4
0
1
5
2
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
A [从茎叶图可以看出:甲运动员的成绩主要在30以上,乙运动员的成绩主要在30以下,所以甲的成绩比乙的成绩好.]
4.某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是(  )
A.45 B.50
C.55 D.60
B [由频率分布直方图的特点知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班学生人数为=50人.]
5.如图是2018年某市青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有(  )


0
7
9
5
4
5
5
1
8
4
4
6
4
7
m
9
3
A.a1>a2
B.a2>a1
C.a1=a2
D.a1,a2的大小与m的值有关
B [由茎叶图,去掉一个最高分和一个最低分后,甲的平均分a1==84,乙的平均分a2==85,故a1二、填空题
6.某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180分钟到330分钟之间,按他们学习时间的长短分5个组统计,得到如下频率分布表:
第一组
[180,210)
0.1
第二组
[210,240)
8
s
第三组
[240,270)
12
0.3
第四组
[270,300)
10
0.25
第五组
[300,330]
t
则分布表中s,t的值分别为________.
0.2,0.15 [s==0.2,t=1-0.1-s-0.3-0.25=0.15.]
7.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图(如图)表示,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为________.

60 [由茎叶图知,抽取20名教师中使用多媒体进行教学的次数在[15,25)内的人数为6人,频率为,故200名教师中使用多媒体进行教学次数在[15,25)内的人数为×200=60人.]
8.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.
12 [由题意,第一组和第二组的频率之和为0.24+0.16=0.4,故样本容量为=50,又第三组的频率为0.36,故第三组的人数为50×0.36=18,故该组中有疗效的人数为18-6=12.]
三、解答题
9.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.
[解] (1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:
分组
频数
频率
[149.5,153.5)
1
0.025
[153.5.157.5)
3
0.075
[157.5,161.5)
6
0.15
[161.5,165.5)
9
0.225
[165.5,169.5)
14
0.35
[169.5,173.5)
3
0.075
[173.5,177.5)
3
0.075
[177.5,181.5]
1
0.025
合计
40
1
(2)频率分布直方图如图所示.
10.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
[解] (1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物更加通俗易懂、简单明了.
[能力提升练]
1.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是(  )
0
7
3
1
7
6
4
4
3
0
2
7
5
5
4
3
2
0
3
8
5
4
3
0
A [由分组可知C、D两项一定不对;由茎叶图可知,[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,直方图中矩形的高应相等.故B不对;选A.]
2.某教育机构随机抽查某校20个班级,调查各班关注“汉字听写大赛”的学生人数,根据所得数据的茎叶图,以5为组距将数据分组成[0,5),[5,10),[10,15),[15,20),[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始的茎叶图可能是(  )
   
A         B
   
C         D
A [由频率分布直方图知,各组频数统计如下表:
分组
[0,5)
[5,10)
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40]
频数
1
1
4
2
4
3
3
2
结合各选项茎叶图中的数据可知选项A正确.]
3.某高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图的可见部分如图所示,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为________.
25,2 [由频率分布直方图知,分数在[90,100]内的频率和[50,60)内的频率相同,所以分数在[90,100]内的人数为2人,总人数为=25人.]
4.某地区为了解70~80岁的老人的日平均睡眠时间(单位:h),随机选择了50位老人进行调查,下面是这50位老人睡眠时间的频率分布表:
序号i
分组(睡眠时间)
组中值(Gi)
频数(人数)
频率(Fi)
1
[4,5)
4.5
6
0.12
2
[5,6)
5.5
10
0.20
3
[6,7)
6.5
20
0.40
4
[7,8)
7.5
10
0.20
5
[8,9]
8.5
4
0.08
在上述统计数据的分析中,一部分计算见程序框图(如图),则输出的S的值是________.
6.42 [观察程序框图知,此图包含一个循环结构,即求G1F1+G2F2+G3F3+G4F4+G5F5的值,由频率分布表知,S=G1F1+G2F2+G3F3+G4F4+G5F5=4.5×0.12+5.5×0.20+6.5×0.40+7.5×0.20+8.5×0.08=6.42.]
5.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图:(如图所示)
分组
频数
频率
一组
0≤t<5
0
0
二组
5≤t<10
10
0.10
三组
10≤t<15
10

四组
15≤t<20

0.50
五组
20≤t≤25
30
0.30
合计
100
1.00
解答下列问题:
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图;
(3)旅客购票用时的平均数可能落在哪一组?
[解] (1)样本容量是100.
(2)①50 ②0.10 所补频率分布直方图如图中的阴影部分:
(3)设旅客平均购票用时为t min,则有
≤t
<,
即15≤t<20.所以旅客购票用时的平均数可能落在第四组.