9.2.1 总体取值规律的估计--2023-2024学年高一数学教材配套教学精品课件(人教A版2019必修第二册)

文档属性

名称 9.2.1 总体取值规律的估计--2023-2024学年高一数学教材配套教学精品课件(人教A版2019必修第二册)
格式 pptx
文件大小 3.5MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2024-07-08 13:37:36

图片预览

文档简介

(共41张PPT)
实际问题
总体
总体数据
样本
抽样
普查
样本观测数据
总体的取值规律
总体的百分位数
总体的平均值、中位数、众数
总体的标准差、方差、极差
样本频率分布
样本的百分位数
样本的平均数、中位数、众数
样本的标准差、方差、极差
决策与建议


9.2.1 总体取值规律的估计
高一下学期
1、掌握极差、频率分布直方图的概念;
2、掌握频率分布表和频率分布直方图的画法;
3、掌握不同统计图的特点及适用情况;
4、会根据不同图表分析总结数据特点,作出相应决策.
重点:频率分布表和频率分布直方图的画法
难点:频率分布直方图的画法、根据不同图表分析总结数据特点
统计学是通过__________和__________来认识未知现象的一门科学,
它可以为人们制定决策提供依据。统计中数据分析的过程如下:
收集数据
整理数据
分析数据
构建模型
进行推断
获得结论
调查方法
统计图表
数字特征
统计案例
收集数据
分析数据
思考:我们在初中学过哪些统计图?
条形图
折线图
扇形图
频数分布
直方图
探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出.
某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 那么标准a定为多少比较合理呢?
●每户居民月均用水标准a如果定得太低,会影响很多居民的日常生活;●每户居民月均用水标准a如果定得太高,会不利于节约用水;
追问1:如何调查全市所有居民用户的月用水量分布情况?
思考:为了较为合理地确定出这个标准,需要做哪些工作?
必须先了解全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.
①全面调查:如果经费、时间等条件允许,可以通过全面调查获取过去一年全市所有居民用户的月均用水量数据
②抽样调查:由于全市的居民用户很多,通常采用抽样调查的方式,分析样本观测数据,估计全市居民用户月均用水量的分布情况.
追问2:在此问题中,总体和个体是什么?
总体是该市全体居民用户的月均用水量,个体是每户居民用户的月均用水量
探究:假设通过简单随机抽样,获得了100户居民用户的月均用水量数据:
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
(单位:)
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据.
优点:用样本在某区间内的频率可以估计总体在相应区间内的比例,但用样本在某区间内的频数不能直接估计总体在相应区间内的频数,需要将样本频数除以样本量后再乘总体中的个体数.
探究:假设通过简单随机抽样,获得了100户居民用户的月均用水量数据:
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
(单位:)
1、求极差:一组数据中最大值与最小值的差.
样本观测数据的最小值是_______,最大值是_______,
极差为______________, 这说明样本观测数据的变化范围是26.7 t.
1.3 t
28.0 t
28.0 1.3=26.7
2、决定组距与组数
①当样本量不超过100时,常分成5—12组.
②一般取等长组距,且组距应力求“取整”.
③分组时可以先确定组距,也可以先确定组数.
若取所有的组距为3,则,
即可以将数据分为9组,这也说明这个组距是比较合适的.
合适的组距与组数对发现数据分布规律有重要意义,数据的个数越多,所分的组数也越多.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.
1、求极差:最小值为1.3,最大值为28,极差为26.7
2、决定组距与组数:组距为3,分9组
3、将数据分组:
由于组距为3,9个组距的总长度为27,超过极差,
故可使第一组的左端点略小于数据中的最小值,
最后一组的右端点略大于数据中的最大值.
如,可取区间为[1.2,28.2],按如下方式把样本观测数据以组距3分为9组:
[1.2,4.2),[4.2,7.2),…,[25.2,28.2]
各组数值所在区间取左闭右开区间,最后一组取闭区间
4.列频率分布表:
计算各小组的频率
频率
频率和为1
频数和为样本量
从频率分布表可看出样本观测数据在各个小组的比例.
如:月均用水量在区间[4.2,7.2)内的居民用户最多;用水量超过16.2的各区间内数据所占比例较小……
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
5、画频率分布直方图:横轴表示月均用水量,纵轴表示
5、画频率分布直方图:横轴表示月均用水量,纵轴表示
①小长方形的高:
反映样本数据的疏密程度
②小长方形的面积:频率
纵轴用表示的优点:如果小长方形的高为频率,那么区间越长,长方形就越高,两个长度不同的区间的频率比较就没有意义.
1、求极差:最小值为1.3,最大值为28,极差为26.7
2、决定组距与组数:组距为3,分9组
3、将数据分组:[1.2,4.2),[4.2,7.2),…,[25.2,28.2]
4、列频率分布表:计算各小组的频率(频数和为样本量n,频率和为1)
5、画频率分布直方图:横轴表示月均用水量,纵轴表示
1、辨析:
(1)用样本的频率分布可以估计总体分布.( )
(2)频率分布直方图的纵轴表示频率.( )
(3)频率分布直方图中小矩形的面积表示该组的个体数.( )
2、一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( ).
A.10组 B.9组 C.8组 D.7组
A

×
×
3、某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分)
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
(1)将区间平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.
分组 频数 频率 频率组距
[30,40) 1 0.02 0.002
[40,50) 6 0.12 0.012
[50,60) 12 0.24 0.024
[60,70) 14 0.28 0.028
[70,80) 9 0.18 0.018
[80,90) 6 0.12 0.012
[90,100] 2 0.04 0.004
合计 50 1.00
0.012
0.024
0.028
0.018
0.004
0.002
得分
30 40 50 60 70 80 90 100
频率/组距
0.028
0.024
0.020
0.016
0.012
0.008
0.004
0
0.012
4、从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图所示.
(1)直方图中的值为________;
(2)这些用户中,用电量落在区间[100,250)内的户数为____.
教材P198 T1
0.0044
70
原理:频率和/长方形面积和为1
原理:样本容量×频率
5、如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.
(1) 通话时长在区间[15,20),[20,30) 内的次数分别为多少
(2) 区间[20, 30)上的小长方形高度低于[15, 20)上的小长方形的高度,说明什么
教材P198 T2
解:(1)通话时长在区间[15,20),
[20,30)内的次数分别为9次和12次
(2)区间[20,30)内的通话次数少于区间[15,20内的通话次数.
6、为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:千克)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12. 则该校报考飞行员的总人数为_____.
解:前三组的频率和为1-(0.037+0.013)×5=0.75,
第二组的频率为0.75×,
总人数为人.
48
思考:观察表和图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的语言描述吗?
从频率分布表可以清楚地看出,样本观测数据在各个小组的比例大小.例如月均用水量在区间内的居民用户最多,在区间内的次之,而且用水量超过16.2的各区间内数据所占比例较小,等等.
思考:观察表和图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的语言描述吗?
●频率分布的特点:
居民用户月均用水量的样本观测数据的分布不对称,图形左高、右低,右边有一个较长的“尾巴”.
●这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间[1.2,7.2)最为集中,少数居民用户的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.
用样本的频率分布估计总体的频率分布
由于样本的随机性,这种估计可能会存在一定误差
探究:分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图如下图.观察图形,你发现不同组数对于直方图呈现数据分布规律有什么影响
随着月均用水量的增加,居民用户数的频率在降低;大部分居民用户的月均用水量低于10.2 t.
随着月均用水量的增加,居民用户数的频率呈下降趋势 , 数据主要集中在低值区,尤其在区间[5.2,6.2)内最为集中。但存在个别区间频率变大或者缺少的现象.
组数少、组距大:容易从中看出数据整体的分布特点,但损失了较多的原始数据信息,无法看出每组内的数据分布情况;
组数多、组距小:保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点。
不同的频率分布也会影响人们对总体的判断,多积累经验
思考:除频率分布直方图外,我们在初中还学习过条形图、扇形图、折线图、频数分布直方图等,你能说出不同的统计图的特点吗?
扇形图主要用于直观描述各类数据占总数的比例
条形图主要用于直观描述不同类别或分组数据的频数;
直方图主要用于直观描述不同分组数据的频率;
折线图主要用于描述数据随时间的变化趋势
离散型数据
连续型数据
离散型数据
要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,以使我们通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律。
例题:已知某市2015年全年空气质量等级如表所示.
2022年5月和6月的空气质量指数如下:
5月 33 47 61 75 77 52 36 36 32 70
43 30 26 27 28 32 58 44 73 85
81 83 71 66 29 31 43 84 45 31 51
6月 44 78 89 49 37 25 31 48 47 60
51 38 30 36 43 66 78 84 75 85
100 74 41 27 89 58 43 27 22 30
选择合适的统计图描述数据,并回答下列问题:
(1)分析该市2022年6月的空气质量情况.
(2)比较该市2022年5月和6月的空气质量,哪个月的空气质量较好?
(3)比较该市2022年6月与该市2015年全年的空气质量,2022年6月的空气质量是否好于2015年?
解:(1)根据该市2022年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表.
从表中可以看出,6月的空气质量都为“优”或“良”,“优”、“良”的天数分别为17天和13天,各占整月的56.67%和43.33%.
空气质量等级 合计
优 良 轻度污染 中度污染 重度污染 严重污染
天数 17 13 0 0 0 0 30
比例 56.67% 43.33% 0 0 0 0 100%
我们可以用条形图和扇形图对数据做出直观的描述,如图一和图二.
●从条形图中可以看出,空气质量等级只有“优”和“良”两种,空气质量为“优”的天数比“良”的天数多,后四个等级的天数为零.
天数
5
10
15
20
空气质量等级
0


轻度污染
中度污染
重度污染
严重污染
●从扇形图中可以看出,空气质量为“优”的天数超过总天数的一半,其余的为“良”,因此整体上6月的空气质量很好.


56.67%
43.33%
●我们还可以用折线图展示空气质量指数随时间的变化情况,如图,容易发现,6月的空气质量指数在50附近波动.
解:(2)根据该市2022年5月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表.
空气质量等级 合计
优 良 轻度污染 中度污染 重度污染 严重污染
天数 17 14 0 0 0 0 31
比例 54.84% 45.16% 0 0 0 0 100%
天数
5
10
15
20
空气质量等级
0


轻度污染
中度污染
重度污染
严重污染
25
为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观的进行两个月的空气质量的比较.
由表和图可以发现,5月和6月空气质量基本相同,“优”的天数相同,均为17天,5月“良”的天数比6月多一天,两个月均没有为轻度污染及以上的天数.


(3)把2022年6月和2015年全年的空气质量进行比较,由于一个月和一年的天数差别很大,所以直接通过频数比较没有意义,应该转化为频率分布进行比较.可以通过二者的空气质量指数的频率分布直方图或空气质量等级的频率分布条形图进行比较.
频率
0.1
0.2
0.3
0.4
空气质量等级
0


轻度污染
中度污染
重度污染
严重污染
0.5
0.6
2022年6月
2015年全年
通过图可以看出,2022年6月的空气质量为“优”和“良”的频率都明显高于2015年,而且2022年6月空气质量为污染的天气频率为0,明显低于2015年,所以从整体上看,2022年6月的空气质量要明显好于2015年全年的空气质量.
(2018年全国1卷理科)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下列结论不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入
的总和超过了经济收入的一半
A
练习:(多)某公司对2023年的营收来源进行了统计,并绘制饼图如图所示.在华中地区的三省中,湖北省的营收额最多,河南省的营收额最少,湖南省的营收额约1421万元.则下列说法正确的是(    )
ACD
A.该公司在华东地区的营收额约为东北地区营收额的三倍
B,该公司在华南地区的营收额比西南地区的营收额和河南
省的营收额之和还要多
C.该公司2023年营收总额约为20300万元
D.该公司在湖南省的营收额在华中地区的营收额的占比约为34.18%
练习:华为、抖音海外版事件暴露了我国计算机行业中芯片、软件两大短板,为防止“卡脖子”事件的再次发生,科技专业人才就成了决胜的关键. 为了解我国在芯片、软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列不一定正确的是( )
A.芯片、软件行业从业者中,“90后”占总人数的比例超过50%
B.芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%
C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
C