课题: 9.2.1 总体取值规律的估计(第07周 第02课时 总032课时)
学习目标:
通过实例学会列频率分布表,画频率分布直方图,能恰当地选择上述方法分析样本的分布,准确地做出总体估计,发展学生数据分析和数学建模的素养。
重点难点:列频率分布表,画频率分布直方图
新课学习:
一、频率分布直方图
1、绘制步骤:
(1)求_______,即计算一组数据中最大值与最小值的差。
(2)决定______与_______。组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越_____,当样本容量不超过100时,按照数据的多少,常分为_________组,组数=___________________
(3)将数据______。区间一般_______________
(4)列出________________
(5)画出频率分布直方图,其中横轴表示___________,纵纵轴表示_________________。
2、意义:
频率分布直方图中,每个小矩形的面积表示相应组的_____,所有小矩形的面积的总和等于_
3、特征:
(1)直观、形象的反映了样本的分布规律;
(2)可以大致估计出总体的分布,但从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
二、其它统计图表
我们在初中还学习过条形图、扇形图、折线图、频数分布直方图等。不同的统计图在表示数据上有不同的特点。例如,__________主要用于直观描述各类数据占总数的比例,________和__________主要用于直观描述不同类别或分组数据的频数和频率,__________主要用于描述数据随时间的变化趋势。不同的统计图适用的数据类型也不同。例如,_________适用于描述离散型的数据,__________适用描述连续型数据等。因此,在解决问题的过程中,要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,以使我们走通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律.
针对练习:
1、从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350kW·h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,
(1)直方图中x的值为________
(2)在被调查的用户中,用电量落在区间[100,250)内的户数为_________
2、如图,胡晓统计了他爸爸9月的手机邇话明细清单,发现他爸爸该月共通话60次。胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图
(1)通话时长在区间[15.20),[20.30)内的次数分别为多少?
(2)区间[20,30)上的小长方形高度低于[15,20)上的小长方形的高度,说明什么?
3、某市2016年6月30天的空气质量指数如下:
35 54 80 86 72 85 58 125 111 53
10 66 46 36 18 25 23 40 60 89
88 54 79 14 16 40 59 67 111 62
你觉得这个月的空气质量如何?请设计适当的频率分布直方图展示这组数据,并结合空气质量分级标准分析数据
课后作业:
1、在10人中,有4个学生,2个干部,3个工人,1个农民,数0.4是学生占总( )
A、频数 B、概率 C、频率 D、累积频率
2、在用样本频率估计总体分布的过程中,下列正确的是( )
A、总体容量越大,估计越精确 B、总体容量越小,估计越精确
C、样本容量越大,估计越精确 D、样本容量越小,估计越精确
3、在调查某产品尺寸过程中,将其尺寸分成若干组,是其中的一组.已知该组的频率为,该组的直方图的高为,则等于 ( )
A、 B、 C、 D、
4、一个容量为20的样本,已知某组的频率为,则该组的频数为___________
5、一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=_______
6、已知样本:7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,
那么这组数据落在8.5~11.5内的频率为________
7、李老师为了分析一次数学考试情况,全校抽了50人,将分数分成5组,第一组到第三组的频数10,23,11,第四组的频率为0.08,那么落在第五组(89.5~99.5分)的频数是_____,频率是_____,全校300人中分数在89.5~99.5中的约有_______人
8、[2014·山东卷]为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A. 6
B. 8
C. 12
D. 18
课题: 9.2.2 总体百分位数的估计(第08周 第01课时 总033课时)
学习目标:
通过实例学会总体百分数的估计,并能准确地做出总体估计,从而发展学生数据分析和数学建模的素养。
重点难点:总体百分数的估计
新课学习:
问题:如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
1、百分位数定义:
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有_______的数据小于或等于这个值,且至少有_____________的数据大于或等于这个值.
2、百分位数求法:
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数
3、四分位数
我们在初中学过的中位数,相当于是第_____百分位数。在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数。这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数。其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等。另外,像第1百分位数,第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用。
典型例题:
例1、根据9.1.2节问题3中女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数
例2、根据表9.2-1或图9.2-1,估计月均用水量的样本数据的80%和95%分位数
针对练习:
1、根据9.1.2节问题3中男生的样本数据,请你估计树人中学高一年级男生的第25,50,75百分位数。如果要减少估计的误差,你觉得应该怎么做?
课题: 9.2.3 总体集中趋势的估计(第08周 第02课时 总034课时)
学习目标:
能根据实际问题的需要合理地从样本数据中提取估计总体的集中趋势参数(如平均数、中位数、众数),并做出合理的解释,通过对数据进行分析,发展学生的数学运算素养和数据分析素养
重点难点:平均数、中位数、众数的估计
新课学习:
一、众数:
1、定义:一组数据中出现次数_________的数称为这组数据的众数。
2、特征:一组数据中的众数可能___个,也可能没有,反映了该组数据的______________
二、中位数:
1、定义:一组数据按从小到大的顺序排成一列,处于_____位置的数称为这组数据的中位数。
2、特征:一组数据的中位数是______的,反映了该组数据的_________________。在频率分布直方图中,中位数左边和右边的直方图的面积______。
三、平均数:
1、定义:一组数据的和与这组数据个数的商,数据x1,x2,……,xn的平均数=__________
2、特征:平均数对数据有“取齐”的作用,代表该组数据的____________。任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具备的性质。所以,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的___________,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低。
四、众数、中位数、平均数与频率分布直方图的关系:
在频率分布直方图中,众数的估计值就是______矩形的中点的__________;中位数左右两侧的面积_______;平均数是频率分布直方图的______
典型例题:
例1、某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格据统计,高一年级女生需要不同规格校服的频数如表所示:
校服规格 155 160 165 170 175 合计
频数 39 6 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表中的数据估计全国高一年级女生校服规格的合理性
例2、根据以下频率分布直方图,估计月均用水量的样本数据的平均数、中位数、众数
针对练习:
1、根据表9.2-2中的数据,估计该市2015年全年空气质量指数的平均数、中位数和第80百分位数
(注:已知该市属于“严重污染”等级的空气质量指数不超过400)
2、某校举行演讲比赛,10位评委对两位选手的评分如下:
甲 7.5 7.5 7.8 7.8 8.0 8.0 8.2 8.3 8.4 9.9
乙 7.5 7.8 7.8 7.8 8.0 8.0 8.3 8.3 8.5 8.5
选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数。那么,这两个选手的最后得分是多少?若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗?你认为哪种评分办法更好?为什么?
课后作业:
1、一个容量为20的数据样本,分组与频数为:,,,,,,则样本数据在区间上的可能性为( )
A、5% B、25% C、50% D、70%
2、一个容量为20的数据样本,分组与频数为,,,,,,则样本数据的可能性为55%的区间是( )
A、 B、 C、 D、
3、有一个容量为45的样本数据,分组后,各组频数如下:
[12.5,15.5) 3, [15.5,18.5) 8, [18.5,21.5) 9,
[21.5,24.5) 11, [24.5,27.5) 10, [27.5,30.5) 4。
根据累计频率分布,估计小于27.5的数据约为总体的( )
A、91% B、30% C、92% D、95%
4、已知1,2,3,4,的平均数是8,那么的值是( )
A、14 B、22 C、32 D、46
5、一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( )
A、4.55 B、4.5 C、12.5 D、1.64
6、如果有6个数4,x ,-1,y ,z,6,它们的平均数为5,则x,y,z 三个数的平均数为______
课题: 9.2.3 总体离散程度的估计(第08周 第03课时 总035课时)
学习目标:
能根据实际问题的需要合理地从样本数据中提取估计总体离散程度的参数(如极差、方差、标准差),并做出合理的解释,通过对数据进行分析,发展学生的数学运算素养和数据分析素养
重点难点:方差、标准差的估计
新课学习:
一、极差:
一种简单的度量数据离散程度的方法就是用极差。极差在一定程度上刻画了数据的_________,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少。
二、方差、标准差
1、定义:
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,我们称_____________________为这组数据的方差,有时为了计算方差的方便,我们还把方差写成_____________________,我们称_______________为这组数据的标准差。
如果总体中所有个体的变量值分别为Y1,Y2,…YN,总体平均数为,则称_________________为总体方差,___________为总体标准差。与总体均值类似,总体方差也可以写成加权的形式。如果总体的N个变量值中不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为________________________
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称________________为样本方差,______________为样本标准差.
2、特征:
标准差刻画了数据的____________或____________,标准差越大,数据的离散程度越____;标准差越小,数据的离散程度越____。显然,在刻画数据的分散程度上,方差和标准差是一样的。但在解决实际问题中,一般多采用标准差.
针对练习:
1、一个小商店从一家有限公司购进21袋白糖,每袋白糖的标准质量是500g,为了了解这些白糖的质量情况,称出各袋白糖的质量(单位:g)如下:
486 495 496 498 499 493 493
498 484 497 504 489 495 503
499 503 509 498 487 500 508
(1)21袋白糖的平均质量是多少?标准差s是多少?
(2)质量位于-s与+s之间有多少袋白糖?所占的百分比是多少?
课后作业:
1、下列说法正确的是:( )
A、甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样
B、期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好
C、期末考试数学平均成绩甲乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好
D、期末考试数学平均成绩甲乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好
2、已知6个数据,5,7,7,8,10,11,则它的标准差为( )
A、8 B、4 C、2 D、9
3、甲乙两种水稻,经统计甲水稻的株高方差是2,乙水稻的株高标准差是1.8,可估计长得整齐的水稻为_____
4、下面是两个学生的五次英语测试成绩:
甲 98 88 67 59 89
乙 81 85 90 72 73
试用平均数与方差分析两位同学的英语成绩,并说明那一位同学的英语成绩比较稳定?