随机抽样
【教学目标】
1.理解全面调查、抽样调查、总体、个体、样本、样本量、样本数据等概念
2.理解简单随机抽样的概念,掌握简单随机抽样的两种方法:抽签法和随机数法
3.理解分层随机抽样的概念,并会解决相关问题
【教学重难点】
1.抽样调查
2.简单随机抽样
3.分层随机抽样
【教学过程】
一、问题导入
预习教材内容,思考以下问题:
1.全面调查、抽样调查、总体、个体、样本、样本量、样本数据的概念是什么?
2.什么叫简单随机抽样?
3.最常用的简单随机抽样方法有哪两种?
4.抽签法是如何操作的?
5.随机数法是如何操作的?
6.什么叫分层随机抽样?
7.分层随机抽样适用于什么情况?
8.分层随机抽样时,每个个体被抽到的机会是相等的吗?
9.获取数据的途径有哪些?
二、基础知识
1.全面调查与抽样调查
(1)对每一个调查对象都进行调查的方法,称为全面调查,又称普查W.
(2)在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体W.
(3)根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查W.
(4)把从总体中抽取的那部分个体称为样本W.
(5)样本中包含的个体数称为样本量W.
(6)调查样本获得的变量值称为样本的观测数据,简称样本数据.
2.简单随机抽样
(1)有放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n(2)不放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
(3)简单随机抽样
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.
(4)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(5)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
名师点拨
(1)从总体中,逐个不放回地随机抽取n个个体作为样本,一次性批量随机抽取n个个体作为样本,两种方法是等价的.
(2)简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公平性.
3.总体平均数与样本平均数
(1)总体平均数
①一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称==Yi为总体均值,又称总体平均数.
②如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=fiYiW.
(2)样本平均数
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==yi为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数去估计总体平均数.
4.分层随机抽样
(1)分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层W.
(2)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
5.分层随机抽样中的总体平均数与样本平均数
(1)在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则:①第1层的总体平均数和样本平均数分别为==Xi,==xi.
②第2层的总体平均数和样本平均数分别为==Yi,==yi.
③总体平均数和样本平均数分别为=,=W.
(2)由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数.因此我们可以用=+估计总体平均数.
(3)在比例分配的分层随机抽样中,==,可得+=+=.因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
6.获取数据的途径
获取数据的基本途径有:(1)通过调查获取数据;(2)通过试验获取数据;(3)通过观察获取数据;(4)通过查询获取数据
三、合作探究
总体、样本等概念辨析题
例1:为了调查参加运动会的1 000名运动员的平均年龄,从中抽取了100名运动员进行调查,下面说法正确的是( )
A.1 000名运动员是总体
B.每个运动员是个体
C.抽取的100名运动员是样本
D.样本量是100
【解析】根据调查的目的可知,总体是这1 000名运动员的年龄,个体是每个运动员的年龄,样本是抽取的100名运动员的年龄,样本量为100.故答案为D.
【答案】D
[规律方法]
此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本量为数目,无单位.
简单随机抽样的概念
例2:下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支奥运火炬,从中一次抽取100支火炬进行质量检查;
(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展救灾工作.
【解】(1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.(3)不是简单随机抽样.因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
[规律方法]
要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点.
抽签法及随机数法的应用
例3:某班有50名学生,要从中随机地抽出6人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程.
【解】(1)利用抽签法步骤如下:
第一步:将这50名学生编号,编号为01,02,03,…,50.
第二步:将50个号码分别写在纸条上,并揉成团,制成号签.
第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.
第四步:从容器中逐一抽取6个号签,并记录上面的号码.
对应上面6个号码的学生就是参加该项活动的学生.
(2)利用随机数法步骤如下:
第一步:将这50名学生编号,编号为1,2,3,…,50.
第二步:用随机数工具产生1~50范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本.
第三步:重复第二步的过程,直到抽足样本所需人数.
对应上面6个号码的学生就是参加该项活动的学生.
[规律方法]
(1)利用抽签法抽取样本时应注意以下问题:
①编号时,如果已有编号(如学号、标号等)可不必重新编号.(例如该题中50名同学,可以直接利用学号)
②号签要求大小、形状完全相同.
③号签要搅拌均匀.
④抽取号签时要逐一、不放回抽取.
(2)利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的人数.
分层随机抽样中的有关计算
例4:(1)某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工的人数为W.
(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:
高一年级
高二年级
高三年级
泥塑
a
b
c
剪纸
x
y
z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取人.
【解析】(1)设该单位老年职工人数为x,由题意得3x=430-160,解得x=90.则样本中的老年职工人数为90×=18.
(2)法一:因为“泥塑”社团的人数占总人数的,
故“剪纸”社团的人数占总人数的,
所以“剪纸”社团的人数为800×=320;
因为“剪纸”社团中高二年级人数比例为==,
所以“剪纸”社团中高二年级人数为320×=96.
由题意知,抽样比为=,
所以从高二年级“剪纸”社团中抽取的人数为96×=6.
法二:因为“泥塑”社团的人数占总人数的,
故“剪纸”社团的人数占总人数的,
所以抽取的50人的样本中,“剪纸”社团中的人数为50×=20.
又“剪纸”社团中高二年级人数比例为==,
所以从高二年级“剪纸”社团中抽取的人数为20×=6.
【答案】(1)18(2)6
[规律方法]
分层随机抽样中有关计算的方法
(1)抽样比==.
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.
样本平均数的求法
例5:(1)甲在本次飞镖游戏中的成绩为8,6,7,7,8,10,9,8,7,8.求甲在本次游戏中的平均成绩.
(2)在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本均值.
【解】(1)甲在本次游戏中的平均成绩为=7.8.
(2)合在一起后的样本均值为==.
[规律方法]
在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为.
【课堂检测】
1.在简单随机抽样中,每一个个体被抽中的可能性( )
A.与第几次抽样有关,第一次抽中的可能性要大些
B.与第几次抽样无关,每次抽中的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性要大些
D.每个个体被抽中的可能性无法确定
解析:选B.在简单随机抽样中,每一个个体被抽中的可能性都相等,与第几次抽样无关.
2.若对某校1 200名学生的耐力做调查,抽取其中120名学生,测试他们1500米跑的成绩,得出相应的数值,在这项调查中,样本是指( )
A.120名学生
B.1 200名学生
C.120名学生的成绩
D.1 200名学生的成绩
解析:选C.本题抽取的是120名学生的成绩,因此每个学生的成绩是个体,这120名学生的成绩构成一个样本.
3.(2019·广西钦州市期末考试)某中学共有1 000名学生,其中高一年级350人,该校为了了解本校学生视力情况,用分层随机抽样的方法从该校学生中抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为( )
A.20 B.25
C.30 D.35
解析:选D.高一年级抽取的人数为×100=35.故选D.
4.在调查某中学的学生身高时,利用分层抽样的方法抽取男生20人,女生15人,得到了男生身高的平均值为170,女生身高的平均值为165.试估计该中学所有学生的平均身高是多少?
解:==167.即该中学所有学生的平均身高为167.
第四步,把与号码相对应的人抽出,即可得到所要的样本.
用样本估计总体
【第一课时】
【教学目标】
1.会画一组数据的频率分布表、频率分布直方图.
2.会用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.
3.掌握求n个数据的第p百分位数的方法.
【教学重难点】
1.频率分布表、频率分布直方图.
2.用样本估计总体.
3.总体百分位数的估计.
【教学过程】
一、问题导入
预习教材内容,思考以下问题:
1.绘制频率分布表和频率分布直方图有哪些步骤?
2.频率分布直方图有哪些特征?
3.如何求n个数据的第p百分位数?
二、基础知识
1.频率分布表、频率分布直方图的制作步骤及意义
2.百分位数
(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算步骤:计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
三、合作探究
1.频率分布表、频率分布直方图、频率分布折线图的绘制
角度一:频率分布表、频率分布直方图的绘制
为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:kg)如下:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
【解】以4为组距,列表如下:
分组
频率累计
频数
频率
[41.5,45.5)
2
0.045 5
[45.5,49.5)
7
0.159 1
[49.5,53.5)
8
0.181 8
[53.5,57.5)
16
0.363 6
[57.5,61.5)
5
0.113 6
[61.5,65.5)
4
0.090 9
[65.5,69.5)
2
0.045 5
频率分布直方图和频率分布折线图如图所示.
(1)在列频率分布表时,极差、组距、组数有如下关系:
①若为整数,则=组数;
②若不为整数,则的整数部分+1=组数.
(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本量越大,所分组数越多.
角度二:频率分布直方图的应用
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
(3)样本中不达标的学生人数是多少?
(4)第三组的频数是多少?
【解】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量===150.
(2)由直方图可估计该校高一年级学生的达标率为×100%=88%.
(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12.
所以样本中不达标的学生人数为150×0.12=18(人).
(4)第三小组的频率为=0.34.
又因为样本量为150,
所以第三组的频数为150×0.34=51.
频率分布直方图的应用中的计算问题
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)=频率,此关系式的变形为=样本量,样本量×频率=频数.
2.条形统计图
为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.
请根据统计图提供的信息回答以下问题:
(1)求抽取的学生数;
(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;
(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.
【解】(1)从统计图上可以看出,
喜欢收听于丹析《庄子》的男生有20人,女生有10人;
喜欢收听《故宫博物院》的男生有30人,女生有15人;
喜欢收听于丹析《论语》的男生有30人,女生有38人;
喜欢收听易中天《品三国》的男生有64人,女生有42人;
喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.
所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).
(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为,
由于该校有3 000名学生,因此可以估计喜欢收听易中天《品三国》的学生有×3 000=1 060(人).
(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为×100%=15%.
(1)绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.
实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.
(2)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.
3.折线统计图
小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.
根据图中的信息,回答以下问题:
(1)护士每隔几小时给小明测量一次体温?
(2)近三天来,小明的最高体温、最低体温分别是多少?
(3)从体温看,小明的病情是在恶化还是在好转?
(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么出院?
【解】(1)根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.
(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5摄氏度,最低体温是36.8摄氏度.
(3)从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.
(4)9月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因此小明最快可以在9月10凌晨6时出院.
(1)绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.
(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.
4.扇形统计图
下图是A,B两所学校艺术节期间收到的各类艺术作品的情况的统计图:
(1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?
(2)已知A学校收到的剪纸作品比B学校的多20件,收到的书法作品比B学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?
【解】(1)不能.因为两所学校收到艺术作品的总数不知道.
(2)设A学校收到艺术作品的总数为x件,B学校收到艺术作品的总数为y件,则解得即A学校收到艺术作品的总数为500件,B学校收到艺术作品的总数为600件.
(1)绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.
(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.
5.百分位数的计算
现有甲、乙两组数据如下表所示.
序号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
甲组
1
2
2
2
2
3
3
3
5
5
6
6
8
8
9
10
10
12
13
13
乙组
0
0
0
0
1
1
2
3
4
5
6
6
7
7
10
14
14
14
14
15
试求甲、乙两组数的25%分位数与75%分位数.
【解】因为数据个数为20,而且20×25%=5,20×75%=15.
因此,甲组数的25%分位数为==2.5;
甲组数的75%分位数为==9.5.
乙组数的25%分位数为==1,乙组的75%分位数为==12.
求百分位数时,一定要将数据按照从小到大的顺序排列.
【课堂检测】
1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是( )
解析:选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不能称为统计图.
2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为( )
A.0.1 B.0.2
C.0.3 D.0.4
解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C.
3.观察下图所示的统计图,下列结论正确的是( )
A.甲校女生比乙校女生多
B.乙校男生比甲校男生少
C.乙校女生比甲校男生少
D.甲、乙两校女生人数无法比较
解析:选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因此男生与女生的具体人数也无法得知.
【第二课时】
【教学目标】
1.理解样本数据标众数、中位数、平均数的意义和作用,学会计算数据的众数、中位数、平均数.
2.理解样本数据方差、标准差的意义和作用,学会计算数据的方差、标准差.
【教学重难点】
会用样本的基本数字特征来估计总体的基本数字特征.
【教学过程】
一、基础知识
1.众数、中位数、平均数
众数、中位数、平均数定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
思考:平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?
答案:平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.
2.方差、标准差
标准差、方差的概念及计算公式
(1)标准差是样本数据到平均数的一种平均距离,一般用s表示.
s=.
(2)标准差的平方s2叫做方差.
s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).
(3)标准差(或方差)越小,数据越稳定在平均数附近.s=0时,每一组样本数据均为.
二、合作探究
1.众数、中位数、平均数的计算
(1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为( )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5 B.5,5
C.5,8 D.8,8
答案(1)C (2)C
解析(1)平均数为=87,众数为85,中位数为85.
(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.
由于甲组数据的中位数为15=10+x,所以x=5.又乙组数据的平均数为=16.8,所以y=8,所以x,y的值分别为5,8.
【教师小结】平均数、众数、中位数的计算方法:
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
2.标准差、方差的计算及应用
甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算以上两组数据的平均数;
(2)分别求出两组数据的方差;
(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?
解(1)甲=×(8+6+7+8+6+5+9+10+4+7)=7(环),
乙=×(6+7+7+8+6+7+8+7+9+5)=7(环).
(2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2],得s=3,s=1.2.
(3)甲=乙,说明甲、乙两战士的平均水平相当.
又s>s说明甲战士射击情况波动比乙大.
因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.
【教师小结】
(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.
(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.
(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.
三、课堂总结
1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.
【课堂检测】
1.某市2017年各月的平均气温(℃)数据的茎叶图如图:
则这组数据的中位数是( )
A.19 B.20
C.21.5 D.23
答案 B
解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.
2.下列关于平均数、中位数、众数的说法中正确的一个是( )
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
答案 D
3.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得的数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数 B.平均数
C.中位数 D.标准差
答案 D
4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a1,a2,则一定有( )
A.a1>a2
B.a2>a1
C.a1=a2
D.a1,a2的大小与m的值有关
答案 B
解析 由茎叶图知,
a1=80+=84,
a2=80+=85,故选B.
5.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
答案 16
解析 设样本数据x1,x2,…,x10的标准差为s,则s=8,
可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.
统计案例 公司员工的肥胖情况调查分析
【教学重难点】
【教学目标】
【核心素养】
数据分析。
针对实际统计案例进行调查分析。
数学应用。
【教学过程】
一、背景导入
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(Body Mass Index,缩写BMT)来衡量人体胖瘦程度以及是否健康,其计算公式是
中国成人的BMI数值标准为:BMI<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤BMI<27.9为偏胖;BMI≥28为肥胖。
二、数据调查
为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用比例分配的分层随机抽样方法抽取了90名男员工、50名女员工的身高和体重数据,计算得到他们的BMI值如下:
三、合作探究
根据上面的数据,写一份该公司员工肥胖情况的统计分析报告.要求:
1.选择合适的图表展示数据;
2.比较男、女员工在肥胖状况上的差异;
3.分析公司员工胖瘦程度的整体情况;
4.提出控制体重的建议.
四、教师指导
统计分析报告的主要组成部分
1.标题
2.前言
简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况。
3.主体
展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图表描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体情况.
4.结尾
对主体部分的内容进行概括,结合控制体重的一般方法(可以查阅有关文献),提出控制公司员工体重的建议.