高中数学必修第二册第九章统计(人教A版2019)
9.2用样本估计总体
【基础梳理】
要点一、总体取值规律的估计
为了探索-组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
可以按以下步骤制作频率分布表、画频率分布直方图.
1.求极差
极差式一组数据中最大值与最小值的差
2.决定组距与组数
合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况组距与组数的确定没有固定的标准,常常需要-一个尝试和选择的过?程。数据分组的组数与数据的个数有关,:一般数据的个数越多,所分组数也越多.
3.将数据分组
4.列频率分布表
5.画频率分布直方图
小长方形的面积=组距×
要点二、总体百分位数的估计
把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,?13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7,并称此数为这组数据的第80百分位数,或80%分位数.一般地,一组数据的第p百分位数是这样-一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且少有(100-p)%的数据大于或等于这个值.
可以通过下面的步骤计算一组n个数据的第力百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第力百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
要点三、总体集中趋势的估计
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,?那么平均数小于中位数,也就是说,和中位数相比平均数总是在‘长尾巴’那边.
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.此时,通常假设它们在组内均匀分布.这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.
要点四、总体离散趋势的估计
假设一组数据是,,?..?,用正表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即
=(i=1,2...n)
作为.到王的“距离”。可以得到这组数据,,?..?。到的“平均距离”为
为了避免式中含有绝对值,通常改用平方来代替,即
(1)
我们称(1)式为这组数据的方差.有时为了计算方差的方差,我们还把方差写成以下形式
由于方差的单位是原始数据的单位的平方,与原始数据?不一致.为了使二者单位一致,我们对方差开平方,取它的算术平方根,即
(2)
我们称(2)式为这组数据的标准差.如果总体中所有个体的变量值分别为总体平均数为,则称
为总体方差,S=为总体标准差.与总体均值类似,总体方差也可以写成加权的形式。如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,?其中;出现的频数为(i=1,?2,?.?k),则总体方差为
如果一个样本中个体的变量值分别为样本平均数为则称
为样本方差,s=?为样本标准差.
【课堂探究】
例1.设一组样本数据x1
,
x2
,
…,xn的方差为0.01,则数据10x1
,
10x2
,
…,10xn的方差为(???
)
A.?0.01????????????????????????????????????????B.?0.1????????????????????????????????????????C.?1????????????????????????????????????????D.?10
【答案】
C
【解析】因为数据
的方差是数据
的方差的
倍,
所以所求数据方差为
故答案为:C
【分析】根据新数据与原数据关系确定方差关系,即得结果.
例2从一批零件中抽取80个,测量其直径(单位:
),将所得数据分为9组:
,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间
内的个数为(???
)
A.?10?????????????????????????????????????????B.?18?????????????????????????????????????????C.?20?????????????????????????????????????????D.?36
【答案】
B
【解析】根据直方图,直径落在区间
之间的零件频率为:
,
则区间
内零件的个数为:
.
故答案为:B.
【分析】根据直方图确定直径落在区间
之间的零件频率,然后结合样本总数计算其个数即可.
【课后练习】
1.若样本数据
,
,
,
标准差为8,则数据
,
,
,
的标准差为(???
)
A.?8?????????????????????????????????????????B.?16?????????????????????????????????????????C.?32?????????????????????????????????????????D.?64
【答案】
B
【解析】解:由方差的性质可知,
,
因为样本数据
,
,
,
标准差为8,即方差为64,
则数据
,
,
,
的方差为
,
,即标准差为16
故答案为:B.
【分析】由已知结合方差的性质即可直接求解.
2.若
的方差为
,则
的方差为(???
)
A.?????????????????????????????????????????B.?????????????????????????????????????????C.?????????????????????????????????????????D.?
【答案】
D
【解析】因为
的方差为
,
所以
的方差为
,
故答案为:D.
【分析】本题可根据
的方差为
以及方差的计算公式得出结果.
3.某老师从星期一到星期五收到的信件数分别为10,6,8,
5,
6,则该组数据的方差
的值为(???
)
A.???????????????????????????????????????B.???????????????????????????????????????C.???????????????????????????????????????D.?16
【答案】
C
【解析】某老师从星期一到星期五收到信件的平均数为:
,
∴该组数据的方差
,
故答案为:C.
【分析】先求出某老师从星期一到星期五收到信件的平均数,由此能求出该组数据的方差.
4.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.4、8.4、9.4、9.9、9.6、9.4、9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(???
)
A.?9.4,0.484????????????????????????B.?9.4,0.016????????????????????????C.?9.5,0.04????????????????????????D.?9.5,0.016
【答案】
D
【解析】去掉一个最高分和一个最低分后,剩余分数如下:9.4、9.4、9.6、9.4、9.7,
平均值为
;
方差为
;
故答案为:D.
【分析】去掉一个最高分和一个最低分后,利用平均值和方差的求解公式可求所剩数据的平均值和方差.
5.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用如图的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为(??
)
A.?1.5小时??????????????????????????????B.?1.0小时??????????????????????????????C.?0.9小时??????????????????????????????D.?0.6小时
【答案】
C
【解析】解:由题意得,50名学生这一天平均每人的课外阅读时间为
故答案为:C
【分析】直接利用加权平均数公式求解
6.某校从高一年级参加期末考试的学生中抽出60名,其成绩(均为整数)的频率分布直方图如图所示,由此估计此次考试成绩的中位数、众数分别是(???
)
A.?73.3,75?????????????????????????????B.?73.3,80?????????????????????????????C.?70,70?????????????????????????????D.?70,75
【答案】
A
【解析】解:频率分布直方图是按照一定的规律排列的,一般是按照由小到大或由大到小,
就把组数想成一组数字,如果它是偶数就取它相邻的那组数据的平均数,得数就是横坐标;
如果组数是奇数,就取这些组数的中间的那组的数据,那组数就是横坐标;
小于70的有24人,大于80的有18人,则在
,
之间18人,所以中位数为
;
众数就是分布图里最高的那条,即
,
的中点横坐标75.
故答案为:A.
【分析】将频率分布直方图分成两个部分这就是面积平分,就可得到答案.众数就是分布图里最高的那条,即
,
的中点横坐标75.
7.高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了
座城市作实验基地,这
座城市共享单车的使用量(单位:人次/天)分别为
,
,…,
,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是(???
)
A.?
,
,…,
的标准差????????????????????????????????B.?
,
,…,
的平均数
C.?
,
,…,
的最大值????????????????????????????????D.?
,
,…,
的中位数
【答案】
A
【解析】表示一组数据的稳定程度是方差或标准差,标准差越小,数据越稳定
故答案为:A
【分析】利用方差或标准差表示一组数据的稳定程度可得出选项.
8.甲、乙两名运动员分别进行了5次射击训练,成绩如下:
甲:6,7,8,8,10;
乙:8,9,9,9,10.
若甲、乙两名运动员的平均成绩分别用
,
表示,方差分别用
,
表示,则(???
)
A.?????????????????B.?????????????????C.?????????????????D.?
【答案】
D
【解析】因为
;
;
;
故可得
;
.
故答案为:D.
【分析】根据平均数和方差的计算公式,分别求出两组数据的平均数和方差,即可进行选择.
9.假设有一个专养草鱼的池塘,现要估计池塘内草鱼的数量.第一步,从池塘内打捞一批草鱼,做上标记,然后将其放回池塘,第二步,再次打捞一批草鱼,根据其中做标记的草鱼数量估计整个池塘中草鱼的数量.假设第一次打捞的草鱼有50尾,第二次打捞的草鱼总数为50尾,其中有标记的为7尾,试估计整个池塘中草鱼的数量大约为(???
)
A.?250??????????????????????????????????????B.?350??????????????????????????????????????C.?450??????????????????????????????????????D.?550
【答案】
B
【解析】设池塘中草鱼的数量大约为
,可得
,
所以
,所以池塘中草鱼大约有
条.
故答案为:B.
【分析】根据池塘中带有标记的草鱼数量与草鱼总数的比值等于样本中带有标记的草鱼数量与样本容量的比值.
10.某中学为了调查该校学生对于新冠肺炎防控的了解情况,组织了一次新冠肺炎防控知识竞赛,并从该学校1500名参赛学生中随机抽取了100名学生,并统计了这100名学生成绩情况(满分100分,其中80分及以上为优秀),得到了样本频率分布直方图(如图),根据频率分布直方图推测,这1500名学生中竞赛成绩为优秀的学生人数大约为(???
)
A.?360??????????????????????????????????????B.?420??????????????????????????????????????C.?480??????????????????????????????????????D.?540
【答案】
B
【解析】由频率分布直方图可得样本中优秀的频率为
,
则这1500名学生中竞赛成绩为优秀的学生人数大约为
.
故答案为:B.
【分析】由频率分布直方图求出样本中优秀的频率,由此根据频率分布直方图能推测出这1500名学生中竞赛成绩为优秀的学生人数。