人教A版(2019)高中数学 必修第二册 第9章 统计 章末复习(课件33张PPT+学案+练习)

文档属性

名称 人教A版(2019)高中数学 必修第二册 第9章 统计 章末复习(课件33张PPT+学案+练习)
格式 zip
文件大小 2.2MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2020-12-30 20:27:37

文档简介

(共33张PPT)
第九章
统计
章末知识梳理
核心知识归纳
要点专项突破
知识体系构建
知识体系构建
核心知识归纳
一、随机抽样
1.简单随机抽样
(1)特征:①逐个不放回的抽取;②每个个体被抽到的概率都相等.
(2)常用方法:①抽签法;②随机数法.
二、用样本估计总体
1.频率分布直方图
2.百分位数与总体百分位数的估计
(1)第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)可以用样本数据的百分位数估计总体的百分位数.
3.众数、中位数和平均数与总体集中趋势的估计
4.总体集中趋势的估计
要点专项突破
1.两种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体中个体差异较显著时,可采用分层随机抽样.
2.掌握两种抽样方法,提升数据分析素养.
要点一
抽样方法的选取及应用
角度1 分层随机抽样
 为了了解学生学习的情况,某校采用分层随机抽样的方法从高一1
200人、高二1
000人、高三n人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为
(  )
A.20  
B.24  
C.30  
D.32
[分析] 各层中抽样比例相同.
典例
1
B 
【对点练习】? 一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层随机抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是
(  )
A.12,24,15,9  
B.9,12,12,7
C.8,15,12,5  
D.8,16,10,6
D 
与频率分布直方图有关问题的常见类型及解题策略
(1)已知频率分布直方图中的部分数据,求其他数据,可利用频率和等于1求解.
(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
要点二
用样本的取值规律估计总体的取值规律
 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):
(1)列出样本的频率分布表(频率保留两位小数);
(2)画出频率分布直方图;
(3)估计身高低于134
cm的人数占总人数的百分比.
典例
2
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158]
?
人数
20
11
6
5
?
[解析] (1)列出样本频率分布表:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1.00
【对点练习】? 某电子商务公司对10
000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=____;
(2)在这些购物者中,
消费金额在区间[0.5,0.9]内的
购物者的人数为________.
3 
6
000 
[解析] (1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)消费金额在区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故在[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10
000=6
000.
1.四分位数:第25分位数,第50分位数,第75分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
2.由频率分布直方图求百分位数时,一般采用方程的思想,设出第p百分位数,根据其意义列出方程求解.
要点三
样本的百分位数
 数学兴趣小组调查了12位大学毕业生的起始月薪,具体如表:
试确定第85百分位数.
[分析] 首先从小到大排列各数,再计算i.
[解析] 将数据从小到大排列:3
710,3
755,3
850,3
880,3
880,3
890,3
920,3
940,3
950,4
050,4
130,4
325.计算i=n×p%=12×85%=10.2,显然i不是整数,所以将i=10.2向上取整,大于i的比邻整数11即为第85百分位数的位置,所以第85百分位数是4
130.
典例
3
学生编号
起始月薪
1
3
850
2
3
950
3
4
050
4
3
880
5
3
755
6
3
710
7
3
890
8
4
130
9
3
940
10
4
325
11
3
920
12
3
880
【对点练习】? 新华中学高一年级共有1
200人参加了学校组织的诗词背诵比赛,已知所有学生成绩的第70百分位数是75分,则成绩大于或等于75分的学生至少有______人
(  )
A.348  
B.360  
C.372  
D.384
[解析] 将1
200人的成绩按照从小到大的顺序排列,75分排在第70百分位数,就是比75分少的人数占了70%,所以成绩大于或等于75分的学生至少占了30%,其人数为1
200×30%=360.
B 
为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,中位数为处于中间位置的数,如果数据的个数是偶数,中位数为中间两个数据的平均数;平均数就是所有样本数据的平均值,
要点四
用样本的集中趋势、离散程度估计总体
 根据某市所在地区的收入水平、消费水平等情况,拟将家庭年收入低于1.5万元的家庭确定为“贫困户”,家庭年收入在[6.5,7.5)万元的家庭确定为“小康户”,家庭年收入在[7.5,8.5]万元的家庭确定为“富裕户”,该市扶贫办为了打好精准脱贫攻坚战,在所辖某县的100万户家庭中随机抽取200户家庭,对其2019年的全年收入进行调查,抽查结果的频率分布直方图如图所示.
典例
4
【对点练习】? 如图是某班一次考试结果的频率分布直方图,据此估计该班这次考试的平均分为_____.
75 第九章 统 计
考试时间120分钟,满分150分.
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.质检部门检查一箱装有2
500件包装食品的质量,抽查总量的2%,在这个问题中,下列说法正确的是( D )
A.总体是指这箱2
500件包装食品
B.个体是一件包装食品
C.样本是按2%抽取的50件包装食品
D.样本量是50
[解析] 总体是指这箱2
500件包装食品的质量,故A项错误;个体是一件包装食品的质量,故B项错误;样本是按2%抽取的50件包装食品的质量,故C项错误;样本量是50,故D正确.故选D.
2.下列两个抽样:
①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.
则应采用的抽样方法依次为( C )
A.简单随机抽样;简单随机抽样
B.分层随机抽样;分层随机抽样
C.分层随机抽样;简单随机抽样
D.简单随机抽样;分层随机抽样
[解析] ①中商店的规模不同,所以应采用分层随机抽样;②中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.
3.某中学有高一学生400人,高二学生300人,高三学生500人,现用分层随机抽样的方法在这三个年级中抽取120人进行体能测试,则从高三抽取的人数应为( C )
A.40  
B.48  
C.50  
D.80
[解析] 因为高一、二、三年级的人数比为4︰3︰5,所以从高三应抽取的人数为120×=50.
4.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60
m;从南方抽取了200个男孩,平均身高1.5
m,由此可推断我国13岁的男孩平均身高为( C )
A.1.54
m  
B.1.55
m  
C.1.56
m  
D.1.57
m
[解析] ==1.56.
5.(2020·云南高一月考)某工厂利用随机数法对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600.从中抽取60个样本,下面提供由随机数表产生的第4行到第6行的随机数:
32
21
18
34
29 78
64
54
07
32 52
42
06
44
38 12
23
43
56
77 35
78
90
56
42
84
42
12
53
31 34
57
86
07
36 25
30
07
32
86 23
45
78
89
07 23
68
96
08
04
32
56
78
08
43 67
89
53
55
77 34
89
94
83
75 22
53
55
78
32 45
77
89
23
45
若从第6行第6列开始向右读取数据,则得到的第6个样本编号是( D )
A.324  
B.522  
C.535  
D.578
[解析] 从第6行第6列开始向右读取数据,编号内的数据依次为436,535,577,348,522,535,578,324,577,….因为535重复出现,所以符合要求的数据依次为436,535,577,348,522,578,324,…,故第6个数据为578.故选D.
6.某校高一年级一名学生七次月考数学成绩(满分100分)分别为78,82,84,84,86,89,96,则这名学生七次月考数学成绩的第80百分位数为( C )
A.82  
B.84  
C.89  
D.96
[解析] 因为7×80%=5.6,所以第80百分位数为89.
7.某体育组织为了解“跑团”每月跑步的平均里程,收集并整理了2018年1月至2018年11月期间“跑团”每月跑步的平均里程(单位:km)的数据,绘制了如图的折线图.根据折线图,下列结论正确的是( D )
A.月跑步平均里程的中位数为6月对应的里程数
B.月跑步平均里程逐月增加
C.月跑步平均里程高峰期大致在8,9月
D.1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳
[解析] 由折线图知,月跑步平均里程的中位数为5月对应的里程数,月跑步平均里程不是逐月增加的,月跑步平均里程高峰期大致在9,10月,故A,B,C项均错误.故选D.
8.(2020·广东高一期末)某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间(30,150]内,其频率分布直方图如图.则获得复赛资格的人数为( B )
A.640  
B.520  
C.280  
D.240
[解析] 由频率分布直方图,得初赛成绩大于90分的频率为1-(0.002
5+0.007
5+0.007
5)×20=0.65.所以获得复赛资格的人数为0.65×800=520.故选B.
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多个选项是符合题目要求的,全部选对的得5分,选对但不全的得2分,有选错的得0分)
9.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( BD )
A.57.2  
B.62.8  
C.63.6  
D.3.6
[解析] 当一组数据中的每个数同时加上一个数后,平均数相应增加,但方差不变,可知新数据的平均数为62.8,方差为3.6.故选BD.
10.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为me,众数为m0,平均值为,则( BD )
A.me=m0  
B.m0<  
C.meD.me<
[解析] 由题图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,由于5分出现的次数最多,故m0=5.
=≈6,所以m011.下图为某地区2006年~2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.
根据该折线图可知,该地区2006年~2018年( AD )
A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势
B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同
C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量
D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大
[解析] A项,由折线图知该地区财政预算内收入、城乡居民储蓄年末余额均呈增长趋势.故A项正确;B项,因为折线图中该地区财政预算内收入、城乡居民储蓄年末余额的曲线倾斜程度不同,所以财政预算内收入、城乡居民储蓄年末余额的逐年增长速度不同.故B项错误;C项,由折线图知该地区在2006~2018年的财政预算内收入的增长量低于城乡居民储蓄年末余额的增长量,所以财政预算内收入年平均增长量低于城乡居民储蓄年末余额年平均增长量.故C项错误;D项,由折线图知该地区城乡居民储蓄年末余额与财政预算内收入的差额逐年增大.故D项正确.故选AD.
12.为了了解某校九年级1
600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( AD )
A.该校九年级学生1分钟仰卧起坐的次数的中位数估计值为25
B.该校九年级学生1分钟仰卧起坐的次数的众数估计值为27.5
C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320
D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为32
[解析] 由题图知,中位数是26.25,众数是27.5,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.
三、填空题(本大题共4小题,每小题5分,共20分)
13.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人):
篮球组
书画组
乐器组
高一
45
30
a
高二
15
10
20
学校要对这三个小组的活动效果进行抽样调查,按小组分层随机抽样,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为__30__.
[解析] 由题意知,=,解得a=30.
14.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:
甲__众数__,乙__平均数__,丙__中位数__.
[解析] 甲、乙、丙三个厂家从不同角度描述了一组数据的特征.甲:该组数据8出现的次数最多;乙:该组数据的平均数==8;丙:该组数据的中位数是=8.
15.(2020·黑龙江哈尔滨三中高二期末)某同学4次三级跳远成绩(单位:米)分别为x,y,11,9,已知这4次成绩的平均数为10,标准差为,则xy的值为__97__.
[解析] 数据x,y,11,9的平均数为10,标准差为,则
化简得所以xy=97.
16.如图所示的是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1︰2︰3,第2小组的频数为10,则抽取的学生人数为__40__.
[解析] 前3组的频率之和等于1-(0.012
5+0.037
5)×5=0.75,第2小组的频率是0.75×=0.25,设样本容量为n,则=0.25,则n=40.
四、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)为了了解某市800家企业的管理情况,拟抽取40家企业作为样本进行调查.这800家企业中有外资企业160家、私营企业320家、国有企业240家、其他性质企业80家.如何抽取较合理?
[解析] 采用分层抽样方法,抽样比为=.
外资企业抽取160×=8(家),
私营企业抽取320×=16(家),
国有企业抽取240×=12(家),
其他性质的企业抽取80×=4家,即在外资、私营、国有、其他企业中分别抽取8,16,12,4家企业.
在每一类企业中抽取时,可采用简单随机抽样.
18.(本小题满分12分)已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,求这组数据的平均数与方差.
[解析] 由于数据-1,0,4,x,7,14的中位数为5,
所以=5,解得x=6.
设这组数据的平均数为,方差为s2,
由题意得
=×(-1+0+4+6+7+14)=5,
s2=×[(-1-5)2+(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2]=.
19.(本小题满分12分)全世界越来越关注环境保护问题,某监测站点于2019年8月某日起连续n天监测空气质量指数(AQI),数据统计如下表:
空气质量指数(μg/m3)
[0,50]
(50,100]
(100,150]
(150,200]
(200,250]
空气质量等级


轻度污染
中度污染
重度污染
天数
20
40
m
10
5
(1)根据所给统计表和频率分布直方图中的信息求出n,m的值,并完成频率分布直方图;
(2)由频率分布直方图,求该组数据的平均数与中位数.
[解析] (1)∵0.004×50=,∴n=100,
∵20+40+m+10+5=100,∴m=25.
=0.008,=0.005,
=0.002,=0.001.
由此完成频率分布直方图,如图:
(2)由频率分布直方图得该组数据的平均数为
25×0.004×50+75×0.008×50+125×0.005×50+175×0.002×50+225×0.001×50=95,
∵[0,50]的频率为0.004×50=0.2,(50,100]的频率为0.008×50=0.4,
∴中位数为50+×50=87.5.
20.(本小题满分12分)某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩,整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,得到体育成绩的折线图如图所示.
(1)若体育成绩大于或等于70分的学生为“体育良生”,已知该校高一年级有1
000名学生,试估计该校高一年级学生“体育良生”的人数;
(2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分;
(3)假设甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],当三人的体育成绩方差s2最小时,写出a,b,c的所有可能取值(不要求证明).
[解析] (1)由折线图得体育成绩大于或等于70分的学生有14+3+13=30(人),∴估计该校高一年级学生“体育良生”的人数为1
000×=750(人).
(2)用样本估计总体的思想,估计该校高一年级学生达标测试的平均分为=(45×2+55×6+65×2+75×14+85×3+95×13)=77.25(分).
(3)∵甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],其中a,b,c∈N,
∴当三人的体育成绩方差s2最小时,a,b,c的所有可能取值为79,84,90或79,85,90.
21.(本小题满分12分)某校100名学生期中考试化学成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生化学成绩的平均分;
(3)若这100名学生化学成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x︰y
1︰1
2︰1
3︰2
4︰5
[解析] (1)依题意得,10×(2a+0.02+0.03+0.04)=1,解得a=0.005.
(2)这100名学生化学成绩的平均分为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分).
(3)数学成绩在[50,60)的人数为100×0.05=5,数学成绩在[60,70)的人数为100×0.4×=20,
数学成绩在[70,80)的人数为100×0.3×=20,
数学成绩在[80,90)的人数为100×0.2×=25.
所以数学成绩在[50,90)之外的人数为100-5-20-20-25=30.
22.(本小题满分12分)在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从A,B两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名考生的选做题成绩中随机抽取一个容量为10的样本,为此将900名考生选做题的成绩按照随机顺序依次编号为001~900.
(1)若采用随机数法抽样,已知用计算机产生的若干0~9范围内的随机数如下,以第3个数5为起点.从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端,写出样本编号的中位数;
0 6 5 1 2 9 1 6 9 3 5 8 0 5 7 7 0
9 5 1 5 1 2 6 8 7 8 5 8 5 5 4 8 7
6 6 4 7 5 4 7 3 3 2 0 8 1 1 1 2 4
4 9 5 9 2 6 3 1 6 2 9 5 6 2 4 2 9
4 8 2 6 9 9 6 1 6 5 5 3 5 8 3 7 7
8 8 0 7 0 4 2 1 0 5 0 6 7 4 2 3 2
1 7 5 5 8 5 7 4 9 4 4 4 6 7 1 6 9
4 1 4 6 5 5 2 6 8 7 5 8 7 5 9 3 6
2 2 4 1 2 6 7 8 6 3 0 6 5 5 1 3 0
8 2 7 0 1 5 0 1 5 2 9 3 9 3 9 4 3
(2)若采用分层随机抽样,按照学生选择A题目或B题目,将成绩分为两层,且样本中A题目的成绩有8个,平均数为7,方差为4;样本中B题目的成绩有2个,平均数为8,方差为1.用样本估计900名考生选做题得分的平均数与方差.
[解析] (1)根据题意,读出的编号依次是:512,916(超界),935(超界),805,770,951(超界),512(重复),687,858,554,876,647,547,332.
将有效的编号从小到大排列,得
332,512.547,554,647,687,770,805,858,876,
所以中位数为×(647+687)=667.
(2)记样本中8个A题目的成绩分别为x1,x2,…,x8,2个B题目的成绩分别为y1,y2.
由题意可知i=8×7=56,(xi-7)2=8×4=32,
i=16,(yi-8)2=2×1=2,
故样本平均数为=×(i+i)=×(56+16)=7.2;
样本方差为
s2=×[(xi-7.2)2+(yi-7.2)2]
=×{(xi-7)-0.2]2+(yi-8)+0.8]2}
=×[(xi-7)2-0.4(xi-7)+8×0.22+(yi-8)2+1.6(yi-8)+2×0.82]
=(32-0+0.32+2+0+1.28)
=3.56.
所以估计该校900名考生该选做题得分的平均数为7.2,方差为3.56.