2020版高中数学第二章统计章末复习学案(含解析)新人教A版必修3

文档属性

名称 2020版高中数学第二章统计章末复习学案(含解析)新人教A版必修3
格式 zip
文件大小 283.1KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-09-14 20:42:04

图片预览

文档简介

章末复习
学习目标 1.梳理本章知识,构建知识网络.2.会根据不同的特点选择适当的抽样方法获得样本数据.3.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.4.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测.
1.抽样方法
(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法时,如果总体容量N能被样本容量n整除,抽样间隔为k=;如果总体容量N不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽样间隔为k=(其中K=N-多余个体数).
(3)三种抽样方法的异同点
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽到的可能性相同
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体平均分成几部分,按事先确定的规则分别在各部分中抽取
在起始部分抽样时,采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,按各层个体数之比抽取
在各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
2.用样本估计总体
(1)用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便.
(2)样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本数据波动大小的,包括方差及标准差.
3.变量间的相关关系
(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).
(2)求回归方程的步骤:
①先把数据制成表,从表中计算出,,x,xiyi;
②计算回归系数,,公式为
③写出回归方程=x+.
题型一 抽样方法
例1 (1)大、中、小三个盒子中分别装有同一产品120个、60个、20个,现在需从这三个盒子中抽取一个容量为25的样本,较为恰当的抽样方法是(  )
A.分层抽样 B.系统抽样
C.简单随机抽样 D.以上三种均可
(2)某企业三月中旬生产A,B,C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的表格:
产品类别
A
B
C
产品数量(件)
1300
样本数量(件)
130
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本数量比C产品的样本数量多10,根据以上信息,可得C产品的数量是________件.
答案 (1)B (2)800
解析 (1)总体无明显差异,但总体中个体数较多,故采用系统抽样较恰当.
(2)设C产品的样本数量为n,则A产品的样本数量为n+10,由题意知=,解得n=80.
故C产品的数量为80÷=800(件).
反思感悟 系统抽样的特点是“等距离”抽样,分层抽样的特点是“等比例”抽样.
跟踪训练1 某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是(  )
A.②③都不能为系统抽样
B.②④都不能为分层抽样
C.①④都可能为系统抽样
D.①③都可能为分层抽样
答案 D
解析 按分层抽样时,在一年级抽取108×=4(人),在二年级、三年级各抽取81×=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.
题型二 用样本的频率分布估计总体
例2 某制造商生产一批直径为40mm的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm,保留两位小数)如下:
40.03 40.00 39.98 40.00 39.99 40.00 39.98
40.01 39.98 39.99 40.00 39.99 39.95 40.01
40.02 39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组
频数
频率

[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0.02mm为合格品.若这批乒乓球的总数为10000,试根据抽样检查结果估计这批产品的合格个数.
解 (1)频率分布表如下:
分组
频数
频率

[39.95,39.97)
2
0.10
5
[39.97,39.99)
4
0.20
10
[39.99,40.01)
10
0.50
25
[40.01,40.03]
4
0.20
10
合计
20
1.00
50
频率分布直方图如图.
(2)∵抽样的20个产品中在[39.98,40.02]范围内的有17个,∴产品合格率为×100%=85%.
∴10000×85%=8500.
故根据抽样检查结果,可以估计这批产品的合格个数为8500.
反思感悟 总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.
跟踪训练2 从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)估计成绩在[60,90)分的学生比例.
解 (1)频率分布表如下.
成绩分组
频数
频率
频率/组距
[40,50)
2
0.04
0.004
[50,60)
3
0.06
0.006
[60,70)
10
0.2
0.020
[70,80)
15
0.3
0.030
[80,90)
12
0.24
0.024
[90,100]
8
0.16
0.016
合计
50
1.00
0.100
(2)频率分布直方图和折线图如图所示:
(3)成绩在[60,90)分的学生比例为0.2+0.3+0.24=0.74=74%.
题型三 用样本的数字特征估计总体的数字特征
例3 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计1-2的值.
解 (1)设甲校高三年级学生总人数为n.
由题意,知=0.05,解得n=600.
样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为
1-=.
(2)设甲、乙两校样本平均数分别为,.
根据样本茎叶图知,30(-)=30-30
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92
=2+49-53-77+2+92=15.
因此-=0.5,所以1-2的估计值为0.5分.
反思感悟 样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计.
跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:

60
80
70
90
70

80
60
70
80
75
问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?
解 甲的平均成绩为甲=74,乙的平均成绩为乙=73.所以甲的平均成绩好.
甲的方差是s=[(-14)2+62+(-4)2+162+(-4)2]=104,乙的方差是s=×[72+(-13)2+(-3)2+72+22]=56.
因为s>s,所以乙的各门功课发展较平衡.
线性回归及应用
典例 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:
年份202x(年)
0
1
2
3
4
人口数y(十万)
5
7
8
11
19
(1)请画出上表数据的散点图;
(2)指出x与y是否线性相关;
(3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=x+;
(4)据此估计2025年该城市人口总数.
(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)
解 (1)数据的散点图如图:
(2)由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关.
(3)由表知=×(0+1+2+3+4)=2,
=×(5+7+8+11+19)=10.
∴==3.2,=-=3.6,
∴回归方程为=3.2x+3.6.
(4)当x=5时,=19.6(十万)=196万.
故2025年该城市人口总数约为196万.
[素养评析] (1)最小二乘法估计的三个步骤
①作出散点图,判断是否线性相关.
②如果是,则用公式求,,写出回归方程.
③根据方程进行估计.
(2)线性回归的应用,注意三个方面,一是收集数据,二是准确计算求得回归方程,三是用回归方程进行估计预测,所以,这类题目培养的数学核心素养为数学运算与数据分析.
1.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是(  )
A.1B.2C.3D.4
答案 B
解析 设这10个数为a1,a2,…,a10,
则有a+a+…+a=200,
且a1+a2+…+a10=40,
∴
=
==4,
∴标准差为=2.
2.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归方程是=4x+250,则当施肥量为50kg时,可以预测小麦的产量为________kg.
答案 450
解析 直接将x=50代入回归方程中,
可得=4×50+250=450.
3.如图所示是一次考试结果的频率分布直方图,则据此估计这次考试的平均分为________.
答案 75
解析 利用组中值估算平均分,则有=55×0.1+65×0.2+75×0.4+85×0.2+95×0.1=75,故估计这次考试的平均分为75.
4.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?

解 (1)散点图如图.
(2)由表中数据得:iyi=52.5,
=3.5,=3.5,=54,∴=0.7,∴=1.05,
∴=0.7x+1.05,回归直线如图所示.
(3)将x=10代入线性回归方程,
得=0.7×10+1.05=8.05,
故加工10个零件约需要8.05小时.
5.从某学校的男生中随机抽取50名测量身高,被测学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组;第一组[155,160),第二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4.
(1)求第七组的频率;
(2)估计该校的800名男生的身高的中位数以及身高在180cm以上(含180cm)的人数.
解 (1)第六组的频率为=0.08,所以第七组的频率为1-0.08-5×(0.008×2+0.016+0.04×2+0.06)=0.06.
(2)身高在第一组[155,160)的频率为0.008×5=0.04,
身高在第二组[160,165)的频率为0.016×5=0.08,
身高在第三组[165,170)的频率为0.04×5=0.2,
身高在第四组[170,175)的频率为0.04×5=0.2,
由于0.04+0.08+0.2=0.32<0.5,0.04+0.08+0.2+0.2=0.52>0.5,
估计这所学校的800名男生的身高的中位数为m,
则170<m<175,
由0.04+0.08+0.2+(m-170)×0.04=0.5,得m=174.5,所以可估计这所学校的800名男生的身高的中位数为174.5,
由频率分布直方图得后三组频率为0.06+0.08+0.008×5=0.18,
所以身高在180cm以上(含180cm)的人数为0.18×800=144.
1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点:
(1)纵轴表示;(2)频率分布直方图中各小长方形高的比就是相应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.
2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.