(统考版)2023高考数学二轮 第三篇 (研重点 保大分)专题四 统计与概率 第1讲 统计、统计案例 课件(43张)

文档属性

名称 (统考版)2023高考数学二轮 第三篇 (研重点 保大分)专题四 统计与概率 第1讲 统计、统计案例 课件(43张)
格式 zip
文件大小 2.6MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2023-04-20 05:59:17

图片预览

文档简介

(共43张PPT)
第1讲 统计、统计案例
考点一
考点二
考点三
考点四
考点一 抽样方法
——依特点,定方法
考点一 抽样方法——依特点,定方法
1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
例 1 (1)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号001、002、…、699、700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第5个样本编号是(  )
3321183429 7864560732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073285 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A. 607 B.328
C.253 D.007
答案:B
解析:从表中第5行第6列开始向右读取数据,得到的数据中有两个超出范围,一个重复,抽取的5个样本编号分别是:253,313,457,007,328,所以得到的第5个样本编号是328.选B.
(2)[2022·江苏海安高三期末]某校高三年级的700名学生中,男生有385名,女生有315名.从中抽取一个容量为60的样本,则抽取男生和女生的人数分别为(  )
A.31 29 B.32 28
C.33 27 D.34 26
答案:C
解析:设样本中的男生和女生的人数分别为m、n,由分层抽样可得==,解得.故选C.
归纳总结
系统抽样和分层抽样中的计算方法
 (1)系统抽样
①总体容量为N,样本容量为n,则要将总体均分为n段,每段个个体(有“零头”时要先去掉).
②若第一段抽取编号为k的个体,则以后各段中抽取的个体编号依次为k+,…,k+(n-1).
(2)分层抽样
①适用于总体由差异明显的几部分组成的情况.
②当总体容量为N,样本容量为n时,有下列关系式:=.
提醒 无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.
对点训练
1.[2022·江西二模]某工厂利用随机数表对生产的300个零件进行抽样测试,先将300个零件进行编号001,002,…,299,300.从中抽取30个样本,根据提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是(  )
844212 533134 578607 362530 073286 234578 890723 68960804
325678 084367 895355 773489 948375 225355 783245 77892345
A.072   B.134   C.007   D.253
答案:A
解析:从表中第5行第6列开始向右读取数据,依次为:253(第1个),313(大于300,不取),457(大于300,不取),860(大于300,不取),736(大于300,不取),253(与253重复,不取),007(第2个),328(大于300,不取),623(大于300,不取),457(大于300,不取),889(大于300,不取),072(第3个).故得到的第3个样本编号是072.故选A.
2.某社区卫生室为了了解该社区居民的身体健康状况,对该社区1 100名男性居民和900名女性居民按性别采用等比例分层随机抽样的方法进行抽样调查,抽取了一个容量为100的样本,则应从男性居民中抽取的人数为(  )
A.45 B.50 C.55 D.60
答案:C
解析:应从男性居民中抽取的人数为100×=55.故选C.
考点二 用样本估计总体
——读懂图表,明确数字
考点二 用样本估计总体——读懂图表,明确数字
1.频率分布直方图的两个结论
(1)小长方形的面积=组距×=频率.
(2)各小长方形的面积之和等于1.
2.统计中的四个数字特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即=________________.
(4)方差与标准差
方差:s2=____________________________,
标准差:s=_________________________________.
(x1+x2+…+xn)
[(x1-)2+(x2-)2+…+(xn-)2]
角度1 统计图表的应用——读图、识图、整合信息
例 2 [2022·安徽省高三质检]2021年,全国居民人均可支配收入和消费支出均较上一年有所增长,结合如下统计图表,下列说法中错误的是(  )
A.2017~2021年全国居民人均可支配收入逐年递增
B.2021年全国居民人均消费支出构成中教育文化娱乐占比低于交通通信占比
C.2020年全国居民人均可支配收入较前一年下降
D.2021年全国居民人均消费支出构成中食品烟酒和居住占比超过50%
答案:C
解析:根据图1可知2017~2021年全国居民人均可支配收入逐年递增,故A正确,C错误;根据图2可知,2021年全国居民人均消费支出构成中教育文化娱乐占比为10.8%,交通通信占比为13.1%,故B正确;食品烟酒和居住占比分别为29.8%,23.4%,由29.8%+23.4%=53.2%>50%,故D正确.
归纳总结
从图表中挖掘信息
(1)折线图,条形图
破解此类题的关键:一是从总体上看折线的变化是总体升高还是下降,或是趋于平稳.二是看相邻点的变化:是陡还是缓,是升还是降.三是看最高点和最低点.
(2)表格
破解此类题只需过“双关”:一是看表关,即会观察频数分布表,读出相关的数据信息;二是定义关,即会利用众数、中位数的定义,求出样本中的众数、中位数,从而估计出总体中的相关数据.
(3)“饼形图”
将整体分成若干区域来表示所占的比例:即其圆心角的大小与360°的比值.
角度2 用样本的数字特征估计总体的数字特征——平均数、方差、准确计算
例 3 [2021·全国乙卷]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
解析:(1)由题中数据可得:
==10.0,
==10.3,
=[(9.8-10.0)2+(10.3-10.0)2+(10.0-10.0)2+(10.2-10.0)2+(9.9-10.0)2+(9.8-10.0)2+(10.0-10.0)2+(10.1-10.0)2+(10.2-10.0)2+(9.7-10.0)2]=0.036,
=[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.
(2)由(1)知=10.3-10.0=0.3,而=2 =2,
则0.3=>2=,
所以可判断新设备生产产品的该项指标的均值较旧设备有显著提高.
归纳总结
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
对点训练
1.[2022·全国乙卷(文)]分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
则下列结论中错误的是(  )
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
答案:C
解析:对于A选项,将甲同学周课外体育运动时长的样本从小到大排列,其样本容量为16,中间两个样本为7.3和7.5,所以中位数为=7.4,所以A不符合题意.对于B选项,(方法一)乙同学周课外体育运动时长的样本平均数为×(6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1)≈8.5,所以B不符合题意.(方法二)由乙的样本可知,小于8的样本有6.3,7.4,7.6,其他样本均大于8.又因为>8,>8,>8,所以乙同学周课外体育运动时长的样本平均数大于8,所以B正确.对于C选项,甲同学周课外体育运动时长大于8的样本有8.1,8.2,8.4,8.6,9.2,9.4,共6个,则甲同学周课外运动时长大于8的概率的估计值为=<0.4,所以C符合题意.对于D选项,乙同学周课外体育运动时长大于8的样本有13个,则乙同学周课外运动时长大于8的概率的估计值为>0.6,所以D不符合题意.故选C.
2.[2022·成都七中高三一模]新中国成立至今,我国一共进行了7次全国人口普查,历次普查得到的全国人口总数如图1所示,城镇人口比重如图2所示.
下列结论错误的有(  )
A.与前一次全国人口普查对比,第五次总人数增长量高于第四次总人数增长量
B.对比这7次全国人口普查的结果,我国城镇人口数量逐次递增
C.第三次全国人口普查城镇人口数量低于2亿
D.第七次全国人口普查城镇人口数量超过第二次全国人口普查总人口数
答案:C
解析:由柱状图知,与前一次全国人口普查对比,第五次总人数增长量为126 583-113 368=13 215(万人),第四次总人数增长量为113 368-100 818=12 550(万人),A正确;由折线图知,对比这7次全国人口普查结果,我国城镇人口数量逐次递增,B正确;由柱状图和折线图知,第三次全国人口普查城镇人口数约为100 818×20.91%>20 000(万人),C不正确;由柱状图和折线图知,第七次全国人口普查城镇人口数约为141 178×63.89%>70 000(万人),D正确.故选C.
考点三 回归分析的实际应用
——准确计算,数据分析
考点三 回归分析的实际应用——准确计算,数据分析
线性回归方程
方程=x+称为线性回归方程,其中= =;()称为样本中心点.
例 4 [2022·衡水市第二中学一模]计算机和互联网的出现使得“千里眼”“顺风耳”变为现实.现在,5G的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,5G经济收入在近一个时期内逐月攀升,如图是该创新公司2021年1至7月份的5G经济收入(单位:千万)的折线图.
(1)由折线图初步判断,可用线性回归模型拟合y与t的关系,请建立y关于t的回归方程;
(2)若该创新公司定下了2021年内5G经济月收入突破2千万的宏伟目标,请你预测该公司能否达到目标?
参考数据:=9.31,=40.18
参考公式:回归方程=t中斜率和截距的最小二乘法估计公式
分别为= =.
解析: (1)由题意得:= ==1.33,==4,
∴= ==0.105,
==1.33-0.105×4=0.91,
∴y关于t的回归方程为=0.105t+0.91.
(2)当t=12时,=0.105×12+0.91=2.17>2,∴该公司能达到目标.
归纳总结
求线性回归方程的方法
(1)若所求的线性回归方程是在选择题中,常利用回归直线=x+必经过样本点的中心()快速选择.
(2)若所求的线性回归方程是在解答题中,则求线性回归方程的一般步骤为:
对点训练
[2022·辽宁沈阳二中二模]随着我国经济的发展,人们生活水平的提高,汽车的保有量越来越高.汽车保险费是人们非常关心的话题.保险公司规定:上一年的出险次数决定了下一年的保费倍率,具体关系如下表:
经验表明新车商业车险保费与购车价格有较强的线性相关关系,下面是随机采集的8组数据(x,y)(其中x(万元)表示购车价格,y(元)表示商业车险保费):(8,2 150),(11,2 400),(18,3 140),(24,3 750),(26,4 000),(31,4 560),(37,5 500),(45,6 500).设由这8组数据得到的线性回归方程为=x+1 055.
上一年的出险次数 0 1 2 3 4 5次以上(含5次)
下一年的保费倍率 85% 100% 125% 150% 175% 200%
连续两年没有出险打7折,连续三年没有出险打6折
(1)求的值;
(2)某车主蔡先生购买一辆价值20万元的新车.
①估计该车主蔡先生购车时的商业车险保费.
②若该车今年保险期间内已出过一次险,现在又被刮花了,蔡先生到4S店询价,预计修车费用为800元,保险专员建议蔡先生自费(即不出险),你认为蔡先生是否应该接受建议?并说明理由.(假设该车辆下一年与上一年购买相同的商业车险产品进行续保).
解析:(1)=×(8+11+18+24+26+31+37+45)==25(万元),
=×(2 150+2 400+3 140+3 750+4 000+4 560+5 500+6 500)==4 000(元),
回归直线=x+1 055经过样本点的中心(),即(25,4 000),
所以===117.8.
(2)①价值为20万元的新车的商业车险保费预报值为117.8×20+1 055=3 411(元).
②由于该车已出过一次险,若再出一次险,则保费增加25%,即增加3 411×25%=852.75(元).
因为852.75>800,所以应该接受建议.
考点四 独立性检验的实际应用
——阅读理解,统计推断
考点四 独立性检验的实际应用——阅读理解,统计推断
随机变量
K2=,
若K2>3.841,则有95%的把握说两个事件有关;
若K2>6.635,则有99%的把握说两个事件有关.
例 5 [2022·全国甲卷]甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:K2=,
准点班次数 未准点班次数
A 240 20
B 210 30
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
解析:(1)A公司一共调查了260个班次,其中有240个班次准点,故A公司甲、乙两城之间的长途客车准点的概率是=.
B公司一共调查了240个班次,其中有210个班次准点,故B公司甲、乙两城之间的长途客车准点的概率是=.
(2)因为K2==≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
归纳总结
独立性检验的解题步骤
(1)根据样本数据列出2×2列联表.
(2)计算K2的观测值k,查下表确定临界值k0.
(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
对点训练
[2021·全国甲卷]甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:K2=,
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
解析:(1)根据题表中数据知,甲机床生产的产品中一级品的频率是=0.75,乙机床生产的产品中一级品的频率是=0.6.
(2)根据题表中的数据可得
K2==≈10.256.
因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.
同课章节目录