高考数学二轮复习概率与统计微专题21统计与成对数据的统计分析课件(共71张PPT)

文档属性

名称 高考数学二轮复习概率与统计微专题21统计与成对数据的统计分析课件(共71张PPT)
格式 ppt
文件大小 8.7MB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2026-02-24 00:00:00

图片预览

文档简介

(共71张PPT)
微专题21 统计与成对数据的统计分析
·体验真题
高考对本专题内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.
C
2.(2025·全国一卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:
组别 超声波检查结果
正常 不正常 合计
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1000
热点一 用样本估计总体
角度1 统计图表与数字特征的综合应用
例1 (1)(多选)广东省湛江市2017年到2022年常住人口变化图如图所示,则(  )
A.湛江市2017年到2022年这6年的常住人口的
极差约为38万
B.湛江市2017年到2022年这6年的常住人口呈
递增趋势
C.湛江市2017年到2022年这6年的常住人口的
第60百分位数为730.50万
D.湛江市2017年到2022年这6年的常住人口的
中位数为717.02万
聚焦热点
·重难攻坚
ACD
解析:ACD 由题图可知,湛江市2017年到2022年这6年的常住人口的极差约为736.00-698.12≈38(万),A正确;
这6年的常住人口前3年呈递增趋势,后三年也递增,但后三年的常住人口低于前3年,B错误;
湛江市2017年到2022年这6年的常住人口按
(2)(多选)已知甲组数据为:1,1,3,3,5,7,9,乙组数据为:1,3,5,7,9,则下列说法正确的是(  )
A.这两组数据的第80百分位数相等
B.这两组数据的极差相等
C.这两组数据分别去掉一个最大值和一个最小值后,仅仅乙组数据的均值不变
D.甲组数据比乙组数据分散
BC
角度2 频率分布直方图
例2 (多选)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中正确的是(  )
A.该地农户家庭年收入的极差为12
B.估计该地农户家庭年收入的75%分位数约为9
C.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
D.估计该地农户家庭年收入的平均值超过6.5万元
BCD
1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.
2.要抓住频率分布直方图各小长方形的面积之和为1,不要混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
训练1 (多选)关于一组样本数据的平均数、中位数、众数,频率分布直方图和方差,下列说法正确的是(  )
A.改变其中一个数据,平均数和众数都会发生改变
B.频率分布直方图中,中位数左边和右边的直方图的面积应该相等
C.若数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则平均数大于中位数
D.样本数据的方差越小,说明样本数据的离散程度越小
BCD
解析:BCD 对于A中,例如:数据1,3,3,将数据改成2,3,3,数据的众数未改变,仍为3,所以A错误;
对于B中,根据频率分布直方图中中位数的求法,频率分布直方图中,中位数左边和右边的直方图的面积应该相等,所以B正确;
对于C中,根据频率分布直方图可得,单峰不对称且在右边“拖尾”,则平均数大于中位数,所以C正确;
对于D,样本数据方差越小,数据越稳定,离散程度越小,所以D正确,故选BCD.
训练2 (多选)水稻产量是由单位面积上的穗数、每穗粒数(每穗颖花数)、成粒率和粒重四个基本因素构成.某实验基地有两块面积相等的试验田,在种植环境相同的条件下,这两块试验田分别种植了甲、乙两种水稻,连续试验5次,水稻的产量如下:
甲 250 240 240 200 270
乙 250 210 280 240 220
单位:kg
则下列说法正确的是(  )
A.甲种水稻产量的极差为70
B.乙种水稻产量的中位数为240
C.甲种水稻产量的平均数大于乙种水稻产量的平均数
D.甲种水稻产量的方差小于乙种水稻产量的方差
ABD
热点二 回归分析
例3 某公司为改进生产,现对近5年来生产经营情况进行分析.收集了近5年的利润y(单位:亿元)与年份代码x共5组数据(其中年份代码x=1,2,3,4,5分别指2019年,2020年……2023年),并得到如下值:
(1)若用线性回归模型拟合变量y与x的相关关系,计算该样本相关系数r,并判断变量y与x的相关程度(r精确到0.01);
训练3 近年来,我国众多新能源汽车制造企业迅速崛起.某企业着力推进技术革新,利润稳步提高.统计该企业2019年至2023年的利润(单位:亿元),得到如图所示的散点图.其中2019年至2023年对应的年份代码依次为1,2,3,4,5.
(1)根据散点图判断,y=a+bx和y=c+dx2哪一个适宜作为企业利润y(单位:亿元)关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)中的判断结果,建立y关于x的回归方程;
(3)根据(2)的结果,估计2026年的企业利润.
参考公式及数据;
热点三 独立性检验
例4 陕西省从2022年秋季启动新高考,新高考“3+1+2”模式中“3”为全国统一高考科目的语文、数学、外语,“1”为首选科目.要求从物理、历史2门科目中确定1门,“2”为再选科目,要求从思想政治、地理、化学、生物学4门科目中确定2门,共计产生12种组合.某班有学生50名,在选科时,首选科目选历史和物理的统计数据如下表所示:
项目 历史 物理 合计
男生 1 24 25
女生 9 16 25
合计 10 40 50
α 0.100 0.050 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1.χ2越大两分类变量无关的可能性越小,推断犯错误的概率越大,通过表格查得无关的可能性越小.
2.在犯错误的概率不超过0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
训练4 近年来,短视频作为以视频为载体的聚合平台,社交属性愈发突出,在用户生活中覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪接成长视频的App,得到如下数据:
项目 青年人 中年人 老年人
对短视频剪接成长视频的App有需求 2a+4b 200 a
对短视频剪接成长视频的App无需求 a+b 150 4b
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
项目 青年人 中老年人 合计
对短视频剪接成长视频的App有需求 300 250 550
对短视频剪接成长视频的App无需求 100 350 450
合计 400 600 1000
3
4
5
6
7
8
9
10
12
13
11
1
2
1.数据24,61,46,37,52,16,28,15,53,24,45,39的第75百分位数是(  )
A.34.5  B.46 
C.49  D.52
课时作业
训 练(二十一) 统计与成对数据的统计分析
14
C
2
1
3
4
5
6
7
8
9
10
12
13
11
14
x 1 2 3 4 5
y 6 6 7 8 8
D
2
3
1
4
5
6
7
8
9
10
12
13
11
3.为了树立和践行绿水青山就是金山银山的理念,A市某高中全体教师于2024年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计1200棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为5∶3∶2,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为(  )
A.60棵
B.100棵
C.144棵
D.160棵
14
C
2
3
4
1
5
6
7
8
9
10
12
13
11
4.某电视台举行主持人大赛,每场比赛都有17位专业评审进行现场评分,首先这17位评审给出某位选手的原始分数,评定该位选手的成绩时从17个原始成绩中去掉一个最高分、一个最低分,得到15个有效评分,则15个有效评分与17个原始评分相比,在数字特征“①中位数,②平均数,③方差,④极差”中,可能变化的有(  )
A.4个 B.3个
C.2个 D.1个
14
B
2
3
4
5
6
7
8
9
10
12
13
11
1
解析:B 从17个原始评分去掉1个最高分、1个最低分,得到15个有效评分,
其平均数、极差、方差都可能会发生改变,
但中间位置不变,即不变的数字特征是中位数,
例如1,2,2,…,2,15,故可能变化的有3个.
14
2
3
4
5
1
6
7
8
9
10
12
13
11
5.某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:
14
疗法 疗效
未治愈 治愈 合计
甲 15 52 67
乙 6 63 69
合计 21 115 136
2
3
4
5
1
6
7
8
9
10
12
13
11
经计算得到χ2≈4.881,根据小概率值α=0.005的独立性检验(已知χ2独立性检验中x0.005=7.879),则可以认为(  )
A.两种疗法的效果存在差异
B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005
C.两种疗法的效果没有差异
D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005
14
C
2
3
4
5
1
6
7
8
9
10
12
13
11
解析:C 零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,χ2≈4.881<7.879=x0.005,根据小概率值α=0.005的独立性检验,
没有充分证据推断H0不成立,
因此可以认为H0成立,即认为两种疗法效果没有差异.
14
2
3
4
5
6
1
7
8
9
10
12
13
11
6.已知甲、乙两组数据分别为:22,21,24,23,25,20和25,22,a,26,23,24.若乙组数据的平均数比甲组数据的平均数大2,则(  )
A.甲、乙两组数据的极差不同
B.乙组数据的中位数为24
C.甲、乙两组数据的方差相同
D.甲组数据的第一四分位数为21.5
14
C
2
3
4
5
6
1
7
8
9
10
12
13
11
14
2
3
4
5
6
1
7
8
9
10
12
13
11
14
7
8
9
10
12
13
11
1
3
4
5
6
2
7.(多选)如图是离散型随机变量X的概率分布直观图,其中3a=5b,2b=3c,则(  )
A.a=0.5
B.E(X)=2.3
C.D(X)=0.61
D.D(2X)=1.22
14
ABC
7
8
9
10
12
13
11
1
3
4
5
6
2
14
8
9
10
12
13
11
1
3
4
5
6
7
2
8.(多选)为研究光照时长x(小时)和种子发芽数量y(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点P后,下列说法正确的是(  )
A.相关系数r变小
B.经验回归方程斜率变大
C.残差平方和变小
D.决定系数R2变小
14
BC
8
9
10
12
13
11
1
3
4
5
6
7
2
解析:BC 由图可知:点P较其他的点偏离直线最大,所以去掉点P后,回归效果更好.
对于A,相关系数|r|越接近于1,线性相关性越强,因为散点图是递增的趋势,所以去掉点P后,相关系数r变大,故A错误;
对于B,由线性回归方程的实际意义,要使残差平方和最小,去掉点P后,回归直线靠近y轴位置需要向下移动,但靠近最右侧两个点的位置变化不大,经验回归方程斜率变大,故B正确;
对于C,残差平方和越大,拟合效果越差,所以去掉点P后,残差平方和变小,故C正确;
对于D,决定系数R2越接近于1,拟合效果越好,
所以去掉点P后,决定系数R2变大,故D错误.
故选BC.
14
9
10
12
13
11
1
3
4
5
6
7
8
2
9.(多选)有关数据显示,年轻一代的父母更加重视亲子陪伴,以往“以孩子为中心”的观念正逐步向与孩子玩在一起、学在一起的方向转变.如图为2023年中国父母参与过的各类亲子活动人数在参与调查总人数中的占比,根据该图,下列说法正确的是(  )
A.在参与调查的总人数中父母参与过的亲子
活动最多的是亲子阅读
B.在参与调查的总人数中同时参与过亲子阅
读与亲子运动会的父母不少于20%
C.图中各类亲子活动占比的中位数为40.14%
D.图中10类亲子活动占比的极差为57.70%
14
AB
9
10
12
13
11
1
3
4
5
6
7
8
2
14
10
12
13
11
1
3
4
5
6
7
8
9
2
14
11
12
13
1
3
4
5
6
7
8
9
10
2
14
11
12
13
1
3
4
5
6
7
8
9
10
2
14
12
13
1
3
4
5
6
7
8
9
10
11
2
12.构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向,铜川市第一中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1)班、高三(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好),则下列结论正确的是__________.
实线:高三(1)班的数据
虚线:高三(2)班的数据
①高三(2)班五项评价得分的极差为1.
②除体育外,高三(1)班的各项评价得分均高于
高三(2)班对应的得分.
③高三(1)班五项评价得分的平均数比高三(2)班
五项评价得分的平均数要高.
④各项评价得分中,这两个班的体育得分相差最大.
14
12
13
1
3
4
5
6
7
8
9
10
11
2
14
13
1
3
4
5
6
7
8
9
10
12
11
2
13.某校举办乒乓球与羽毛球比赛,要求每个学生只能报名参加其中一项.从报名参加比赛的学生中随机选取男生、女生各75人进行调查,得到如下2×2列联表:
(1)根据表中数据,依据小概率值α=0.05的独立性检验,分析该校学生选择乒乓球还是羽毛球是否与性别有关联;
14
性别 比赛项目 合计
乒乓球组 羽毛球组
男生 50 25 75
女生 35 40 75
合计 85 65 150
13
1
3
4
5
6
7
8
9
10
12
11
2
14
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
13
1
3
4
5
6
7
8
9
10
12
11
2
14
13
1
3
4
5
6
7
8
9
10
12
11
2
14
X 0 1 2
P
14
1
3
4
5
6
7
8
9
10
12
11
2
14.某公司为考核员工,采用某方案对员工进行业务技能测试,并统计分析测试成绩以确定员工绩效等级.
(1)已知该公司甲部门有3名负责人,乙部门有4名负责人,该公司从甲、乙两部门中随机选取3名负责人做测试分析,记负责人来自甲部门的人数为X,求X的最有可能的取值;
(2)该公司统计了七个部门测试的平均成绩x(满分100分)与绩效等级优秀率y,如下表所示:
13
x 32 41 54 68 74 80 92
y 0.28 0.34 0.44 0.58 0.66 0.74 0.94
14
1
3
4
5
6
7
8
9
10
12
11
2
13
14
1
3
4
5
6
7
8
9
10
12
11
2
13
14
1
3
4
5
6
7
8
9
10
12
11
2
13
14
1
3
4
5
6
7
8
9
10
12
11
2
13
14
1
3
4
5
6
7
8
9
10
12
11
2
13
同课章节目录