高考数学二轮复习专题4统计与概率1统计课件+练习+答案

文档属性

名称 高考数学二轮复习专题4统计与概率1统计课件+练习+答案
格式 zip
文件大小 8.4MB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2026-01-20 00:00:00

文档简介

专题四 统计与概率
1 统 计
参考公式及数据:(1) 独立性检验:χ2=,其中n=a+b+c+d.
附表:
α 0.1 0.05 0.025 0.01 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
(2) 回归分析:r=;=+x中,=,=-.
基础打底
1.(多选)已知两个变量y与x对应关系如下表:
x 1 2 3 4 5
y 5 m 8 9 10.5
若y与x满足一元线性回归模型,且经验回归方程为=1.25x+4.25,则(  )
A.y与x正相关  B.m=7
C.样本数据y的第60百分位数为8  D.各组数据的残差和为0
2.(多选)某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示,则下列说法正确的有(  )
性别 是否患过某流行疾病 合计
患过该疾病 未患过该疾病
男 a=20 b a+b
女 c d=50 c+d
合计 a+c 80 110
A.> 
B.χ2>6.635
C.根据小概率值α=0.01的独立性检验,认为是否患过该流行疾病与性别有关联
D.根据小概率值α=0.01的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联
3.一组不全相等的数据,去掉一个最大值,则下列数字特征一定改变的是(  )
A.极差  B.中位数
C.平均数  D.众数
4.据统计,2016年至2020年我国高校毕业生人数y(单位:万人)的数据如下表所示.根据表中数据,y与x的样本相关系数r为  (保留两位有效数字,参考数据:(xi-)2=10,(yi-)2=6 733.2,≈259.5).
年份 2016 2017 2018 2019 2020
年份代号x 16 17 18 19 20
高校毕业生人数y/万人 765 795 820 834 874
强技提能
新情境下特征数的推理与证明
例1 (多选)某同学掷骰子五次,分别记录每次骰子出现的点数.根据该同学记录的结果,判断可能出现点数6的是(  )
A.平均数为3,中位数为2  B.中位数为3,众数为2
C.平均数为2,方差为2.4  D.中位数为3,方差为2.8
1.围绕统计量公式,代入假设值验证.
2.利用数据排序与极端值分析:
3.构造符合统计量的具体数据组.
变式1 (多选)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是1,2,3,4,5,6,7)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为4,极差为3;
乙:中位数为3,众数为5;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是(  )
A.甲  B.乙
C.丙  D.丁
生产生活中的决策与预测问题
例2-1 (2024·全国甲卷)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
(1) 填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
(2) 已知升级改造前该工厂产品的优级品率p=0.5,设为升级改造后抽取的n件产品的优级品率,如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
应用独立性检验解决实际问题应包括以下几个主要环节:
(1) 提出零假设H0:
(2) 计算χ2的值,并与临界值xα比较:
(3) 根据检验规则得出推断结论:
(4) 在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
例2-2 某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示:
令vi=ln xi(i=1,2,…,5),数据经过初步处理得:
yi vi (xi-)22 (yi-)2 (vi-)2 (xi-)(yi- (yi-)(vi-)
444.8 10 40.3 1.612 19.5 8.06
现有①y=bx+a和②y=nln x+m两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
参考数据:=8.06,≈20.1,ln 5≈1.6,ln 6≈1.8.
(1) 请从样本相关系数的角度,分析哪一个模型拟合程度更好?
(2) 根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的经验回归方程,并预测年广告费为6百万元时,产品的年销售量是多少?
(3) 该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量ξ影响,设随机变量ξ服从正态分布N(600,σ2),且满足P(ξ>800)=0.3.在(2)的条件下,求该公司年净利润的最大值大于1 000百万元的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量)
1.一元线性回归模型应用要点:
样本相关系数r的绝对值越接近于1,两变量的线性相关程度越强.
2.要熟悉“r=”与“=”的公式变形:
(xi-)(yi-)=xiyi- ;(xi-)2=-n·2;(yi-)2=-n·2.
变式2 (2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 根部横截面积xi 材积量yi
1 0.04 0.25
2 0.06 0.40
3 0.04 0.22
4 0.08 0.54
5 0.08 0.51
6 0.05 0.34
7 0.05 0.36
8 0.07 0.46
9 0.07 0.42
10 0.06 0.40
总和 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1) 估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
(2) 求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
(3) 现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.(参考数据:≈1.377)
配套热练
1.(2025·武汉2月调研)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,则下列说法正确的是(  )
A.a=0.05
B.评分的众数的估值为70
C.评分的第25百分位数估值为67.5
D.评分的平均数估值为76
2.(2025·南京、盐城一模)某项比赛共有10个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是(  )
A.极差  B.第45百分位数
C.平均数  D.众数
3.(2025·梅州质检)某科技公司在人工智能领域逐年加大投入,根据近年来该公司对产品研发年投入额x(单位:百万元)与其年销售量y(单位:千件)的数据统计,得到散点图如图.用线性回归模型和指数型回归模型拟合y与x关系的决定系数分别为=0.891 3和=0.994 0,则根据参考数据,下列表达式中最适宜描述y与x之间关系的函数为(  )
参考公式:经验回归方程=u+中,=,=-.
令ωi=ln yi,参考数据:
(xi-)2 (xi-)(yi-) (xi-)(ωi-)
3 2.5 0.5 10 12 6
A.y=1.2x-1.1  B.y=0.6x-1.3
C.y=e1.2x-1.1  D.y=e0.6x-1.3
4.(2025·九江二模)植物的根是吸收水分和矿物养分的主要器官.已知在一定范围内,小麦对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽小麦实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度x(单位:Cm)与氮元素吸收量y(单位:mg/天)的相关数据,如下表所示:
x 9.9 12.1 14.8 18.2 19.9 21.8 25.1 27.7 30.4 32.1
y 0.30 0.34 0.42 0.50 0.55 0.60 0.71 0.74 0.78 0.86
根据表中数据可得=21.2,=0.58及经验回归方程为y=0.025x+,则(  )
A.=-0.05
B.变量y与x的样本相关系数r<0
C.在一定范围内,小麦的根长度每增加1 Cm,它一天的氮元素吸收量平均增加0.025 mg
D.若对小麦的根长度与钾元素吸收量的相关数据进行统计,则对应经验回归方程不变
5.腹有诗书气自华,读书有益于开拓眼界、提升格局;最是书香能致远,书海中深蕴着灼热的理想信仰、炽热的国家情怀.某校高中学生的读书情况如下:
喜欢读书 不喜欢读书 合计
男生 260 60 320
女生 200 m m+200
合计 460 m+60 m+520
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
根据小概率值α=0.001的独立性检验,推断是否喜欢阅读与性别有关,则m的值可以为(  )
A.10  B.20
C.30  D.40
6.(2025·厦门四模)(多选)甲、乙两名篮球运动员连续5场比赛的得分如图所示,则(  )
A.甲得分的极差大于乙得分的极差
B.甲得分的平均数大于乙得分的平均数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
7.(2025·太原一模)(多选)已知样本数据x1,x2,…,x5的平均数为3,方差为3,样本数据y1,y2,…,y10的平均数为3,方差为6,则下列结论正确的是(  )
A.数据2x1+1,2x2+1,…,2x5+1的平均数为7
B.数据2y1-1,2y2-1,…,2y10-1的方差为11
C.数据x1,x2,…,x5,y1,y2,…,y10的平均数为3
D.数据x1,x2,…,x5,y1,y2,…,y10的方差为5
8.(2025·湛江一模)(多选)已知A(1,6),B(2,4),C(3,4),D(4,2),E(5,4),5个数据的散点图如图所示,采用一元线性回归模型建立经验回归方程.经分析确定E(5,4)为“离群点”,故将其去掉,将数据E(5,4)去掉后,下列说法正确的有(  )
A.样本相关系数r变大
B.残差平方和变小
C.决定系数R2变大
D.若经验回归直线过点(3.5,2.8),则其经验回归方程为=-1.2x+7
9.(2025·东莞、揭阳、韶关期末)(多选)某同学投掷一枚骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)5次,并将每次向上的点数记录下来,计算出平均数和方差.若这5个点数的平均数为2,方差小于4,则关于这5个点数,下列结论正确的是(  )
A.极差小于4  B.一定不会出现6
C.众数可能为1  D.中位数可能为3
10.(2025·深圳二模)已知样本x1,x2,x3的平均数为2,方差为1,则,,的平均数为   .
11.今年“五一”期间,某百货大楼做促销活动,下表是该百货大楼5月1日至10日(日期简记为1,2,3,…,10)连续10天的销售情况:
日期x 1 2 3 4 5 6 7 8 9 10
销售额y/万元 19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
由上述数据,用最小二乘法得到销售额和日期的经验回归方程为=0.84x+17.45,日期的方差约为3.02,销售额的方差约为2.59.
参考公式:样本相关系数r=.
经验回归方程=x+中,=,=-.
参考数据:≈279.67.
(1) 根据经验回归方程,分析销售额随日期变化趋势的特征,并计算第4天的残差.
(2) 计算样本相关系数r,并分析销售额和日期的相关程度(精确到0.001).
(3) 该百货大楼为了促销,拟打算对电视机实行分期付款方式销售,假设顾客购买一台电视机选择分期付款的期数及相应的概率和公司获得的利润Y(单位:元)的情况如下表:
ξ 2 4 6
P a1 a2 a3
Y 400 600 800
已知a1,a2,a3成等比数列.设该公司销售两台电视机所获得的利润为X(单位:元),当X=1 200的概率取得最大值时,求利润X的分布列和数学期望.
12.(2025·德州模拟)为调查某人工智能文生视频模型的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
模型的应用情况 视频从业人员 合计
减少 未减少
应用 54 72
没有应用 42
合计 90 150
附:χ2=,其中n=a+b+c+d.
α 0.010 0.005 0.001
xα 6.635 7.879 10.828
(1) 根据所给数据完成题中表格,并判断是否有99.9%的把握认为该模型的应用与视频从业人员的减少有关?
(2) 某公司视频部现有员工100人,公司拟开展专项培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有两轮及以上获得“优秀”的员工才能应用该模型.
①求员工经过培训能应用该模型的概率.
②已知开展培训前,员工每人每年平均为公司创造利润6万元;开展培训后,能应用该模型的员工每人每年平均为公司创造利润10万元,专项培训平均每人每年成本为1万元.根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展专项培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
21世纪教育网(www.21cnjy.com)(共73张PPT)
专题四
1 统 计
统计与概率
α 0.1 0.05 0.025 0.01 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
基础打底
x 1 2 3 4 5
y 5 m 8 9 10.5
【解析】
【答案】AD 
性别 是否患过某流行疾病 合计
患过该疾病 未患过该疾病
男 a=20 b a+b
女 c d=50 c+d
合计 a+c 80 110
【解析】
【答案】ABC
3.一组不全相等的数据,去掉一个最大值,则下列数字特征一定改变的是 (  )
A.极差  B.中位数
C.平均数  D.众数
    
【解析】
    对于A,去掉一个最大值后,新极差为原次大值与最小值之差,若原次大值等于最大值,则极差不变,若原次大值不等于最大值,则极差改变,故A错误;
对于B,去掉一个最大值后,中位数可能改变,可能不变,如原数据为1,2,2,3,中位数为2,去掉3后,数据为1,2,2,中位数还是2,故B错误;
【答案】C
年份 2016 2017 2018 2019 2020
年份代号x 16 17 18 19 20
高校毕业生人数y/万人 765 795 820 834 874
【答案】0.99
【解析】
强技提能
目标
1
新情境下特征数的推理与证明
   (多选)某同学掷骰子五次,分别记录每次骰子出现的点数.根据该同学记录的结果,判断可能出现点数6的是 (   )
A.平均数为3,中位数为2  B.中位数为3,众数为2
C.平均数为2,方差为2.4  D.中位数为3,方差为2.8
1
【解析】
【答案】ABD
1.围绕统计量公式,代入假设值验证.
2.利用数据排序与极端值分析:
3.构造符合统计量的具体数据组.
变式1 (多选)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是1,2,3,4,5,6,7)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为4,极差为3;乙:中位数为3,众数为5;
丙:中位数为4,平均数为3;丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是 (   )
A.甲  B.乙
C.丙  D.丁
【解析】
对于丁,设这7个数分别为x1,x2,x3,x4,x5,x6,x7,则x1+x2+x3+x4+x5+x6+x7=21,(x1-3)2+(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2+(x6-3)2+(x7-3)2=21.若x1=7,则x2+x3+x4+x5+x6+x7=14,(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2+(x6-3)2+(x7-3)2=5,从而x2,x3,x4,x5,x6,x7这6个数可能是4,4,4,4,4,3或4,4,4,4,3,2或4,4,4,3,2,2或4,4,3,2,2,2或4,3,2,2,2,2或3,2,2,2,2,2或5,4,3,3,3,3或5,3,3,3,3,2或4,3,3,3,3,1或3,3,3,3,2,1,这与x2+x3+x4+x5+x6+x7=14矛盾,即这7个数中一定没有出现7,故丁符合题意.
【答案】BCD 
目标
2
生产生活中的决策与预测问题
     (2024·全国甲卷)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
2-1
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
(1)填写如下列联表:
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
优级品 非优级品
甲车间
乙车间
【解答】
根据题意可得列联表如下:
优级品 非优级品 合计
甲车间 26 24 50
乙车间 70 30 100
合计 96 54 150
     (2024·全国甲卷)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
2-1
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
【解答】
应用独立性检验解决实际问题应包括以下几个主要环节:
(1) 提出零假设H0:
(2)计算χ2的值,并与临界值xα比较:
(3)根据检验规则得出推断结论:
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
     某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示:
2-2
44 4.8 10 40.3 1.612 19.5 8.06
【解答】
     某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示:
2-2
44 4.8 10 40.3 1.612 19.5 8.06
【解答】
     某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示:
2-2
44 4.8 10 40.3 1.612 19.5 8.06
(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量ξ影响,设随机变量ξ服从正态分布N(600,σ2),且满足P(ξ>800)=0.3.在(2)的条件下,求该公司年净利润的最大值大于1 000百万元的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量)
【解析】
变式2 (2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 根部横截面积xi 材积量yi
1 0.04 0.25
2 0.06 0.40
3 0.04 0.22
4 0.08 0.54
5 0.08 0.51
6 0.05 0.34
7 0.05 0.36
8 0.07 0.46
9 0.07 0.42
10 0.06 0.40
总和 0.6 3.9
【解答】
变式2 (2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 根部横截面积xi 材积量yi
1 0.04 0.25
2 0.06 0.40
3 0.04 0.22
4 0.08 0.54
5 0.08 0.51
6 0.05 0.34
7 0.05 0.36
8 0.07 0.46
9 0.07 0.42
10 0.06 0.40
总和 0.6 3.9
【解答】
变式2 (2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 根部横截面积xi 材积量yi
1 0.04 0.25
2 0.06 0.40
3 0.04 0.22
4 0.08 0.54
5 0.08 0.51
6 0.05 0.34
7 0.05 0.36
8 0.07 0.46
9 0.07 0.42
10 0.06 0.40
总和 0.6 3.9
【解答】
热练
1.(2025·武汉2月调研)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,则下列说法正确的是 (  )
A.a=0.05
B.评分的众数的估值为70
C.评分的第25百分位数估值为67.5
D.评分的平均数估值为76
【解析】
【答案】C 
2.(2025·南京、盐城一模)某项比赛共有10个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是 (  )
A.极差  B.第45百分位数
C.平均数  D.众数
【解析】
    对于A,若每个数据都不相同,则极差一定变化,故A错误;
对于B,因为10×0.45=4.5,所以将10个数据从小到大排列,第45百分位数为第5个数据,从10个原始评分中去掉一个最高分与一个最低分,得到8个有效评分,8×0.45=3.6,所以第45百分位数为8个数据从小到大排列后第4个数据,即为原来的第5个数据;
对于C,去掉一个最高分与一个最低分,平均数可能变化,故C错误;
对于D,去掉一个最高分与一个最低分,众数可能变化,故D错误.
【答案】B
3 2.5 0.5 10 12 6
A.y=1.2x-1.1   B.y=0.6x-1.3  C.y=e1.2x-1.1   D.y=e0.6x-1.3
【解析】
【答案】D
x 9.9 12.1 14.8 18.2 19.9 21.8 25.1 27.7 30.4 32.1
y 0.30 0.34 0.42 0.50 0.55 0.60 0.71 0.74 0.78 0.86
【解析】
【答案】C
5.腹有诗书气自华,读书有益于开阔眼界、提升格局;最是书香能致远,书海中深蕴着灼热的理想信仰、炽热的国家情怀.某校高中学生的读书情况如下:
喜欢读书 不喜欢读书 合计
男生 260 60 320
女生 200 m m+200
合计 460 m+60 m+520
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
根据小概率值α=0.001的独立性检验,推断是否喜欢阅读与性别有关,则m的值可以为 (  )
A.10  B.20 C.30  D.40a
【解析】
【答案】A
6.(2025·厦门四模)(多选)甲、乙两名篮球运动员连续5场比赛的得分如图所示,则 (   )
A.甲得分的极差大于乙得分的极差
B.甲得分的平均数大于乙得分的平均数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
【解析】
    甲5场比赛得分由低到高分别为15,16,18,21,30,乙5场比赛得分由低到高分别为4,10,16,22,38,则甲得分的极差为30-15=15,乙得分的极差为38-4=34,故甲得分的极差小于乙得分的极差,故A错误;
【答案】BC 
7.(2025·太原一模)(多选)已知样本数据x1,x2,…,x5的平均数为3,方差为3,样本数据y1,y2,… ,y10的平均数为3,方差为6,则下列结论正确的是 (   )
A.数据2x1+1,2x2+1,… ,2x5+1的平均数为7
B.数据2y1-1,2y2-1,… ,2y10-1的方差为11
C.数据x1,x2,… ,x5,y1,y2,… ,y10的平均数为3
D.数据x1,x2,… ,x5,y1,y2,… ,y10的方差为5
【解析】
【答案】ACD
8.(2025·湛江一模)(多选)已知A(1,6),B(2,4),C(3,4),D(4,2),E(5,4),5个数据的散点图如图所示,采用一元线性回归模型建立经验回归方程.经分析确定E(5,4)为“离群点”,故将其去掉,将数据E(5,4)去掉后,下列说法正确的有 (   )
【解析】

【答案】BCD
9.(2025·东莞、揭阳、韶关期末)(多选)某同学投掷一枚骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)5次,并将每次向上的点数记录下来,计算出平均数和方差.若这5个点数的平均数为2,方差小于4,则关于这5个点数,下列结论正确的是 (   )
A.极差小于4  B.一定不会出现6
C.众数可能为1  D.中位数可能为3
【解析】
【答案】BC
【解析】

5
11.今年“五一”期间,某百货大楼做促销活动,下表是该百货大楼5月1日至10日(日期简记为1,2,3,…,10)连续10天的销售情况:
日期x 1 2 3 4 5 6 7 8 9 10
销售额y/万元 19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
【解答】
11.今年“五一”期间,某百货大楼做促销活动,下表是该百货大楼5月1日至10日(日期简记为1,2,3,…,10)连续10天的销售情况:
日期x 1 2 3 4 5 6 7 8 9 10
销售额y/万元 19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
【解答】
11.今年“五一”期间,某百货大楼做促销活动,下表是该百货大楼5月1日至10日(日期简记为1,2,3,…,10)连续10天的销售情况:
日期x 1 2 3 4 5 6 7 8 9 10
销售额y/万元 19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
ξ 2 4 6
P a1 a2 a3
Y 400 600 800
已知a1,a2,a3成等比数列.设该公司销售两台电视机所获得的利润为X(单位:元),当X=1 200的概率取得最大值时,求利润X的分布列和数学期望.
【解答】
故X的分布列为
X 800 1 000 1 200 1 400 1 600
P
12.(2025·德州模拟)为调查某人工智能文生视频模型的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
模型的应用情况 视频从业人员 合计
减少 未减少
应用 54 72
没有应用 42
合计 90 150
α 0.010 0.005 0.001
xα 6.635 7.879 10.828
(1)根据所给数据完成题中表格,并判断是否有99.9%的把握认为该模型的应用与视频从业人员的减少有关?
【解答】
    依题意,补全2×2列联表如下:
模型的应用情况 视频从业人员 合计
减少 未减少
应用 54 18 72
没有应用 36 42 78
合计 90 60 150
12.(2025·德州模拟)为调查某人工智能文生视频模型的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
模型的应用情况 视频从业人员 合计
减少 未减少
应用 54 72
没有应用 42
合计 90 150
α 0.010 0.005 0.001
xα 6.635 7.879 10.828
【解答】专题四 统计与概率
1 统 计
参考公式及数据:(1) 独立性检验:χ2=,其中n=a+b+c+d.
附表:
α 0.1 0.05 0.025 0.01 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
(2) 回归分析:r=;=+x中,=,=-.
基础打底
1.(多选)已知两个变量y与x对应关系如下表:
x 1 2 3 4 5
y 5 m 8 9 10.5
若y与x满足一元线性回归模型,且经验回归方程为=1.25x+4.25,则( AD )
A.y与x正相关  B.m=7
C.样本数据y的第60百分位数为8  D.各组数据的残差和为0
【解析】 由经验回归方程知1.25>0,所以y与x正相关,故A正确;由表格数据及经验回归方程易知=3,=1.25×3+4.25=,解得m=7.5,故B错误;易知5×60%=3,所以样本数据y的第60百分位数为=8.5,故C错误;由经验回归方程知x=1,2,3,4,5时对应的预测值分别为=5.5,6.75,8,9.25,10.5,对应残差分别为-0.5,0.75,0,-0.25,0,显然残差之和为0,故D正确.
2.(多选)某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示,则下列说法正确的有( ABC )
性别 是否患过某流行疾病 合计
患过该疾病 未患过该疾病
男 a=20 b a+b
女 c d=50 c+d
合计 a+c 80 110
A.> 
B.χ2>6.635
C.根据小概率值α=0.01的独立性检验,认为是否患过该流行疾病与性别有关联
D.根据小概率值α=0.01的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联
【解析】 根据列联表中的数据可求得a=20,b=30,c=10,d=50.对于A,代入计算可得=>=,故A正确;对于B,经计算可得χ2=≈7.486>6.635,故B正确;对于C,D,结合附表数值以及独立性检验的实际意义,根据小概率值α=0.01的独立性检验,认为是否患过该流行疾病与性别有关联,故C正确,D错误.
3.一组不全相等的数据,去掉一个最大值,则下列数字特征一定改变的是( C )
A.极差  B.中位数
C.平均数  D.众数
【解析】 对于A,去掉一个最大值后,新极差为原次大值与最小值之差,若原次大值等于最大值,则极差不变,若原次大值不等于最大值,则极差改变,故A错误;对于B,去掉一个最大值后,中位数可能改变,可能不变,如原数据为1,2,2,3,中位数为2,去掉3后,数据为1,2,2,中位数还是2,故B错误;对于C,设原平均数为=,且x1,x2,…,xn按照从小到大的顺序,假设去掉最大值xn后平均数不变,则=,所以=,解得=xn,由于原数据不全相等,则<xn,故矛盾,所以平均数一定改变,故C正确;对于D,众数不一定改变,如数据为2,2,3,4,众数为2,去掉4后,众数仍为2,故D错误.
4.据统计,2016年至2020年我国高校毕业生人数y(单位:万人)的数据如下表所示.根据表中数据,y与x的样本相关系数r为 0.99 (保留两位有效数字,参考数据:(xi-)2=10,(yi-)2=6 733.2,≈259.5).
年份 2016 2017 2018 2019 2020
年份代号x 16 17 18 19 20
高校毕业生人数y/万人 765 795 820 834 874
【解析】 由题得=18,=817.6,所以(xi-)(yi-)=(-2)×(-52.6)+(-1)×(-22.6)+16.4+2×56.4=257,所以r==≈≈0.99.
强技提能
新情境下特征数的推理与证明
例1 (多选)某同学掷骰子五次,分别记录每次骰子出现的点数.根据该同学记录的结果,判断可能出现点数6的是( ABD )
A.平均数为3,中位数为2  B.中位数为3,众数为2
C.平均数为2,方差为2.4  D.中位数为3,方差为2.8
【解析】 对于A,当投掷骰子出现结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点数6,故A符合题意;对于B,当投掷骰子出现结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点数6,故B符合题意;对于C,若平均数为2,且出现6点,则方差s2>(6-2)2=3.2>2.4,故平均数为2,方差为2.4时,一定没有出现点数6,故C不符合题意;对于D,当投掷骰子出现结果为1,2,3,3,6时,满足中位数为3,平均数为=×(1+2+3+3+6)=3,方差为s2=×[(1-3)2+(2-3)2+(3-3)2+(3-3)2+(6-3)2]=2.8,可以出现点数6,故D符合题意.
1.围绕统计量公式,代入假设值验证.
2.利用数据排序与极端值分析:
3.构造符合统计量的具体数据组.
变式1 (多选)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是1,2,3,4,5,6,7)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为4,极差为3;
乙:中位数为3,众数为5;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是( BCD )
A.甲  B.乙
C.丙  D.丁
【解析】 对于甲,因为中位数为4,极差为3,所以这7个数可以是4,4,4,4,4,4,7,则甲不符合题意.对于乙,因为中位数为3,众数为5,所以这7个数从小到大排列后,第4个数是3,所以1,2,3中一定有一个数出现2次,5出现3次,所以这7个数中一定没有出现7,则乙符合题意.对于丙,若出现1个7,则这7个数从小到大排列后,后4个数之和最小为19,前3个数之和最小为3,从而这7个数的平均数最小为>3,即这7个数的平均数不可能为3,故丙符合题意.对于丁,设这7个数分别为x1,x2,x3,x4,x5,x6,x7,则x1+x2+x3+x4+x5+x6+x7=21,(x1-3)2+(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2+(x6-3)2+(x7-3)2=21.若x1=7,则x2+x3+x4+x5+x6+x7=14,(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2+(x6-3)2+(x7-3)2=5,从而x2,x3,x4,x5,x6,x7这6个数可能是4,4,4,4,4,3或4,4,4,4,3,2或4,4,4,3,2,2或4,4,3,2,2,2或4,3,2,2,2,2或3,2,2,2,2,2或5,4,3,3,3,3或5,3,3,3,3,2或4,3,3,3,3,1或3,3,3,3,2,1,这与x2+x3+x4+x5+x6+x7=14矛盾,即这7个数中一定没有出现7,故丁符合题意.
生产生活中的决策与预测问题
例2-1 (2024·全国甲卷)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
(1) 填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
【解答】 根据题意可得列联表如下:
优级品 非优级品 合计
甲车间 26 24 50
乙车间 70 30 100
合计 96 54 150
可得χ2===4.687 5.因为4.687 5>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异.因为4.687 5<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2) 已知升级改造前该工厂产品的优级品率p=0.5,设为升级改造后抽取的n件产品的优级品率,如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
【解答】 由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为=0.64,用频率估计概率可得=0.64.又因为升级改造前该工厂产品的优级品率p=0.5,则p+1.65=0.5+1.65≈0.5+1.65×≈0.567,可知>p+1.65,所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
应用独立性检验解决实际问题应包括以下几个主要环节:
(1) 提出零假设H0:
(2) 计算χ2的值,并与临界值xα比较:
(3) 根据检验规则得出推断结论:
(4) 在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
例2-2 某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示:
令vi=ln xi(i=1,2,…,5),数据经过初步处理得:
yi vi (xi-)22 (yi-)2 (vi-)2 (xi-)(yi- (yi-)(vi-)
444.8 10 40.3 1.612 19.5 8.06
现有①y=bx+a和②y=nln x+m两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
参考数据:=8.06,≈20.1,ln 5≈1.6,ln 6≈1.8.
(1) 请从样本相关系数的角度,分析哪一个模型拟合程度更好?
【解答】 设模型①和②的样本相关系数分别为r1,r2.由题意可得r1==≈≈0.97,r2====1,所以|r1|<|r2|,由样本相关系数的相关性质可得,模型②的拟合程度更好.
(2) 根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的经验回归方程,并预测年广告费为6百万元时,产品的年销售量是多少?
【解答】 因为===5,又由=vi=0.96,=yi=8.8,得=-5=8.8-5×0.96=4,所以y=5v+4,即经验回归方程为=5ln x+4.当x=6时,=5ln 6+4≈13,因此当年广告费为6百万元时,产品的年销售量大概是13百万辆.
(3) 该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量ξ影响,设随机变量ξ服从正态分布N(600,σ2),且满足P(ξ>800)=0.3.在(2)的条件下,求该公司年净利润的最大值大于1 000百万元的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量)
【解答】 年净利润为200×(5ln x+4)-200x-ξ(x>0),令g(x)=200×(5ln x+4)-200x-ξ,所以g′(x)=-200,令g′(x)=0,得x=5,可得y=g(x)在(0,5)上为增函数,在(5,+∞)上为减函数,所以g(x)max=g(5)=200×(5ln 5+4-5)-ξ≈1 400-ξ,由题意得1 400-ξ>1 000,即ξ<400,P(ξ<400)=P(ξ>800)=0.3,即该公司年净利润的最大值大于1 000百万元的概率为0.3.
1.一元线性回归模型应用要点:
样本相关系数r的绝对值越接近于1,两变量的线性相关程度越强.
2.要熟悉“r=”与“=”的公式变形:
(xi-)(yi-)=xiyi- ;(xi-)2=-n·2;(yi-)2=-n·2.
变式2 (2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 根部横截面积xi 材积量yi
1 0.04 0.25
2 0.06 0.40
3 0.04 0.22
4 0.08 0.54
5 0.08 0.51
6 0.05 0.34
7 0.05 0.36
8 0.07 0.46
9 0.07 0.42
10 0.06 0.40
总和 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1) 估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
【解答】 估计该林区这种树木平均一棵的根部横截面积===0.06(m2),估计该林区这种树木平均一棵的材积量===0.39(m3).
(2) 求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
【解答】 (xi-)(yi-)=xiyi-10=0.013 4,(xi-)2=-102= 0.002,(yi-)2=-102=0.094 8,所以 ==≈0.01×1.377=0.013 77,所以样本相关系数r=≈≈0.97.
(3) 现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.(参考数据:≈1.377)
【解答】 设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=,所以Y==1 209,即该林区这种树木的总材积量的估计值为1 209 m3.
配套热练
1.(2025·武汉2月调研)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,则下列说法正确的是( C )
A.a=0.05
B.评分的众数的估值为70
C.评分的第25百分位数估值为67.5
D.评分的平均数估值为76
【解析】 由题意可得10×(2a+3a+4a+5a+6a)=1,解得a=0.005,故A错误;众数为=75,故B错误;因为0.1+0.2=0.3,所以第25百分位数估值为60+10×=67.5,故C正确;平均数为0.1×55+0.2×65+0.3×75+0.25×85+0.15×95=76.5,故D错误.
2.(2025·南京、盐城一模)某项比赛共有10个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是( B )
A.极差  B.第45百分位数
C.平均数  D.众数
【解析】 对于A,若每个数据都不相同,则极差一定变化,故A错误;对于B,因为10×0.45=4.5,所以将10个数据从小到大排列,第45百分位数为第5个数据,从10个原始评分中去掉一个最高分与一个最低分,得到8个有效评分,8×0.45=3.6,所以第45百分位数为8个数据从小到大排列后第4个数据,即为原来的第5个数据;对于C,去掉一个最高分与一个最低分,平均数可能变化,故C错误;对于D,去掉一个最高分与一个最低分,众数可能变化,故D错误.
3.(2025·梅州质检)某科技公司在人工智能领域逐年加大投入,根据近年来该公司对产品研发年投入额x(单位:百万元)与其年销售量y(单位:千件)的数据统计,得到散点图如图.用线性回归模型和指数型回归模型拟合y与x关系的决定系数分别为=0.891 3和=0.994 0,则根据参考数据,下列表达式中最适宜描述y与x之间关系的函数为( D )
参考公式:经验回归方程=u+中,=,=-.
令ωi=ln yi,参考数据:
(xi-)2 (xi-)(yi-) (xi-)(ωi-)
3 2.5 0.5 10 12 6
A.y=1.2x-1.1  B.y=0.6x-1.3
C.y=e1.2x-1.1  D.y=e0.6x-1.3
【解析】 由用线性回归模型和指数型回归模型拟合y与x关系的决定系数分别为=0.891 3和=0.994 0,得<,则指数型回归模型最适宜拟合y与x的关系,排除A,B;设y与x之间关系的函数为=ex+,两边取对数得ln =x+,设=ln ,则=x+,因此===0.6,=-=0.5-0.6×3=-1.3,即ln =0.6x-1.3,则=e0.6x-1.3,故C错误,D正确.
4.(2025·九江二模)植物的根是吸收水分和矿物养分的主要器官.已知在一定范围内,小麦对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽小麦实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度x(单位:Cm)与氮元素吸收量y(单位:mg/天)的相关数据,如下表所示:
x 9.9 12.1 14.8 18.2 19.9 21.8 25.1 27.7 30.4 32.1
y 0.30 0.34 0.42 0.50 0.55 0.60 0.71 0.74 0.78 0.86
根据表中数据可得=21.2,=0.58及经验回归方程为y=0.025x+,则( C )
A.=-0.05
B.变量y与x的样本相关系数r<0
C.在一定范围内,小麦的根长度每增加1 Cm,它一天的氮元素吸收量平均增加0.025 mg
D.若对小麦的根长度与钾元素吸收量的相关数据进行统计,则对应经验回归方程不变
【解析】 由经验回归方程过样本中心点(,)知,=0.58-0.025×21.2=0.05,故A错误;小麦对氮元素的吸收量与它的根长度具有正相关关系,故样本相关系数r>0,故B错误;由经验回归方程y=0.025x+可得,在一定范围内,小麦的根长度每增加1 Cm,它一天的氮元素吸收量平均增加0.025 mg,故C正确;若研究小麦的根长度与钾元素吸收量的相关关系,经验回归方程大概率会发生改变,故D错误.
5.腹有诗书气自华,读书有益于开拓眼界、提升格局;最是书香能致远,书海中深蕴着灼热的理想信仰、炽热的国家情怀.某校高中学生的读书情况如下:
喜欢读书 不喜欢读书 合计
男生 260 60 320
女生 200 m m+200
合计 460 m+60 m+520
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
根据小概率值α=0.001的独立性检验,推断是否喜欢阅读与性别有关,则m的值可以为( A )
A.10  B.20
C.30  D.40
【解析】 根据列联表可知a=260,b=60,c=200,d=m,则n=a+b+c+d=520+m,由公式χ2===,根据小概率值α=0.001的独立性检验,推断是否喜欢阅读与性别有关,则χ2>10.828,即>10.828,当取m=10时,≈21.642>10.828,满足题意,故m可取10;当取m=20时,≈9.638<10.828,不满足题意;当取m=30时,≈3.184<10.828,不满足题意;当取m=40时,≈0.406<10.828,不满足题意.
6.(2025·厦门四模)(多选)甲、乙两名篮球运动员连续5场比赛的得分如图所示,则( BC )
A.甲得分的极差大于乙得分的极差
B.甲得分的平均数大于乙得分的平均数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
【解析】 甲5场比赛得分由低到高分别为15,16,18,21,30,乙5场比赛得分由低到高分别为4,10,16,22,38,则甲得分的极差为30-15=15,乙得分的极差为38-4=34,故甲得分的极差小于乙得分的极差,故A错误;甲得分的平均数为=20,乙得分的平均数为=18,则甲得分的平均数大于乙得分的平均数,故B正确;甲得分的中位数为18,乙得分的中位数为16,则甲得分的中位数大于乙得分的中位数,故C正确;甲得分的方差为×[(15-20)2+(16-20)2+(18-20)2+(21-20)2+(30-20)2]=29.2,乙得分的方差为×[(4-18)2+(10-18)2+(16-18)2+(22-18)2+(38-18)2]=136,故甲得分的方差小于乙得分的方差,故D错误.
7.(2025·太原一模)(多选)已知样本数据x1,x2,…,x5的平均数为3,方差为3,样本数据y1,y2,…,y10的平均数为3,方差为6,则下列结论正确的是( ACD )
A.数据2x1+1,2x2+1,…,2x5+1的平均数为7
B.数据2y1-1,2y2-1,…,2y10-1的方差为11
C.数据x1,x2,…,x5,y1,y2,…,y10的平均数为3
D.数据x1,x2,…,x5,y1,y2,…,y10的方差为5
【解析】 对于A,因为样本数据x1,x2,…,x5的平均数为3,所以由平均数性质得数据2x1+1,2x2+1,…,2x5+1的平均数为2×3+1=7,故A正确;对于B,因为样本数据y1,y2,…,y10的方差为6,所以数据2y1-1,2y2-1,…,2y10-1的方差为22×6=24,故B错误;对于C,因为样本数据x1,x2,…,x5的平均数为3,样本数据y1,y2,…,y10的平均数为3,所以数据x1,x2,…,x5,y1,y2,…,y10的平均数为=3,故C正确;对于D,由已知得数据x1,x2,…,x5,y1,y2,…,y10的平均数为3,则新方差为s2==5,故D正确.
8.(2025·湛江一模)(多选)已知A(1,6),B(2,4),C(3,4),D(4,2),E(5,4),5个数据的散点图如图所示,采用一元线性回归模型建立经验回归方程.经分析确定E(5,4)为“离群点”,故将其去掉,将数据E(5,4)去掉后,下列说法正确的有( BCD )
A.样本相关系数r变大
B.残差平方和变小
C.决定系数R2变大
D.若经验回归直线过点(3.5,2.8),则其经验回归方程为=-1.2x+7
【解析】 对于A,由图可知,变量x与变量y负相关,且将数据E(5,4)去掉后,样本相关系数r的绝对值变大,所以r变小,故A错误;对于B,C,将数据E(5,4)去掉后,变量x与变量y的相关性变强,所以残差平方和变小,决定系数R2变大,故B,C正确;对于D,设经验回归方程为=x+,经计算得=30,xiyi=34,且=2.5,=4,可得==-1.2,=4-(-1.2)×2.5=7,所以经验回归方程是=-1.2x+7,经检验点(3.5,2.8)在经验回归直线上,所以D正确.
9.(2025·东莞、揭阳、韶关期末)(多选)某同学投掷一枚骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)5次,并将每次向上的点数记录下来,计算出平均数和方差.若这5个点数的平均数为2,方差小于4,则关于这5个点数,下列结论正确的是( BC )
A.极差小于4  B.一定不会出现6
C.众数可能为1  D.中位数可能为3
【解析】 设数据为xi∈{1,2,3,4,5,6},i∈{1,2,3,4,5},且x1≤x2≤x3≤x4≤x5,因为平均数=xi=2,方差s2=<4,所以xi=10,<40.对于A,C,例如数据为1,1,1,2,5,则xi=10,=32<40,符合题意,但极差为5-1=4,众数为1,故A错误,C正确.对于B,假设出现6,由平均数可知其余4个数据均为1,但=40,这与题意相矛盾,假设不成立,所以一定不会出现6,故B正确.对于D,假设中位数为3,则x3=3,1≤x1≤x2≤3≤x4≤x5,可得xi≥1+1+3+3+3=11>10,这与题意相矛盾,假设不成立,所以中位数不可能为3,故D错误.
10.(2025·深圳二模)已知样本x1,x2,x3的平均数为2,方差为1,则,,的平均数为  5 .
【解析】 方法一:由题意知,=2,所以x1+x2+x3=6,由=1,得++=15,所以=5.
方法二:由D(X)=E(X2)-E2(X),得1=-2,即1=-22,所以=5.
11.今年“五一”期间,某百货大楼做促销活动,下表是该百货大楼5月1日至10日(日期简记为1,2,3,…,10)连续10天的销售情况:
日期x 1 2 3 4 5 6 7 8 9 10
销售额y/万元 19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
由上述数据,用最小二乘法得到销售额和日期的经验回归方程为=0.84x+17.45,日期的方差约为3.02,销售额的方差约为2.59.
参考公式:样本相关系数r=.
经验回归方程=x+中,=,=-.
参考数据:≈279.67.
(1) 根据经验回归方程,分析销售额随日期变化趋势的特征,并计算第4天的残差.
【解答】 根据经验回归方程=0.84x+17.45,日期每增加一天,销售额约增加0.84万元.把x=4代入经验回归方程,得=0.84×4+17.45=20.81.因为20-20.81=-0.81,所以第4天的残差为-0.81.
(2) 计算样本相关系数r,并分析销售额和日期的相关程度(精确到0.001).
【解答】 由=×= =,得r==0.84×=0.84×≈0.907,0.907比较接近于1,故销售额和日期的相关程度较强.
(3) 该百货大楼为了促销,拟打算对电视机实行分期付款方式销售,假设顾客购买一台电视机选择分期付款的期数及相应的概率和公司获得的利润Y(单位:元)的情况如下表:
ξ 2 4 6
P a1 a2 a3
Y 400 600 800
已知a1,a2,a3成等比数列.设该公司销售两台电视机所获得的利润为X(单位:元),当X=1 200的概率取得最大值时,求利润X的分布列和数学期望.
【解答】 由a1,a2,a3成等比数列,得=a1·a3,且a1+a2+a3=1,设其公比为q,则a2=1,所以a2=.由题意可得X的可能取值为800,1 000,1 200,1 400,1 600,则P(X=800)=,P(X=1 000)=2a1a2,P(X=1 200)=+2a1a3=3,P(X=1 400)=2a2a3,P(X=1 600)=.又P(X=1 200)=3=≤3×2=,当且仅当=q,即q=1时取等号,此时a1=a2=a3=,故X的分布列为
X 800 1 000 1 200 1 400 1 600
P
所以E(X)=800×+1 000×+1 200×+1 400×+1 600×=1 200.
12.(2025·德州模拟)为调查某人工智能文生视频模型的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
模型的应用情况 视频从业人员 合计
减少 未减少
应用 54 72
没有应用 42
合计 90 150
附:χ2=,其中n=a+b+c+d.
α 0.010 0.005 0.001
xα 6.635 7.879 10.828
(1) 根据所给数据完成题中表格,并判断是否有99.9%的把握认为该模型的应用与视频从业人员的减少有关?
【解答】 依题意,补全2×2列联表如下:
模型的应用情况 视频从业人员 合计
减少 未减少
应用 54 18 72
没有应用 36 42 78
合计 90 60 150
零假设为H0:该模型的应用与视频从业人员的减少无关.由列联表中数据得,χ2==≈12.981>10.828.根据小概率值α=0.001的χ2独立性检验,推断H0不成立,所以有99.9%的把握认为该模型的应用与视频从业人员的减少有关.
(2) 某公司视频部现有员工100人,公司拟开展专项培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有两轮及以上获得“优秀”的员工才能应用该模型.
①求员工经过培训能应用该模型的概率.
②已知开展培训前,员工每人每年平均为公司创造利润6万元;开展培训后,能应用该模型的员工每人每年平均为公司创造利润10万元,专项培训平均每人每年成本为1万元.根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展专项培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
【解答】 ①设Ai=“员工第i轮培训获得优秀”(i=1,2,3),且Ai相互独立.设B=“员工经过培训能应用该模型”,则P(B)=P(A1A2A3)+P(A2A3)+P(A1A3)+P(A1A2)=××+××+××+××=,故员工经过培训能应用该模型的概率是.
②设视频部调x人至其他部门,x∈N,X为培训后视频部能应用该模型的人数,则X~B,因此E(X)=,调整后视频部的年利润为×10+(100-x)×6-(100-x)=(700-7x)(万元),令700-7x≥100×6,解得x≤≈14.3,又x∈N,所以xmax=14.因此,视频部最多可以调14人到其他部门.
21世纪教育网(www.21cnjy.com)
同课章节目录