2026年高考数学一轮复习 统计(含解析)

文档属性

名称 2026年高考数学一轮复习 统计(含解析)
格式 docx
文件大小 933.7KB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2025-09-25 16:30:23

图片预览

文档简介

中小学教育资源及组卷应用平台
高考数学一轮复习 统计
一.选择题(共8小题)
1.(2025 晋城二模)已知10个样本数据的平均值为10,方差为6,则这10个数据的65%分位数的最大值为(  )
A.11 B.12 C.13 D.14
2.(2025 武汉模拟)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分,得到如图所示的统计表格,则下列结论不正确的是(  )
评委编号 模型名称 1 2 3 4 5 6
甲 7.0 9.3 8.3 9.2 8.9 8.9
乙 8.1 9.1 8.5 8.6 8.7 8.6
A.甲得分的平均数大于乙得分的平均数
B.甲得分的众数大于乙得分的众数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
3.(2025春 道里区校级月考)为了了解高中学生每天的课后学习时间和他们的数学成绩排名的关系,某实验小组做了调查,得到一些数据如下表,已知学习时间x(单位:小时)与成绩名次y(单位:名)满足线性回归方程yx+a,则a的值为(  )
学习时间x 0.5 1.0 2.0 2.5 4.0
成绩排名y 20 14 10 8 y5
附加:76
A.19 B. C.20 D.
4.(2025 红桥区一模)在2023年某省普通高中学业水平考试(合格考)中,对全省所有考生的数学成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],90分以上为优秀,则下列说法中不正确的是(  )
A.该省考生数学成绩的中位数为75分
B.若要全省的合格考通过率达到96%,则合格分数线约为44分
C.从全体考生中随机抽取1000人,则其中得优秀考试约有100人
D.若同一组中数据用该组区间中间值作代表值,可得考试数学成绩的平均分约为70
5.(2025 浦东新区模拟)研究变量x,y得到一组成对数据(xi,yi),i=1,2,…,n,先进行一次线性回归分析,接着增加一个数据(xn+1,yn+1),其中,再重新进行一次线性回归分析,则下列说法正确的是(  )
A.变量x与变量y的相关性变强
B.相关系数r的绝对值变小
C.线性回归方程不变
D.拟合误差Q变大
6.(2024秋 辽宁期中)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程,那么下列说法正确的是(  )
A.若相关系数r越小,则两组变量的相关性越弱
B.若越大,则两组变量的相关性越强
C.经验回归方程至少经过样本数据(x1,y1),(x2,y2),…,(xn,yn)中的一个
D.在经验回归方程中,当解释变量x每增加1个单位时,相应的观测值y约增加个单位
7.(2024春 寿光市期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是(  )
男生 女生
篮球迷 30 15
非篮球迷 45 10
附:,
P(χ2≥k) 0.10 0.05 0.01
k 2.706 3.841 6.635
A.没有95%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关
8.(2024秋 忻城县校级期中)已知数据x1,x2,x3,…,x10,满足xi﹣xi﹣1=1(2≤i≤10),若去掉x1,x10后组成一组新数据,则新数据与原数据相比,下列说法正确的是(  )
A.若x1=1,则数据x1,x2,x3,…,x10的第75百分位数为7.5
B.平均数变小
C.方差不变
D.中位数不变
二.多选题(共4小题)
(多选)9.(2025 揭阳模拟)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:cm)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是(  )
A.基地牡丹植株高度的极差的估计值大于50
B.基地牡丹植株高度不高于70的频率估计值为30%
C.基地牡丹植株高度的众数与中位数的估计值相等
D.基地牡丹植株高度的第75百分位数的估计值小于80
(多选)10.(2025 江苏模拟)为了解某地家村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中正确的是(  )
A.估计该地农户家庭年收入的平均值不超过6.5万元
B.估计该地有一半以上的农户.其家庭年收入介于4.5万元至8.5万元之间
C.若用分行抽样的方法在该地农户家庭年收入在[2.5,3.5],[6.5,7.5],[12.5,13.5]三组中共抽取48个家庭进行初步访谈,则年收入在[6.5,7.5]的家庭应抽24人
D.从抽样的12组中的每组中抽出一个数据,得到12个家庭的具体收入数据x1,x2, ,x12,若数据a与这12个家庭的收入数据的差的平方和最小,则数据a必为这12个家庭收入数据的平均数
(多选)11.(2025 温江区模拟)下列命题正确的是(  )
A.对于随机事件A与B,P(A)>0,P(B)>0,若P(A|B)=P(A),则事件A与B相互独立
B.若经验回归方程为0.3x+0.2,则样本中心点为(3,1)
C.数据2,7,9,11,13,12,5,7,9,11,13,15的75%分位数为12
D.随机变量X~B(6,0.5),当P(X=k)最大,则k的取值为3
(多选)12.(2025 泉州模拟)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了100个称重(单位:kg),并整理数据,得到如图频率分布直方图.根据此频率分布直方图,下面结论正确的是(  )
A.m=0.1
B.估计该哈密瓜的质量不低于1.6kg的比例为30%
C.估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间
D.估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间
三.填空题(共4小题)
13.(2025春 河南月考)在对某中学高三年级学生体重(单位:kg)的调查中,按男、女生人数比例用分层随机抽样的方法抽取部分学生进行测量,已知抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,则估计该校高三年级学生体重的方差为     .
14.(2024春 大武口区校级期中)红铃虫(Pectinophoragossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度x(℃)的8组观测数据,制成图1所示的散点图.现用两种模型①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
25 2.9 646 168 422688 50.4 70308
表中zi=lnyi;;;;
(1)根据残差图,比较模型①、②的拟合效果,模型     比较合适?
(2)根据(1)中所选择的模型,求出y关于x的回归方程     .
附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线的斜率和截距的最小二乘估计分别为,.
15.(2024 吕梁一模)某市2018年至2022年新能源汽车年销量y(单位:百台)与年份代号x的数据如下表:
年份 2018 2019 2020 2021 2022
年份代号x 0 1 2 3 4
年销量y 10 15 20 30 35
若根据表中的数据用最小二乘法求得y关于x的回归直线方程为6.5x,据此计算相应于样本点(1,15)的残差为     .
16.(2023 浦东新区三模)已知一组成对数据(18,24),(13,34),(10,38),(﹣1,m)的回归方程为y=﹣2x+59.5,则该组数据的相关系数r=    (精确到0.001).
四.解答题(共4小题)
17.(2025春 萍乡期中)某高中开设“四季农耕”的劳动教育课程,课程包括播种和田间管理.学校对选择了这两类课程的学生人数分布进行了统计,相关数据记录在如表格中,但其中有几项缺失,已知有的男生选择了播种课,统计表格如下.
课程 性别 合计
男生 女生
播种 160
田间管理 120
合计 400
(1)补全表格,并判断是否有99.9%的把握认为不同劳动教育课程的选择与性别有关;
(2)学校为了调研学生课程完成率是否存在与平均完成率偏差过大的情况,需计算偏差系数w(n),现给出以下两种数据处理方式:①,②,已知随机调查了6名同学课程的完成率如表,用两种处理方式分别计算学生任务完成率的偏差系数w(n),并指出哪一种数据处理方式对大偏差数据的存在体现更明显.(数据处理方式的偏差系数越大,对大偏差数据的存在体现越明显)
学生编号 1 2 3 4 5 6
完成率x% 50 70 60 66 72 84
附:.
P(x2≥k0) 0.1 0.05 0.01 0.001
k0 2.706 3.841 6.635 10.828
18.(2025春 临川区校级期中)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第80百分位数;
(2)已知落在区间[50,60)的样本平均成绩是57,方差是7,落在区间[60,70)的样本平均成绩为66,方差是4,求两组样本成绩合并后的平均数和方差s2.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:m,x,;n,y,,记总的样本平均数为,样本方差为s2,则.
19.(2025春 崂山区校级期中)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量x(单位:千辆)与年使用人次y(单位:千次)的数据如表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.
x 1 2 3 4 5 6 7
y 6 11 21 34 66 101 196
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型y=a+blgx或指数函数模型y=c dx(c>0,d>0)对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量x与年使用人次y的回归方程类型(给出判断即可,不必说明理由)?并求出y关于x的回归方程;
(2)公司为了测试共享电动车的性能,从所有同型号共享电动车中随机抽取100辆进行等距离骑行测试,骑行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的共享电动车占比30%.请根据统计数据完成2×2列联表,并根据小概率值α=0.01的独立性检验,能否认为共享电动车是否报废与保养有关?
保养 未保养 合计
报废 20
未报废
合计 60 100
参考数据:vi=lgy1,vi.
xiyi xivi 100.54
62.14 1.54 2535 50.12 3.47
参考公式:对于一组数据(x1,y1),(x2,y2),…(x ,y ),其回归直线的斜率和截距的最小二乘估计公式分别为:
,,χ2,其中n=a+b+c+d.
P(x2≥k) 0.25 0.1 0.05 0.025 0.01 0.001
k 1.323 2.706 3.841 5.024 6.635 10.828
20.(2025春 北仑区校级期中)黔西一中为了提高学生对“黔西一中校史”的了解,举办了“知史爱校守初心”的知识竞赛活动,现从所有竞答试卷的卷面成绩中随机抽取100份作为样本数据,将样本答卷中分数x(40≤x≤100)的整数分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)求样本数据的第59百分位数;
(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数和总方差s2.
高考数学一轮复习 统计
参考答案与试题解析
一.选择题(共8小题)
1.(2025 晋城二模)已知10个样本数据的平均值为10,方差为6,则这10个数据的65%分位数的最大值为(  )
A.11 B.12 C.13 D.14
【考点】百分位数;平均数;方差.
【专题】整体思想;转化法;概率与统计;运算求解.
【答案】C
【分析】设这10个数分别为x1,x2,…,x10,不妨设x1≤x2≤...≤x10,可得这10个数据的65%分位数为x7,设x1,x2,…,x6的平均数为m,方差为s,x7,x8,x9,x10的平均数为n,方差为t,由方差定义结合放缩法求解不等式得答案.
【解答】解:设这10个数分别为x1,x2,…,x10,
不妨设x1≤x2≤...≤x10,
∵10×65%=6.5,∴这10个数据的65%分位数为x7,
设x1,x2,…,x6的平均数为m,方差为s,x7,x8,x9,x10的平均数为n,方差为t,
由题意知,,则m,
6,
∴6,解得7≤n≤13,
进而x7≤n≤13,当且仅当s=t=0时取等号,
即x1=x2=x3=x4=x5=x6=8,x7=x8=x9=x10=13时,
x7取得最大值为13.
故选:C.
【点评】本题考查百分位数的求法,考查分析问题与解决问题的能力,属难题.
2.(2025 武汉模拟)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分,得到如图所示的统计表格,则下列结论不正确的是(  )
评委编号 模型名称 1 2 3 4 5 6
甲 7.0 9.3 8.3 9.2 8.9 8.9
乙 8.1 9.1 8.5 8.6 8.7 8.6
A.甲得分的平均数大于乙得分的平均数
B.甲得分的众数大于乙得分的众数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
【考点】平均数;中位数;众数;方差.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】A
【分析】根据平均数、众数、中位数和方差的定义求解.
【解答】解:对于A,甲得分的平均数为8.6,乙得分的平均数为8.6,
所以甲得分的平均数等于乙得分的平均数,故A错误;
对于B,甲得分的众数为8.9,乙得分的众数为8.6,
所以甲得分的众数大于乙得分的众数,故B正确;
对于C,甲得分从小到大排列为:7.0,8.3,8.9,8.9,9.2,9.3,
所以甲得分的中位数为8.9,
乙得分从小到大排列为:8.1,8.5,8.6,8.6,8.7,9.1,
所以甲得分的中位数为8.6,
所以甲得分的中位数大于乙得分的中位数,故C正确;
对于D,甲得分的方差为[(7.0﹣8.6)2+(9.3﹣8.6)2+(8.3﹣8.6)2+(9.2﹣8.6)2+(8.9﹣8.6)2+(8.9﹣8.6)2]≈0.613,
乙得分的方差为[(8.1﹣8.6)2+(9.1﹣8.6)2+(8.5﹣8.6)2+(8.6﹣8.6)2+(8.7﹣8.6)2+(8.6﹣8.6)2]≈0.087,
所以甲得分的方差大于乙得分的方差,故D正确.
故选:A.
【点评】本题主要考查了平均数、众数、中位数和方差的定义,属于基础题.
3.(2025春 道里区校级月考)为了了解高中学生每天的课后学习时间和他们的数学成绩排名的关系,某实验小组做了调查,得到一些数据如下表,已知学习时间x(单位:小时)与成绩名次y(单位:名)满足线性回归方程yx+a,则a的值为(  )
学习时间x 0.5 1.0 2.0 2.5 4.0
成绩排名y 20 14 10 8 y5
附加:76
A.19 B. C.20 D.
【考点】经验回归方程与经验回归直线.
【专题】计算题;方程思想;待定系数法;概率与统计;运算求解.
【答案】D
【分析】根据76求出y5,再根据()满足回归方程,求出a的值.
【解答】解:由已知得:0.5×20+1×14+2×10+2.5×8+4×y5=76,
解得y5=3,
所以(0.5+1+2+2.5+4)=2,(20+14+10+8+3)=11,
所以样本点中心为(2,11),代入回归直线方程得11,
解得a.
故选:D.
【点评】本题考查回归直线方程系数的求法及性质,属于中档题.
4.(2025 红桥区一模)在2023年某省普通高中学业水平考试(合格考)中,对全省所有考生的数学成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],90分以上为优秀,则下列说法中不正确的是(  )
A.该省考生数学成绩的中位数为75分
B.若要全省的合格考通过率达到96%,则合格分数线约为44分
C.从全体考生中随机抽取1000人,则其中得优秀考试约有100人
D.若同一组中数据用该组区间中间值作代表值,可得考试数学成绩的平均分约为70
【考点】频率分布直方图的应用.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】A
【分析】根据频率分布直方图计算中位数、平均分,由不合格率为4%求得合格线,利用优秀率估算抽取的1000人中的优秀从数,从而判断各选项.
【解答】解:因为前几组的频率依次为0.1,0.15,0.2,0.3,
所以中位数在[70,80]内,
所以中位数为71.67,所以A错;
要全省的合格考通过率达到96%,设合格分数线为y,则,y=44,B正确;
由频率分布直方图优秀的频率为0.1,因此人数为1000×0.1=100,C正确;
由频率分布直方图得平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,
考试数学成绩的平均分约为70,D正确.
故选:A.
【点评】本题考查频率分布直方图的综合应用,属中档题.
5.(2025 浦东新区模拟)研究变量x,y得到一组成对数据(xi,yi),i=1,2,…,n,先进行一次线性回归分析,接着增加一个数据(xn+1,yn+1),其中,再重新进行一次线性回归分析,则下列说法正确的是(  )
A.变量x与变量y的相关性变强
B.相关系数r的绝对值变小
C.线性回归方程不变
D.拟合误差Q变大
【考点】一元线性回归模型;样本相关系数.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】C
【分析】设变量x,y的平均数分别为,,分析可知,对于AB:根据相关系数的计算公式和性质分析判断;
对于CD:根据回归方程和拟合误差的性质分析判断.
【解答】解:设变量x,y的平均数分别为,,
则,,即,
可知新数据的样本中心点不变,仍为(,),
对于AB:可得(xn+1)2,
同理可得,

则相关系数,
可知相关系数r的值不变,变量x与变量y的相关性不变,故AB错误;
对于C:因为,
且线性回归方程过样本中心点(,),即,均不变,所以线性回归方程yx不变,故C正确;
因为(xn+1,yn+1)即为样本中心点,即yn+1,
可知残差平方和不变,所以拟合误差Q不变,故D错误.
故选:C.
【点评】本题考查了线性回归模型,属于中档题.
6.(2024秋 辽宁期中)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程,那么下列说法正确的是(  )
A.若相关系数r越小,则两组变量的相关性越弱
B.若越大,则两组变量的相关性越强
C.经验回归方程至少经过样本数据(x1,y1),(x2,y2),…,(xn,yn)中的一个
D.在经验回归方程中,当解释变量x每增加1个单位时,相应的观测值y约增加个单位
【考点】经验回归方程与经验回归直线;样本相关系数.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】D
【分析】根据相关系数的含义可判断AB;根据回归直线的含义可判断CD.
【解答】解:对于A,若相关系数|r|越小,则两组变量的相关性越弱,A错误;
对于B,因为是回归直线的斜率,它不反应两变量的相关性强弱,B错误;
对于C,经验回归方程必过样本点中心,但不一定过样本点,C错误;
对于D,在经验回归方程中,当解释变量x每增加1个单位时,
若,相应的观测值y约增加个单位;若,相应的观测值y约增加个单位;
故当解释变量x每增加1个单位时,相应的观测值y约增加个单位,D正确.
故选:D.
【点评】本题考查线性回归分析的应用,属中档题.
7.(2024春 寿光市期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是(  )
男生 女生
篮球迷 30 15
非篮球迷 45 10
附:,
P(χ2≥k) 0.10 0.05 0.01
k 2.706 3.841 6.635
A.没有95%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关
【考点】独立性检验.
【专题】计算题;转化思想;综合法;概率与统计;运算求解.
【答案】A
【分析】根据列联表运用公式χ2求出χ2值,同临界值表进行比较,得到假设不合理的程度.
【解答】解:根据题目中的列联表数据,
男生 女生 合计
篮球迷 30 15 45
非篮球迷 45 10 55
合计 75 25 100
得到χ23.030<3.841.
所以,没有95%的把握认为是否是篮球迷与性别有关.
故选:A.
【点评】本题是一个独立性检验,我们可以利用临界值的大小来决定是否拒绝原来的统计假设,若值较大就拒绝假设,即拒绝两个事件无关,是中档题.
8.(2024秋 忻城县校级期中)已知数据x1,x2,x3,…,x10,满足xi﹣xi﹣1=1(2≤i≤10),若去掉x1,x10后组成一组新数据,则新数据与原数据相比,下列说法正确的是(  )
A.若x1=1,则数据x1,x2,x3,…,x10的第75百分位数为7.5
B.平均数变小
C.方差不变
D.中位数不变
【考点】百分位数;平均数;中位数.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】D
【分析】利用中位数、百分位数、平均数和方差的定义分析计算即可.
【解答】解:因为数据x1,x2,x3,…,x10,满足xi﹣xi﹣1=1(2≤i≤10),
所以当x1=1时,数据为:1,2,3,4,5,6,7,8,9,10,
因为10×75%=7.5,所以该组数据的第75百分位数是8,所以A错误;
由于xi﹣xi﹣1=1(2≤i≤10),故x2=x1+1,x3=x1+2,…,x9=x1+8,x10=x1+9,
原来的平均数为,
去掉x1,x10后的平均数为,平均数不变,故B错误;
原来的方差为,
去掉x1,x10后的方差为,方差变小,故C错误;
原来的中位数与现在的中位数均为,故中位数不变,故D正确.
故选:D.
【点评】本题考查百分位数的求解,平均数与方程的概念,属中档题.
二.多选题(共4小题)
(多选)9.(2025 揭阳模拟)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:cm)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是(  )
A.基地牡丹植株高度的极差的估计值大于50
B.基地牡丹植株高度不高于70的频率估计值为30%
C.基地牡丹植株高度的众数与中位数的估计值相等
D.基地牡丹植株高度的第75百分位数的估计值小于80
【考点】百分位数;中位数;极差.
【专题】对应思想;定义法;概率与统计;运算求解.
【答案】BC
【分析】根据频率分布直方图以及极差,频率,中位数,众数,以及百分位数定义可解.
【解答】解:根据题意,最高值为100,最低值为50,则极差小于或等于50,故A错误;
基地牡丹植株高度不高于70的频率估计值为0.01×10+0.02×10=0.3,故B正确;
牡丹植株高度的众数为75,根据图表可得,[50,60)的频率为0.1,[60,70)的频率为0.2,[70,80)的频率为0.4,
0.1+0.2+0.4=0.7>0.5,
设中位数为x,则(x﹣70)×0.04=0.5﹣0.1﹣0.2=0.2,则x=75,故众数等于中位数,故C正确;
设第75百分位数为m,又[50,60)的频率为0.1,[60,70)的频率为0.2,[70,80)的频率为0.4,[80,90)的频率为0.25,
则0.7+(m﹣80)×0.025=0.75,则m=82>80,故D错误.
故选:BC.
【点评】本题考查频率分布直方图以及极差,频率,中位数,众数,以及百分位数定义,属于中档题.
(多选)10.(2025 江苏模拟)为了解某地家村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中正确的是(  )
A.估计该地农户家庭年收入的平均值不超过6.5万元
B.估计该地有一半以上的农户.其家庭年收入介于4.5万元至8.5万元之间
C.若用分行抽样的方法在该地农户家庭年收入在[2.5,3.5],[6.5,7.5],[12.5,13.5]三组中共抽取48个家庭进行初步访谈,则年收入在[6.5,7.5]的家庭应抽24人
D.从抽样的12组中的每组中抽出一个数据,得到12个家庭的具体收入数据x1,x2, ,x12,若数据a与这12个家庭的收入数据的差的平方和最小,则数据a必为这12个家庭收入数据的平均数
【考点】频率分布直方图的应用.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】BD
【分析】根据频率分布直方图的性质,结合平均数的概念,分层抽样的概念,最小二乘法原理,逐一判断即可.
【解答】解:估计该地农户家庭年收入的平均值为:
3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02=7.68>6.5,
所以A选项错误;
因为家庭年收入介于4.5万元至8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64>0.5,
所以估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,所以B选项正确;
因为[2.5,3.5],[6.5,7.5],[12.5,13.5]三组的频率之比为0.02:0.2:0.02=4:40:4,
所以若用分行抽样的方法在该地农户家庭年收入在[2.5,3.5],[6.5,7.5],[12.5,13.5]三组中共抽取48个家庭进行初步访谈,
则年收入在[6.5,7.5]的家庭应抽40人,所以C选项错误;
根据线性回归分析中最小二乘法原理,
可得若数据a与这12个家庭的收入数据的差的平方和最小,则数据a必为这12个家庭收入数据的平均数,所以D选项正确.
故选:BD.
【点评】本题考查频率分布直方图的综合应用,属中档题.
(多选)11.(2025 温江区模拟)下列命题正确的是(  )
A.对于随机事件A与B,P(A)>0,P(B)>0,若P(A|B)=P(A),则事件A与B相互独立
B.若经验回归方程为0.3x+0.2,则样本中心点为(3,1)
C.数据2,7,9,11,13,12,5,7,9,11,13,15的75%分位数为12
D.随机变量X~B(6,0.5),当P(X=k)最大,则k的取值为3
【考点】经验回归方程与经验回归直线;n重伯努利试验与二项分布;二项分布的均值(数学期望)与方差;百分位数.
【专题】对应思想;定义法;概率与统计;运算求解.
【答案】AD
【分析】对于A,利用条件概率以及相互独立事件概率相关知识可解;
对于B,根据线性回归方程知识可解;
对于C,根据百分位数定义可解;
对于D,根据二项分布知识可解.
【解答】解:对于A,对于随机事件A与B,P(A)>0,P(B)>0,若P(A|B)=P(A),
又P(A|B)P(A),即P(AB)=P(A)P(B),
则事件A与B相互独立,则A正确;
对于B,若经验回归方程为0.3x+0.2,若x=3,则y=1.1,则B错误;
对于C,数据排序为:2,5,7,7,9,9,11,11,12,13,13,15(共12个),
75%分位数位置为0.75×12=9,对应位置为第9个与第10个的平均值,即,故C错误;
对于D,随机变量X~B(6,0.5),则P(X=k),
则当k=3时,P(X=3)最大,故D正确.
故选:AD.
【点评】本题考查条件概率以及相互独立事件,线性回归方程,百分位数定义以及二项分布知识,属于中档题.
(多选)12.(2025 泉州模拟)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了100个称重(单位:kg),并整理数据,得到如图频率分布直方图.根据此频率分布直方图,下面结论正确的是(  )
A.m=0.1
B.估计该哈密瓜的质量不低于1.6kg的比例为30%
C.估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间
D.估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间
【考点】频率分布直方图的应用.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】BCD
【分析】根据频率分布直方图有所有频率之和为1即可求得m,根据质量不低于1.6kg的频率之和即可判断B,
求出哈密瓜的质量介于1.4kg至1.6kg之间的频率即可判断C,计算中位数即可判断D.
【解答】解:对A选项:根据题意可得(0.5+2m+2+2.5+3)×0.1=1,解得m=1,所以A选项错误;
对B选项:估计该哈密瓜的质量不低于1.6kg的比例为(2+1)×0.1×100%=30%,所以B选项正确;
对C选项:因为(3+2.5)×0.1=0.55>0.5,
所以估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间,所以C选项正确;
对D选项:因为前几组的频率依次为0.05,0.1,0.3,0.25,
所以该哈密瓜的质量的中位数在[1.5,1.6)内,且为1.52,
所以估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间,所以D选项正确.
故选:BCD.
【点评】本题考查频率分布直方图的综合应用,属中档题.
三.填空题(共4小题)
13.(2025春 河南月考)在对某中学高三年级学生体重(单位:kg)的调查中,按男、女生人数比例用分层随机抽样的方法抽取部分学生进行测量,已知抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,则估计该校高三年级学生体重的方差为  36  .
【考点】方差;由分层随机抽样的样本平均数估计总体平均数.
【专题】计算题;方程思想;转化思想;综合法;概率与统计;运算求解.
【答案】36.
【分析】根据题意,先求出总体的平均数,进而由总体方差公式计算可得答案.
【解答】解:根据题意,抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,
则总体的平均数50,
则该校高三年级学生体重的方差S2[20+(54﹣50)2][11+(45﹣50)2]=36.
故答案为:36.
【点评】本题考查总体方差的计算,注意总体方差的计算公式,属于基础题.
14.(2024春 大武口区校级期中)红铃虫(Pectinophoragossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度x(℃)的8组观测数据,制成图1所示的散点图.现用两种模型①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
25 2.9 646 168 422688 50.4 70308
表中zi=lnyi;;;;
(1)根据残差图,比较模型①、②的拟合效果,模型  ①  比较合适?
(2)根据(1)中所选择的模型,求出y关于x的回归方程    .
附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线的斜率和截距的最小二乘估计分别为,.
【考点】残差及残差图.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】(1)选模型①比较合适;
(2).
【分析】(1)根据残差图判断即可;
(2)令z=lny则,利用参考数据求出b,a的值,进而得到产卵数y关于温度x的回归方程.
【解答】解:(1)应该选择模型①.由于模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②的带状宽度窄,
所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适;
(2)令z=lny,z与温度x可以用线性回归方程来拟合,则,
所以,
所以ab2.89﹣0.3×25=﹣4.61,
即z关于x的线性回归方程为.于是有lny=0.29x﹣4.61,
所以产卵数y关于温度x的回归方程为.
故答案为:①;.
【点评】本题主要考查了经验回归方程的求解,考查了残差图的应用,属于中档题.
15.(2024 吕梁一模)某市2018年至2022年新能源汽车年销量y(单位:百台)与年份代号x的数据如下表:
年份 2018 2019 2020 2021 2022
年份代号x 0 1 2 3 4
年销量y 10 15 20 30 35
若根据表中的数据用最小二乘法求得y关于x的回归直线方程为6.5x,据此计算相应于样本点(1,15)的残差为  ﹣0.5  .
【考点】经验回归方程与经验回归直线.
【专题】综合题;整体思想;综合法;概率与统计;逻辑思维.
【答案】﹣0.5.
【分析】首先计算和,并代入回归直线方程求,并求x=1的估计值,根据残差的定义,即可求解.
【解答】解:依题意,,,
代入回归直线,解得,
所以回归直线为,
当x=1时,,因此残差为15﹣15.5=﹣0.5.
故答案为:﹣0.5.
【点评】本题主要考查线性回归方程的应用,属于中档题.
16.(2023 浦东新区三模)已知一组成对数据(18,24),(13,34),(10,38),(﹣1,m)的回归方程为y=﹣2x+59.5,则该组数据的相关系数r= ﹣0.998  (精确到0.001).
【考点】经验回归方程与经验回归直线;样本相关系数.
【专题】对应思想;分析法;概率与统计;运算求解.
【答案】﹣0.998.
【分析】一组成对数据的平均值(,)一定在回归方程上,可求得m,再利用相关系数r的计算公式算出即可.
【解答】解:由条件可得,(18+13+10﹣1)=10,(24+34+38+m)=24m,
(,)一定在回归方程y=﹣2x+59.5上,代入解得m=62,
故,
xiyi=1192,xi =594,yi =7020,
∴r0.998.
故答案为:﹣0.998.
【点评】本题考查相关系数的应用,属于中档题.
四.解答题(共4小题)
17.(2025春 萍乡期中)某高中开设“四季农耕”的劳动教育课程,课程包括播种和田间管理.学校对选择了这两类课程的学生人数分布进行了统计,相关数据记录在如表格中,但其中有几项缺失,已知有的男生选择了播种课,统计表格如下.
课程 性别 合计
男生 女生
播种 160
田间管理 120
合计 400
(1)补全表格,并判断是否有99.9%的把握认为不同劳动教育课程的选择与性别有关;
(2)学校为了调研学生课程完成率是否存在与平均完成率偏差过大的情况,需计算偏差系数w(n),现给出以下两种数据处理方式:①,②,已知随机调查了6名同学课程的完成率如表,用两种处理方式分别计算学生任务完成率的偏差系数w(n),并指出哪一种数据处理方式对大偏差数据的存在体现更明显.(数据处理方式的偏差系数越大,对大偏差数据的存在体现越明显)
学生编号 1 2 3 4 5 6
完成率x% 50 70 60 66 72 84
附:.
P(x2≥k0) 0.1 0.05 0.01 0.001
k0 2.706 3.841 6.635 10.828
【考点】独立性检验.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】(1)完善表格如图,
课程 性别 合计
男生 女生
播种 160 80 240
田间管理 40 120 160
合计 200 200 400
有关;
(2),,方式②.
【分析】(1)设男生有x人,根据题意有,解得x=200,可补全表格,再根据卡方的计算可判断;
(2)先计算完成率的平均数,再根据①②公式计算比较即可.
【解答】解:(1)设男生有x人,
则,解得x=200,
所以选择田间管理课的男生人数为40,
从而女生有200人,女生中选择播种课的人数为80人,
完善表格如图,
课程 性别 合计
男生 女生
播种 160 80 240
田间管理 40 120 160
合计 200 200 400
零假设H0:不同劳动教育课程的选择与性别无关,
则,
依据小概率值α=0.001的独立性检验,我们推断H0不成立,
故有99.9%的把握认为不同劳动教育课程的选择与性别有关;
(2)由题意可知,,
根据①的计算公式计算:,
根据②的计算公式计算:,
因此方式②的偏差系数更大,从而方式②对大偏差数据的体现更加明显.
【点评】本题主要考查了独立性检验的应用,属于中档题.
18.(2025春 临川区校级期中)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第80百分位数;
(2)已知落在区间[50,60)的样本平均成绩是57,方差是7,落在区间[60,70)的样本平均成绩为66,方差是4,求两组样本成绩合并后的平均数和方差s2.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:m,x,;n,y,,记总的样本平均数为,样本方差为s2,则.
【考点】频率分布直方图的应用.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】(1)a=0.025;第80百分位数为86;(2)63;23.
【分析】(1)根据频率分布直方图的性质,建立方程求出a,在根据百分位数的求法,即可求解;
(2)根据加权平均数与方差的结论,即可求解.
【解答】解:(1)由题意知0.05+0.1+0.2+0.3+10a+0.1=1,解得a=0.025;
成绩在[40,80)的频率为0.65,成绩在[40,90)的频率为0.9,
所以第80百分位数在(80,90)内,且为86;
(2)由频率分布直方图知,这100份答卷分数在[50,60)的份数为100×0.1=10,
分数在[60,70)的份数为100×0.2=20,
所以63,

【点评】本题考查频率分布直方图的综合应用,属中档题.
19.(2025春 崂山区校级期中)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量x(单位:千辆)与年使用人次y(单位:千次)的数据如表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.
x 1 2 3 4 5 6 7
y 6 11 21 34 66 101 196
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型y=a+blgx或指数函数模型y=c dx(c>0,d>0)对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量x与年使用人次y的回归方程类型(给出判断即可,不必说明理由)?并求出y关于x的回归方程;
(2)公司为了测试共享电动车的性能,从所有同型号共享电动车中随机抽取100辆进行等距离骑行测试,骑行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的共享电动车占比30%.请根据统计数据完成2×2列联表,并根据小概率值α=0.01的独立性检验,能否认为共享电动车是否报废与保养有关?
保养 未保养 合计
报废 20
未报废
合计 60 100
参考数据:vi=lgy1,vi.
xiyi xivi 100.54
62.14 1.54 2535 50.12 3.47
参考公式:对于一组数据(x1,y1),(x2,y2),…(x ,y ),其回归直线的斜率和截距的最小二乘估计公式分别为:
,,χ2,其中n=a+b+c+d.
P(x2≥k) 0.25 0.1 0.05 0.025 0.01 0.001
k 1.323 2.706 3.841 5.024 6.635 10.828
【考点】一元线性回归模型;独立性检验.
【专题】应用题;整体思想;概率与统计;运算求解.
【答案】(1)y=c dx适宜,;
(2)是否报废与保养有关.
【分析】(1)根据散点图判断,y=c dx适宜;由y=c dx两边同时取对数得lgy=lgc+xlgd,设lgy=v,则v=lgc+xlgd,根据参考数据公式首先求出vx的回归直线方程进而求出结果;
(2)根据小概率值 α=0.01 的独立性检验,我们推断H0不成立,即认为是否报废与保养有关.
【解答】解:(1)由散点图判断,y=c dx适宜作为投放量x与年使用人次y的回归方程类型.
由y=c dx,两边同时取常用对数得lgy=lg(c dx)=lgc+xlgd,设lgy=v,则 v=lgc+xlgd.
因为,v=1.54,,,
所以.
把(4,1.54)代入,得lgc=0.54,所以=0.54+0.25x,
所以,则,
故y关于x的回归方程为;
(2)设零假设H0:是否报废与是否保养无关.由题意,报废电动车中保养过得共20×30% =6台,
未保养的电动车共 20﹣6=14台,补充2×2列联表如下:
1 保养 未保养 合计
报废 6 14 20
未报废 54 26 80
合计 60 40 100
则,
根据小概率值 α=0.01 的独立性检验,我们推断H0不成立,即认为是否报废与保养有关.
【点评】本题考查一元线性回归模型,属于中档题.
20.(2025春 北仑区校级期中)黔西一中为了提高学生对“黔西一中校史”的了解,举办了“知史爱校守初心”的知识竞赛活动,现从所有竞答试卷的卷面成绩中随机抽取100份作为样本数据,将样本答卷中分数x(40≤x≤100)的整数分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)求样本数据的第59百分位数;
(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数和总方差s2.
【考点】频率分布直方图的应用.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】(1)a=0.03;
(2)78;
(3)总平均数是60,总方差是36.
【分析】(1)由直方图中频率和为1求解;
(2)求出直方图中频率为0.59对应的分数;
(3)根据平均数和方差公式计算.
【解答】解:(1)根据题意可得10×(0.005+0.01+0.02+a+0.025+0.01)=1,解得a=0.03;
(2)因为前几组的频率依次为0.05,0.1,0.2,0.3,
所以第59百分位数在[70,80]内,设第59百分位数为x,
则,解得x=78;
(3)样本数据在区间[50,60]的个数为0.1×100=10,
在区间[60,70]上的个数为0.2×100=20,
所以,
总方差为.
【点评】本题考查频率分布直方图的综合应用,属中档题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)
同课章节目录