【高考题型分类突破】专题13 统计 2025年高考数学二轮专题复习 学案(含答案)

文档属性

名称 【高考题型分类突破】专题13 统计 2025年高考数学二轮专题复习 学案(含答案)
格式 docx
文件大小 379.7KB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2024-12-14 21:33:32

图片预览

文档简介

专题十三 统计
【题型分析】
考情分析:
1.高考对本讲内容的考查往往以实际问题为背景,考查随机抽样、用样本估计总体以及变量的相关性,常以选择题、填空题的形式呈现,难度中等或偏下.
2.对回归分析、独立性检验的考查,多以解答题的形式出现,常与概率相结合,难度中等或偏上.
题型1 用样本估计总体
用样本的频率分布估计总体分布
例1 (改编)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区这种疾病患者年龄的众数和中位数.(结果保留一位小数)
方法总结:
频率分布直方图与众数、中位数和平均数的估计
(1)最高的小矩形底边中点的横坐标作为众数.
(2)中位数左边和右边的直方图的面积是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
(改编)在某市举行的一次高三期中联考中,共有2 000人参加了历史考试.为了了解本次考试学生的成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,如图所示.其中,成绩落在区间[50,60)内的人数为16.
(1)求样本容量n和图中x的值;
(2)估计该市全体学生历史成绩的平均数和中位数.
统计图表与数字特征
例2 (2024年新高考全国Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 频数
[900,950) 6
[950,1 000) 12
[1 000,1 050) 18
[1 050,1 100) 30
[1 100,1 150) 24
[1 150,1 200] 10
根据表中数据,下列结论正确的是(  ).
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
(改编)某科技攻关团队共有18人,他们的年龄分布如下表所示:
年龄/岁 26 28 30 32 36 40 45
人数 1 3 2 4 3 2 3
下列说法正确的是(  ).
A.这18人年龄的25%分位数为29岁
B.这18人年龄的80%分位数为40岁
C.这18人年龄的中位数为32岁
D.这18人年龄的众数是36岁
数字特征的应用
例3 (2023年全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高如果≥2,那么认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高.
方法总结:
处理此类问题的关键在于理解样本数据方差的意义和作用,学会计算样本的数字特征(如平均数、标准差),并作出合理的解释.
在一场文艺比赛中,10名专业人士和10名观众代表各组成一个评委小组给参赛选手打分,两组评委对同一名选手的打分情况如下:
小组A 45 48 46 52 47 49 55 42 51 45
小组B 55 36 70 66 75 49 68 42 62 47
(1)如果选择用方差度量两组评委打分的相似性,请计算两组评委打分的方差;
(2)据此判断小组A和小组B哪一个是由专业人士组成的.
题型2 成对数据的统计分析
相关系数
例4 (2022年全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数;(精确到0.01)
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,≈1.377.
方法总结:
判断相关关系的两种方法
①散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.
②计算相关系数r,|r|越接近1,说明两个变量之间的线性相关性越强;|r|越接近0,说明两个变量之间的线性相关性越弱.若两个变量具有线性相关关系,则可通过经验回归方程估计和预测变量的值.
经过多年的努力,我国新能源汽车产销量占全球的比重已超过60%,中国成为世界第一大汽车出口国.某汽车城统计新能源汽车从某天开始连续的营业天数x与销售总量y(单位:辆),采集了一组共20对数据,并计算得到经验回归方程=0.65x+54.50,且在这组数据中,连续的营业天数x的方差=200,销售总量y的方差=90.
(1)求样本相关系数r,并说明y与x的相关性;(结果保留三位小数)
(2)在这组数据中,若连续的营业天数x满足=2.2×104,试推算销售总量y的平均数.
附:经验回归方程=x+,其中=,=-,样本相关系数r=,≈2.24.
一元回归模型与回归分析
例5 中国茶文化博大精深,已知茶水的口感与茶叶类型以及水温有关.经验表明,某种绿茶用85 ℃的水泡制,再等到茶水温度降至60 ℃时饮用,口感最佳.某学习研究小组通过测量,得到了下列表格中的数据(室温是20 ℃):
泡制时间x/min 0 1 2 3 4
水温y/℃ 85 79 74 71 65
ln(y-20) 4.2 4.1 4.0 3.9 3.8
(1)小组成员根据上面表格中的数据绘制散点图,并根据散点图分布情况,考虑到茶水温度降到室温(即20 ℃)就不能再降的事实,决定选择函数模型y=kcx+20(x≥0)来刻画.
①令z=ln(y-20),求出z关于x的经验回归方程;
②利用①的结论,求出y=kcx+20(x≥0,c>0)中的k与c.
(2)你认为该品种绿茶用85 ℃的水大约泡制多久后饮用,可以使得口感最佳
参考数据:log0.90.6≈4.8,≈0.9,≈66.7,≈0.6.
参考公式:=x+,=,=-.
方法总结:
1.求经验回归方程
(1)利用公式求,利用=-求,写出经验回归方程;
(2)经验回归方程的拟合效果可以利用样本相关系数r的绝对值判断,当|r|越接近1时,成对样本数据的线性相关程度越强,或利用决定系数R2判断,R2越大,拟合效果越好.
2.非线性经验回归方程转化为线性经验回归方程
(1)若y=a+b,设t=,则y=a+bt;
(2)若满足对数式y=a+bln x,设t=ln x,则y=a+bt;
(3)若满足指数式y=c1(c1>0),两边取对数得ln y=ln c1+c2x,设z=ln y,a=ln c1,b=c2,则z=a+bx.
为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.图1是该公司2015年至2024年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1~10分别对应年份2015—2024.
根据散点图,分别用模型①y=bx+a,②y=c+d作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到下表所示的一些统计量的值:
(xi-)2 (ti-)2 (yi-)·(xi-) (yi-)·(ti-)
75 2.25 82.5 4.5 120 28.35
表中ti=,=ti.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并说明理由.
(2)根据(1)中所选模型,
①求出y关于x的经验回归方程;
②设该科技公司的年利润L(单位:亿元)和年研发投入y(单位:亿元)满足L=(111.225-y)(x∈N*且x∈[1,20]),问该科技公司哪一年的年利润最大
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线=+x的斜率和截距的最小二乘估计分别为=,=-.
独立性检验
例6 (2024年上海卷)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29 000名学生中抽取580人,得到日均体育锻炼时长(单位:小时)与学业成绩的数据如下表所示:
学业成绩 日均体育锻炼时长/小时
[0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5]
优秀 5 44 42 3 1
不优秀 134 147 137 40 27
(1)该地区29 000名学生中日均体育锻炼时长不小于1小时的人数约为多少
(2)估计该地区初中学生日均体育锻炼的时长.(精确到0.1)
(3)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关
附:χ2=,其中n=a+b+c+d,P(χ2≥3.841)≈0.05.
方法总结:
1.在2×2列联表中,如果两个变量没有关系,则应满足|ad-bc|≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.
2.独立性检验的一般方法
(1)根据题目信息,完善列联表;
(2)提出零假设:假设两个变量独立,并给出在问题中的解释;
(3)根据列联表中的数据及计算公式,求出χ2的值;
(4)当χ2≥xα时,我们就推断H0不成立,即认为两个变量不独立,该推断犯错误的概率不超过α;当χ2(改编)为了检测A,B两种型号的抗甲流病毒疫苗的免疫效果,某医疗科研机构对100名志愿者注射A型号疫苗,对另外100名志愿者注射B型号疫苗,一个月后,检测这200名志愿者血液中是否产生抗体,统计结果如下表:
疫苗 抗体情况
有抗体 没有抗体
A型号疫苗 80 20
B型号疫苗 75 25
(1)根据小概率值α=0.1的独立性检验,能否认为A型号疫苗比B型号疫苗效果好
(2)志愿者中已产生抗体的不用接种第二针,没有产生抗体的志愿者需接种原型号抗甲流病毒疫苗第二针,在此前提下,第二针接种A型号疫苗后每人产生抗体的概率为,用样本频率估计概率,每名志愿者最多注射两针.现从注射A型号抗甲流病毒疫苗的志愿者中随机抽取1人,求该志愿者最多接种两针A型号疫苗产生抗体的概率.
附:χ2=(其中n=a+b+c+d).
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
【真题改编】
1.(2024年新高考全国Ⅱ卷,T4改编)某工厂的研发部门为测量一批新研发的零件质量,随机抽取了50个质量(单位:g)在[80,140]内的零件,得到各零件的质量(单位:g)并整理得下表:
质量 [80,90) [90,100) [100,110) [110,120) [120,130) [130,140]
频数 3 6 10 12 10 9
根据表中数据,下列结论正确的是(  ).
A.这50个零件的质量的75%分位数大于130 g
B.这50个零件的质量的众数介于100 g至110 g或120 g至130 g之间
C.这50个零件的质量的极差介于40 g至60 g之间
D.这50个零件的质量的平均值介于100 g至110 g之间
2.(2024年全国甲卷,理科T17改编)某工厂进行了生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)根据所给数据填写表格:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异 能否有99%的把握认为甲、乙两车间产品的优级品率存在差异
(2)已知升级改造前该工厂产品的优级品数X~B(n,p),其中优级品率p=0.5,方差为D(X),设为升级改造后抽取的n件产品的优级品率.若n(-p)>3,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了 (≈12.247,结果保留三位小数)
附:χ2=,n=a+b+c+d.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
【最新模拟】
(总分:100分 单选题每题5分,多选题每题6分,填空题每题5分,共68分;解答题共32分)
1.(改编)已知小唐4月17日~4月23日每天的运动时长(单位:min)统计数据如图所示,则(  ).
A.小唐这7天每天运动时长的平均数是80 min
B.小唐这7天每天运动时长的极差是54 min
C.小唐这7天每天运动时长的中位数是75 min
D.小唐这7天每天运动时长的第80百分位数是92 min
2.某保险公司为客户定制了A,B,C,D,E共5个险种,并对5个险种参保客户进行抽样调查,得到如下的统计图:
用该样本估计总体,以下说法正确的有(  ).
A.57岁及以上的参保人数最少
B.18~30岁人群参保总费用最少
C.C险种更受参保人青睐
D.31岁及以上的参保人群约占总参保人群的80%
3.(改编)变量x与y的成对样本数据的散点图如图所示,求得经验回归方程为y=b1x+a1,并对变量x,y进行线性相关检验,得到样本相关系数r1,则(  ).
A.b1>0 B.b1<0 C.a1<0 D.r1>0
4.为考察某种药物A对预防疾病B的效果,某机构进行了动物试验,得到如下列联表:
药物A 疾病B 合计
患病 未患病
服用 10 45 55
未服用 20 30 50
合计 30 75 105
由上述数据得出下列结论,其中结论正确的是(  ).
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
A.依据α=0.05的独立性检验,认为药物A对预防疾病B有效
B.依据α=0.1的独立性检验,认为药物A对预防疾病B无效
C.依据α=0.01的独立性检验,认为药物A对预防疾病B有效
D.依据α=0.005的独立性检验,认为药物A对预防疾病B有效
5.(改编)一组数据按从小到大的顺序排列为1,4,m,12,14,21,则该组数据的第75百分位数是(  ).
A.14 B.6 C.8 D.12
6.已知数据x1,x2,…,x5的平均数为4,方差为2,数据y1,y2,…,y5的平均数为2,方差为4,若将这两组数据混合形成一组新的数据,则新的这组数据的方差为(  ).
A.6 B.2 C.3 D.4
7.某地建立农业科技图书馆,供农民免费借阅.经过5年的调查统计,调查人员收集了该图书馆近5年的借阅数据,如下表:
年份 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5
年借阅量y/万册 4.9 5.1 5.5 5.7 5.8
根据上表,可得y关于x的经验回归方程为=0.24x+a,则下列说法正确的有(  ).
A.a=5
B.若根据数据作出散点图,则5个点中至少有1个点在经验回归直线上
C.y与x的样本相关系数r>0
D.2024年该图书馆的借阅量一定不少于6.12万册
8.记数据1,2,3,4,5的方差为,数据3,6,9,12,15的方差为,则=    .
9.(改编)2024年4月24日是第九个“中国航天日”,今年的主题是“极目楚天,共襄星汉”.某校组织学生参与航天知识竞答活动,一班8位同学的成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是    .(写出一个满足条件的m值即可)
10.某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,项目人员分别从不同地铁站点随机抽取1 000名市民对该项目进行评分,统计发现评分均在[40,100]内,把评分分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,并绘制频率分布直方图,如图所示.下列判断正确的是(  ).
A.图中a的值为0.025
B.该次满意度评分的平均数约为85分
C.该次满意度评分的众数约为85分
D.大约有34%的市民满意度评分在[60,80)内
11.某学习小组对一组数据(xi,yi)(i=1,2,3,…,7)进行回归分析,甲同学首先求出经验回归方程为=5x+4,样本点的中心为(2,m).乙同学对甲同学的计算过程进行检查,发现甲将数据(2,3)误输成(3,2),将这两个数据修正后得到经验回归方程为=kx+7,则实数k=(  ).
A. B. C. D.
12.已知我国某省的二、三、四线城市数量之比为1∶3∶6.今年3月份调查得知该省的二、三、四线城市房产均价为0.8万元/平方米,方差为11.其中三、四线城市的房产均价分别为1万元/平方米,0.5万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房产均价为    万元/平方米,二线城市房价的方差为    .
13.(17分)碳中和是指主体在一定时间内产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧化碳或温室气体排放量,实现正负抵消,达到相对“零排放”.如图,这是本世纪以来,某省的碳排放总量的年度数据散点图.该数据分为两段:2010年前该省致力于经济发展,没有有效控制碳排放;从2010年开始,该省通过各种举措有效控制了碳排放.用x表示年份代号,记2010年为x=0.用h表示2010年前的年度碳排放量,y表示2010年开始的年度碳排放量.
2011—2017年该省碳排放量年度统计表
年份 2011 2012 2013 2014 2015 2016 2017
年份代号x 1 2 3 4 5 6 7
年度碳排放量y/亿吨 2.54 2.635 2.72 2.80 2.885 3.00 3.09
(1)若h关于x的经验回归方程为=0.125x+2.425,据此估计若未采取措施,2017年该省的碳排放量,并结合表中数据,说明该省在控制碳排放的举措下减少了多少亿吨的碳排放量.
(2)根据=0.125x+2.425,设2011—2017年间各年碳排放减少量为zi(zi=-yi),建立z关于x的经验回归方程=x2+.
①根据=x2+,求表中y关于x的经验回归方程(精确到0.001);
②根据①所求的经验回归方程,估计该省的碳排放量在哪年达到峰值.
参考数据:=140,=4 676,zi=23.605,=0.115.
参考公式:=,=-.
14.(人教A版必修第二册P224T2改编)五名同学每人各掷一次骰子,分别记录每次骰子朝上一面的点数,下列选项中,可能出现点数6的是(  ).
A.中位数为3,众数为3
B.平均数为3,众数为4
C.平均数为3,中位数为3
D.平均数为2,方差为2.4
15.(15分)(原创)2023年3月29日,亚洲围棋锦标赛开幕式在北京举行.该比赛为亚洲地区目前规模最大、范围最广的洲级围棋赛事.为了解某中学的高一学生对此新闻事件的关注程度,从该校全体高一学生中随机抽取了200名学生进行调查,调查样本中有80名女生.根据样本的调查结果绘制的等高堆积条形图(阴影区域表示关注亚洲围棋锦标赛的部分),如图所示.
(1)完成下面的列联表,根据小概率值α=0.005的独立性检验,能否据此判断该中学高一年级学生对亚洲围棋锦标赛的关注程度与性别有关
关注 没关注 合计
男生
女生
合计
(2)从对比赛关注的学生中,按男女比例采用分层随机抽样的方法抽取8人参加该比赛开幕式的活动,并从8人中随机选出2人分别作为正、副领队,求所选出的正、副领队是一男一女的概率.
附:χ2=,其中n=a+b+c+d.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
参考答案
专题十三 统计
题型1 用样本估计总体
考向1 用样本的频率分布估计总体分布
例1
【解析】(1)估计平均年龄为(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).
(2)根据频率分布直方图,可估计众数为45.因为(0.001+0.002+0.012+0.017+0.023)×10>0.5,(0.001+0.002+0.012+0.017)×10<0.5,所以中位数位于区间[40,50)内,设中位数为x,则(0.001+0.002+0.012+0.017)×10+(x-40)×0.023=0.5,解得x≈47.8,所以估计中位数为47.8岁.
跟踪训练
【解析】(1)因为成绩落在区间[50,60)内的人数为16,所以样本容量n==100.由(0.016+x+0.040+0.010+0.004)×10=1,解得x=0.030.
(2)估计该市全体学生历史成绩的平均数为0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6(分),中位数为70+×10=71(分).
考向2 统计图表与数字特征
例2 C
【解析】对于A, 根据频数分布表可知, 6+12+18=36<50,所以亩产量的中位数不小于1 050 kg, 故A错误;
对于B,亩产量不低于1 100 kg的频数为24+10=34,所以亩产量低于1 100 kg的稻田占比为×100%=66%,故B错误;
对于C,稻田亩产量的极差最大为1 200-900=300(kg),最小为1 150-950=200(kg),故C正确;
对于D,由频数分布表可得,100块稻田亩产量的平均值约为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067(kg),故D错误.故选C.
跟踪训练 BC
【解析】对于A,由18×25%=4.5,可知这18人年龄的25%分位数为30,故A错误;
对于B,由18×80%=14.4,可知这18人年龄的80%分位数为40,故B正确;
对于C,这18人年龄的中位数是=32(岁),故C正确;
对于D,这18人年龄的众数是32岁,故D错误.
考向3 数字特征的应用
例3
【解析】(1)由题意,求出zi的值,如下表所示:
试验 序号i 1 2 3 4 5 6 7 8 9 10
zi 9 6 8 -8 15 11 19 18 20 12
则=×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)因为2=2=,=11=>,
所以可以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
跟踪训练
【解析】(1)记小组A的数据依次为x1,x2,…,x10,小组B的数据为y1,y2,…,y10,
由题意可得A组与B组的平均数分别为=xi=48,=yi=57,
两组的方差分别为=(xi-48)2=13.4,=(yi-57)2=155.4.
(2)由于专业人士打分更符合专业规则,所以他们打分的相似程度会更高,由(1)可知<,
根据方差越大,数据的波动越大,可知小组A更像是由专业人士组成的.
题型2 成对数据的统计分析
考向1 相关系数
例4
【解析】 (1)样本中10棵这种树木的根部横截面积的平均值==0.06(m2),
样本中10棵这种树木的材积量的平均值==0.39(m3),
据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.
(2)r=
=
=
=≈≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,
由树木的材积量与其根部横截面积近似成正比,
可得=,解得Y=1 209.
故可估计该林区这种树木的总材积量为1 209 m3.
跟踪训练
【解析】(1)依题意知,yi-=(xi-),则r==
=·=·=0.65×=≈0.971,
可以推断连续的营业天数x与销售总量y这两个变量正线性相关,且相关程度很强.
(2)=(xi-)2=(-2xi+)
=(-2xi+20)
=-=×22 000-
=1 100-=200,
显然>0,解得=30,因此=0.65+54.50=0.65×30+54.50=74,
所以销售总量y的平均数为74辆.
考向2 一元回归模型与回归分析
例5
【解析】(1)①设经验回归方程为=x+,由题意得=×(0+1+2+3+4)=2,=×(4.2+4.1+4.0+3.9+3.8)=4,
∴(xi-)(zi-)=(-2)×0.2+(-1)×0.1+0×0+1×(-0.1)+2×(-0.2)=-1,
∴(xi-)2=(-2)2+(-1)2+02+12+22=10,
则==-0.1,
=-=4+0.1×2=4.2,
则z关于x的经验回归方程为=-0.1x+4.2.
②由y=kcx+20(x≥0),得y-20=kcx(x≥0),
两边取对数得ln(y-20)=ln k+xln c,
利用①的结论得ln c=-0.1,ln k=4.2,
∴c=e-0.1≈0.9,k=e4.2≈66.7.
(2)由(1)得y=66.7×0.9x+20(x≥0),
令y=60,得x=log0.90.6≈4.8.
∴该品种绿茶用85 ℃的水泡制4.8 min后饮用,口感最佳.
跟踪训练
【解析】(1)根据题图2可知,模型①的残差波动性很大,说明拟合关系较差.
模型②的残差波动性相对较小,残差比较均匀地分布在横轴的附近,说明拟合关系很好,所以选择模型②更适宜.
(2)①设t=,则y=c+dt,
所以===6.3,=-=75-6.3×2.25=60.825,
所以y关于x的经验回归方程为y=60.825+6.3.
②由题设可得L=(111.225-y)=(111.225-6.3-60.825)=-6.3x+50.4,
当==4,即x=16时,年利润L的值最大,
故该科技公司2030年的年利润最大.
考向3 独立性检验
例6
【解析】(1)由表可知抽取的学生中日均体育锻炼时长不小于1小时的人数占比为=,则估计该地区29 000名学生中,日均体育锻炼时长不小于1小时的人数为29 000×=12 500.
(2)估计该地区初中学生的日均体育锻炼时长为××139+×191+×179+×43+×28≈0.9(小时).
(3)画出列联表如下:
学业成绩 日均体育锻炼时长 合计
[1,2) 其他
优秀 45 50 95
不优秀 177 308 485
合计 222 358 580
零假设为H0:学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时无关.
根据2×2列联表中的数据,经计算得到χ2=≈3.976>3.841.
根据小概率值α=0.05的独立检验,我们推断H0不成立,即有95%的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关.
跟踪训练
【解析】(1)零假设为H0:两种型号疫苗的效果没有差异.
根据表中数据,得χ2==≈0.717<2.706=x0.1,
根据小概率值α=0.1的独立性检验,推断H0成立,故不能认为A型号疫苗比B型号疫苗的效果好.
(2)设事件A1=“志愿者第一针接种A型号疫苗产生抗体”,事件A2=“志愿者第二针接种A型号疫苗产生抗体”,事件A=“志愿者最多两针接种A型号疫苗产生抗体”,所以P(A1)==,P(A2|)=,则P(A)=P(A1)+P()P(A2|)=+1-×=.
1.C
【解析】对于A,根据频数分布表可知,50-9=41>50×75%=37.5,故这50个零件的质量的75%分位数一定小于130 g,故A错误;
对于B,由于各区间段的零件具体的质量数据未知,故众数无法确定,故B错误;
对于C,这50个零件的质量的极差最大为140-80=60(g),最小为130-90=40(g),故这50个零件的质量的极差介于40 g至60 g之间,故C正确;
对于D,由频数分布表可得,这50个零件的质量的平均值约为×(3×85+6×95+10×105+12×115+10×125+9×135)=114.4(g),故D错误.故选C.
2.解析 (1)根据题意可得如下表格:
优级品 非优级品
甲车间 26 24
乙车间 70 30
可得χ2===4.687 5,
因为3.841<4.687 5<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲,乙两车间产品的优级品率存在差异.
(2)由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为=0.64,
用频率估计概率可得=0.64,又因为升级改造前该工厂产品的优级品率p=0.5,==≈6.124,而n(-p)=150×0.14=21,
可知21>3×6.124=18.372,即n(-p)>3,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
1.D
【解析】小唐这7天每天运动时长的平均数为=≠80(min),A错误;
小唐这7天每天运动时长的极差是100-45=55(min),B错误;
将小唐这7天每天运动的时长按照从小到大的顺序排列为45,58,60,70,80,92,100,则小唐这7天每天运动时长的中位数是70 min,C错误;
因为7×80%=5.6,所以第80百分位数是第6项数据,即92,D正确.
2.ACD
【解析】由扇形图可知,57岁及以上的参保人数最少,A正确;
由折线图可知,18~30岁人群人均参保费用最少,但是由扇形图知该年龄段参保人数并不是最少的,估算可知,18~30岁人群参保总费用不是最少的,B错误;
由条形图可知,C险种参保比例最高,C正确;
由扇形图可知,31岁及以上的参保人群约占总参保人群的80%,D正确.
3.B
【解析】由散点图可知,x与y负相关,则b1<0,r1<0,根据图形走势可判断a1>0.
4.A
【解析】依题意得χ2=≈6.109.
∵6.109>3.841=x0.05,∴依据α=0.05的独立性检验,认为药物A对预防疾病B有效,A正确;
∵6.109>2.706=x0.1,∴依据α=0.1的独立性检验,认为药物A对预防疾病B有效,B错误;
∵6.109<6.635=x0.01,∴依据α=0.01的独立性检验,认为药物A对预防疾病B无效,C错误;
∵6.109<7.879=x0.005,∴依据α=0.005的独立性检验,认为药物A对预防疾病B无效,D错误.
5.A
【解析】因为6×0.75=4.5,所以根据百分位数的定义,该组数据的第75百分位数是按从小到大的顺序排列的第5项数据,即14.
6.D
【解析】易知新的这组数据的平均数为=3,
所以这组新数据的方差s2=×[2+(4-3)2]+×[4+(2-3)2]=4.
7.C
【解析】由表可知=×(1+2+3+4+5)=3,=×(4.9+5.1+5.5+5.7+5.8)=5.4,所以a=-0.24=5.4-0.24×3=4.68,A错误;
由A得=0.24x+4.68,把x=1,2,3,4,5分别代入方程可得为4.92,5.16,5.4,5.64,5.88,对比数据可知B错误;
因为0.24>0,所以y与x的样本相关系数r>0,C正确;
根据经验回归方程得出的仅仅是预测值,所以无法确定2024年该图书馆的借阅量,D错误.
8.9
【解析】将数据1,2,3,4,5记为x1,x2,…,x5,数据3,6,9,12,15记为y1,y2,…,y5,则有yi=3xi(i=1,2,…,5),所以=9,即=9.
9.7(7,8,9,10中任意一个均可)
【解析】若去掉m,将该组数据按从小到大的顺序排列,可得6,7,7,8,8,9,10.因为7×0.25=1.75,所以新数据的第25百分位数为第二个数7,所以7,6,8,9,8,7,10,m的第25百分位数为7,而8×0.25=2,所以7为该组数据从小到大排列后的第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.
10.ACD
【解析】由频率分布直方图知0.035+0.020+0.014+0.004+0.002=0.075,由10×(0.075+a)=1,得a=0.025,A正确;
因为45×0.02+55×0.04+65×0.14+75×0.20+85×0.35+95×0.25=80.7,所以满意度的平均数约为80.7分,B错误;
由频率分布直方图可知众数估计为85分,C正确;
(0.014+0.020)×10=0.34,由样本估计总体可以认为约有34%的市民满意度评分在[60,80)内,D正确.
11.A
【解析】由题意可得m=5×2+4=14,即修正前的样本中心点为(2,14),
假设甲输入的(x1,y1)为(3,2),则3+x2+x3+…+x7=2×7=14,2+y2+y3+…+y7=7×14=98,得x2+x3+…+x7=11,y2+y3+…+y7=96,
在改为正确数据后,=×(2+11)=,=×(3+96)=,
所以修正后的样本中心点为,,
将点,的坐标代入经验回归方程=kx+7,可得=k+7,解得k=.
12.2 29.9
【解析】设二线城市房产均价为x万元/平方米,方差为y,因为二、三、四线城市数量之比为1∶3∶6,二、三、四线城市房产均价为0.8万元/平方米,三、四线城市的房产均价分别为1万元/平方米,0.5万元/平方米,
所以x+×1+×0.5=0.8,解得x=2,
由题意可得×[y+(2-0.8)2]+×[10+(1-0.8)2]+×[8+(0.5-0.8)2]=11,解得y=29.9.
13.解析 (1)由经验回归方程知,若未采取措施,2017年该省碳排放量的估计值=0.125×7+2.425=3.3(亿吨),由此估计减少的碳排放量为3.3-3.09=0.21(亿吨). 5分
(2)①设x2=t,则==20,=ti,
===≈0.004,
∴=-=0.115-20×≈0.035, 9分
∴=0.004x2+0.035,
∴=-=0.125x+2.425-0.004x2-0.035=-0.004x2+0.125x+2.39. 14分
②∵函数y=-0.004x2+0.125x+2.39的图象的对称轴为直线x==15.625,
∴估计在2026年该省的碳排放量达到峰值. 17分
14.AC
【解析】当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,A正确;
若平均数为3,且出现点数6,则其余4个数的和为9,而众数为4,故除6外其余4个数的和至少为11,所以不可能出现点数6,B错误;
当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,C正确;
若平均数为2,且出现点数6,则方差s2>×(6-2)2=3.2>2.4,所以当平均数为2,方差为2.4时,一定不会出现点数6,D错误.
15.解析 (1)由题意得,关注亚洲围棋锦标赛的男生有(200-80)×0.4=48(人),则不关注亚洲围棋锦标赛的男生有120-48=72(人);关注亚洲围棋锦标赛的女生有80×0.2=16(人),则不关注亚洲围棋锦标赛的女生有80-16=64(人). 3分
得到如下列联表:
关注 没关注 合计
男生 48 72 120
女生 16 64 80
合计 64 136 200
零假设为H0:该中学高一年级学生对亚洲围棋锦标赛的关注程度与性别无关.
根据列联表中的数据,经计算得到χ2=≈8.824>7.879=x0.005,
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为该中学高一年级学生对亚洲围棋锦标赛的关注程度与性别有关.
7分
(2)采用分层随机抽样的方法,从男生中抽取的人数为8×=6,从女生中抽取的人数为8×=2. 10分
故所求概率P===. 15分
同课章节目录