《直通名校》高考真题分类专题八 概率与统计(含解析)-高考数学大二轮专题复习

文档属性

名称 《直通名校》高考真题分类专题八 概率与统计(含解析)-高考数学大二轮专题复习
格式 docx
文件大小 195.9KB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2026-01-26 00:00:00

图片预览

文档简介

专题八 概率与统计
考点一 两个计数原理、排列与组合
1.(2022·新高考Ⅱ卷5题)甲、乙、丙、丁、戊5名同学站成一排参加文艺汇演,若甲不站在两端,丙和丁相邻,则不同的排列方式共有(  )
A.12种          B.24种
C.36种 D.48种
解析:B 先将丙和丁捆在一起有种排列方式,然后将其与乙、戊排列,有种排列方式,最后将甲插入中间两空,有种排列方式,所以不同的排列方式共有=24种,故选B.
2.(2023·全国甲卷9题)现有5名志愿者报名参加公益活动,在某一星期的星期六、星期日两天,每天从这5人中安排2人参加公益活动,则恰有1人在这两天都参加的不同安排方式共有(  )
A.120种 B.60种
C.30种 D.20种
解析:B 先从5人中选择1人两天均参加公益活动,有种方式;再从余下的4人中选2人分别安排到星期六、星期日,有种安排方式.所以不同的安排方式共有·=60(种).故选B.
3.(2023·新高考Ⅱ卷3题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有(  )
A.·种 B.·种
C.·种 D.·种
解析:D 由题意知,从初中部抽取学生的人数为60×=40,从高中部抽取学生的人数为60×=20.完成这件事情分两步:第一步,从初中部400名学生中抽取40名学生,有种方法;第二步,从高中部200名学生中抽取20名学生,有种方法.根据分步乘法计数原理,得共有·种不同的抽样结果.故选D.
4.(2023·新高考Ⅰ卷13题)某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有    种(用数字作答).
答案:64
解析:由题意,可分三类:第一类,体育类选修课和艺术类选修课各选修1门,有种方案;第二类,在体育类选修课中选修1门,在艺术类选修课中选修2门,有种方案;第三类,在体育类选修课中选修2门,在艺术类选修课中选修1门,有种方案.综上,不同的选课方案共有++=64(种).
考点二 二项式定理
5.(2020·全国Ⅰ卷8题)(x+y)5的展开式中x3y3的系数为(  )
A.5 B.10
C.15 D.20
解析:C 因为(x+y)5的展开式的第r+1项Tr+1=x5-ryr,所以(x+y)5的展开式中x3y3的系数为+=15.故选C.
6.(2020·全国Ⅲ卷14题)的展开式中常数项是240(用数字作答).
解析:展开式的通项Tr+1=(x2)6-r·=2rx12-3r,令12-3r=0,解得r=4,所以常数项为24=240.
7.(2022·新高考Ⅰ卷13题)(x+y)8的展开式中x2y6的系数为-28(用数字作答).
解析:(x+y)8展开式的通项Tr+1=x8-ryr,r=0,1,…,7,8.令r=6,得T6+1=x2y6,令r=5,得T5+1=x3y5,所以(x+y)8的展开式中x2y6的系数为-=-28.
8.(2024·全国甲卷13题)(+x)10的展开式中,各项系数中的最大值为 5
解析:(+x)10的展开式的通项公式为Tr+1=()10-rxr,则各项的系数分别为()10,()9,()8,()7,()6,()5,()4,()3,()2,()1,()0,观察发现二项式系数先增大后减小,且前后对称,指数式递增,分别计算()5,()4,()3,()2,()1,()0,比较可得,()2=5最大.
考点三 古典概型
9.(2022·新高考Ⅰ卷5题)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为(  )
A. B.
C. D.
解析:D 从7个整数中随机取2个不同的数,共有=21(种)取法,取得的2个数互质的情况有(2,3),(2,5),(2,7),(3,4),(3,5),(3,7),(3,8),(4,5),(4,7),(5,6),(5,7),(5,8),(6,7),(7,8),共14种,根据古典概型的概率公式,得这2个数互质的概率为=.故选D.
10.(2019·全国Ⅰ卷6题)我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“— —”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是(  )
A.   B. C.   D.
解析:A 在所有重卦中随机取一重卦,其基本事件总数n=26=64,恰有3个阳爻的基本事件数为=20,所以在所有重卦中随机取一重卦,该重卦恰有3个阳爻的概率P==.故选A.
11.(2024·全国甲卷16题)有6个相同的球,分别标有数字1,2,3,4,5,6,从中无放回地随机取3次,每次取1个球.设m为前两次取出的球上数字的平均值,n为取出的三个球上数字的平均值,则m与n之差的绝对值不大于的概率为.
解析:设3次取出的球上的数字依次为a,b,c,则无放回地随机取3次球的取法有=120(种),则|m-n|=|-|=||≤,可得|a+b-2c|≤3.当c=1时,a,b需要满足“1≤a+b≤5”,所有可能情况为(2,3),(3,2),共2种.当c=2时,a,b需要满足“1≤a+b≤7”,所有可能情况为(1,3),(1,4),(1,5),(1,6),(3,1),(4,1),(5,1),(6,1),(3,4),(4,3),共10种.当c=3时,a,b需要满足“3≤a+b≤9”,所有可能情况为(1,2),(2,1),(1,4),(4,1),(1,5),(5,1),(1,6),(6,1),(2,4),(4,2),(2,5),(5,2),(2,6),(6,2),(4,5),(5,4),共16种.当c=4时,a,b需要满足“5≤a+b≤11”,所有可能情况为(1,5),(5,1),(1,6),(6,1),(2,3),(3,2),(2,5),(5,2),(2,6),(6,2),(3,5),(5,3),(3,6),(6,3),(6,5),(5,6),共16种.当c=5时,a,b需要满足“7≤a+b≤13”,所有可能情况为(1,6),(6,1),(2,6),(6,2),(3,4),(4,3),(3,6),(6,3),(4,6),(6,4),共10种.当c=6时,a,b需要满足“9≤a+b≤15”,所有可能情况为(4,5),(5,4),共2种.故共有2+10+16+16+10+2=56(种)可能情况,所以所求概率P==.
考点四 条件概率与全概率公式、相互独立事件
12.(2023·全国甲卷6题)某地的中学生中有60%的同学爱好滑冰,50%的同学爱好滑雪,70%的同学爱好滑冰或爱好滑雪.在该地的中学生中随机调查一位同学,若该同学爱好滑雪,则该同学也爱好滑冰的概率为(  )
A.0.8 B.0.6
C.0.5 D.0.4
解析:A 法一 如图,左圆表示爱好滑冰的学生所占比例,右圆表示爱好滑雪的学生所占比例,A表示爱好滑冰且不爱好滑雪的学生所占比例,B表示既爱好滑冰又爱好滑雪的学生所占比例,C表示爱好滑雪且不爱好滑冰的学生所占比例,则0.6+0.5-B=0.7,所以B=0.4,C=0.5-0.4=0.1.所以若该学生爱好滑雪,则他也爱好滑冰的概率为==0.8,故选A.
法二 令事件A,B分别表示该学生爱好滑冰、该学生爱好滑雪,事件C表示该学生爱好滑雪的条件下也爱好滑冰,则P(A)=0.6,P(B)=0.5,P(AB)=P(A)+P(B)-0.7=0.4,所以P(C)=P(A|B)===0.8,故选A.
13.(多选)(2023·新高考Ⅱ卷12题)在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为α(0<α<1),收到0的概率为1-α;发送1时,收到0的概率为β(0<β<1),收到1的概率为1-β.考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次;三次传输是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1)(  )
A.采用单次传输方案,若依次发送1,0,1,则依次收到1,0,1的概率为(1-α)(1-β)2
B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为β(1-β)2
C.采用三次传输方案,若发送1,则译码为1的概率为β(1-β)2+(1-β)3
D.当0<α<0.5时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率
解析:ABD 对于A,因为信号的传输是相互独立的,所以采用单次传输方案依次发送1,0,1,依次收到1,0,1的概率p=(1-β)(1-α)(1-β)=(1-α)(1-β)2,则A正确;对于B,因为信号的传输是相互独立的,所以采用三次传输方案发送1,即发送3次1,依次收到1,0,1的概率p=(1-β)·β(1-β)=β(1-β)2,则B正确;对于C,因为信号的传输是相互独立的,所以采用三次传输方案发送1,译码为1包含两种情况:2次收到1,3次都收到1.而这两种情况是互斥的,所以采用三次传输方案发送1,收到译码为1的概率p=(1-β)2β+(1-β)3=3β(1-β)2+(1-β)3,则C错误;对于D,设“采用单次传输方案发送0,译码为0”为事件B,则P(B)=1-α.设采用三次传输方案发送0,收到的信号为0的次数为X,则P(X≥2)=P(X=2)+P(X=3)=(1-α)2α+(1-α)3=(1+2α)(1-α)2.又当0<α<0.5时,P(X≥2)-P(B)=(1+2α)(1-α)2-(1-α)=α(1-α)(1-2α)>0,所以采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率,则D正确.故选A、B、D.
14.(2022·新高考Ⅱ卷19题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1).
解:(1)估计该地区这种疾病患者的平均年龄=10×(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)=47.9.
(2)由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,且相互独立,
所以所求概率P=1-(0.001+0.002+0.006+0.002)×10=0.89.
(3)设从该地区任选一人,年龄位于区间[40,50)为事件A,患这种疾病为事件B,则P(A)=16%,
由频率分布直方图知这种疾病患者年龄位于区间[40,50)的概率为0.023×10=0.23,
结合该地区这种疾病的患病率为0.1%,可得P(AB)=0.1%×0.23=0.000 23,
所以从该地区任选一人,若年龄位于区间[40,50),则此人患这种疾病的概率为P(B|A)==≈0.001 4.
15.(2022·新高考Ⅰ卷20题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
①证明:R=·;
②利用该调查数据,给出P(A|B),P(A|)的估计值,并利用①的结果给出R的估计值.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
解:(1)K2==24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)①证明:R==,
由题意知,证明=即可,
左边==,
右边==.
左边=右边,故R=·.
②由调查数据可知P(A|B)==,P(A|)==,
且P(|B)=1-P(A|B)=,P(|)=1-P(A|)=,
所以R=×=6.
考点五 离散型随机变量及其分布列、均值与方差
16.(2020·全国Ⅲ卷3题)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且pi=1,则下面四种情形中,对应样本的标准差最大的一组是(  )
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
解析:B 对于A,当p1=p4=0.1,p2=p3=0.4时,随机变量X1的分布列为
X1 1 2 3 4
P 0.1 0.4 0.4 0.1
E(X1)=1×0.1+2×0.4+3×0.4+4×0.1=2.5,D(X1)=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=1.52×0.1+0.52×0.4+0.52×0.4+1.52×0.1=0.65,所以 =.
对于B,当p1=p4=0.4,p2=p3=0.1时,随机变量X2的分布列为
X2 1 2 3 4
P 0.4 0.1 0.1 0.4
E(X2)=1×0.4+2×0.1+3×0.1+4×0.4=2.5,D(X2)=(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.52×0.4+0.52×0.1+0.52×0.1+1.52×0.4=1.85.所以=.
对于C,当p1=p4=0.2,p2=p3=0.3时,随机变量X3的分布列为
X3 1 2 3 4
P 0.2 0.3 0.3 0.2
E(X3)=1×0.2+2×0.3+3×0.3+4×0.2=2.5,D(X3)=(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.52×0.2+0.52×0.3+0.52×0.3+1.52×0.2=1.05,所以 =.
对于D,当p1=p4=0.3,p2=p3=0.2时,随机变量X4的分布列为
X4 1 2 3 4
P 0.3 0.2 0.2 0.3
E(X4)=1×0.3+2×0.2+3×0.2+4×0.3=2.5,D(X4)=(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.52×0.3+0.52×0.2+0.52×0.2+1.52×0.3=1.45.所以=.所以B中的标准差最大.
17.(2021·新高考Ⅰ卷18题)某学校组织“一带一路”知识竞赛,有A,B两类问题.每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分.
已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
解:(1)由题意得,X的所有可能取值为0,20,100,
P(X=0)=1-0.8=0.2,
P(X=20)=0.8×(1-0.6)=0.32,
P(X=100)=0.8×0.6=0.48,
所以X的分布列为
X 0 20 100
P 0.2 0.32 0.48
(2)当小明先回答A类问题时,由(1)可得E(X)=0×0.2+20×0.32+100×0.48=54.4.
当小明先回答B类问题时,记Y为小明的累计得分,
则Y的所有可能取值为0,80,100,
P(Y=0)=1-0.6=0.4,
P(Y=80)=0.6×(1-0.8)=0.12,
P(Y=100)=0.6×0.8=0.48,
所以Y的分布列为
Y 0 80 100
P 0.4 0.12 0.48
E(Y)=0×0.4+80×0.12+100×0.48=57.6.
因为57.6>54.4,即E(Y)>E(X),所以为使累计得分的期望最大,小明应选择先回答B类问题.
18.(2022·北京高考18题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到9.50 m以上(含9.50 m)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望EX;
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
解:(1)设甲在校运动会铅球比赛中获得优秀奖为事件A.
因为比赛成绩达到9.50 m以上(含9.50 m)的同学将获得优秀奖,甲以往的10次比赛成绩中达到9.50 m以上(含9.50 m)的有9.80 m,9.70 m,9.55 m,9.54 m,共4次,
所以甲在校运动会铅球比赛中获得优秀奖的概率P(A)=0.4.
(2)X的所有可能取值为0,1,2,3.
由(1)知,甲在校运动会铅球比赛中获得优秀奖的概率P(A)=0.4.
设乙、丙在校运动会铅球比赛中获得优秀奖分别为事件B,C,则P(B)=0.5,P(C)=0.5.
P(X=0)=(1-0.4)×(1-0.5)×(1-0.5)=0.15,
P(X=1)=0.4×(1-0.5)×(1-0.5)+(1-0.4)×0.5×(1-0.5)+(1-0.4)×(1-0.5)×0.5=0.4,
P(X=2)=0.4×0.5×(1-0.5)+0.4×(1-0.5)×0.5+(1-0.4)×0.5×0.5=0.35,
P(X=3)=0.4×0.5×0.5=0.1,
所以EX=0×0.15+1×0.4+2×0.35+3×0.1=1.4.
(3)在校运动会铅球比赛中,按以往比赛成绩的平均数、方差来看,甲获得冠军的概率估计值最大;按以往比赛的最好成绩来看,丙获得冠军的概率估计值最大.
考点六 二项分布与正态分布
19.(2022·新高考Ⅱ卷13题)已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=0.14.
解析:因为X~N(2,σ2),所以P(X>2)=0.5,所以P(X>2.5)=P(X>2)-P(2<X≤2.5)=0.5-0.36=0.14.
20.(2017·全国Ⅰ卷19题)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=xi=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ<Z<μ+3σ)=0.997 4.0.997 416≈0.959 2,≈0.09.
解:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望为E(X)=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
考点七 总体分布的估计
21.(2024·新高考Ⅱ卷4题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900,950) [950,1 000) [1 000,1 050) [1 050,1 100) [1 100,1 150) [1 150,1 200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是(  )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
解析:C 对于A,根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg, 故A错误;对于B,亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为=66%,故B错误;对于C,稻田亩产量的极差最大为1 200-900=300,最小为1 150-950=200,故C正确;对于D,由频数分布表可得,平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.故选C.
22.(多选)(2021·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则(  )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
解析:CD 设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为+c,m+c,σ,t,因为c≠0,所以C、D正确,故选C、D.
23.(2023·全国乙卷17题)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5
伸缩率xi 545 533 551 522 575
伸缩率yi 536 527 543 530 560
试验序号i 6 7 8 9 10
伸缩率xi 544 541 568 596 548
伸缩率yi 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
解:(1)由题意,求出zi的值如表所示,
试验 序号i 1 2 3 4 5 6 7 8 9 10
zi 9 6 8 -8 15 11 19 18 20 12
则=×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)因为2=2=,=11=>,
所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
考点八 成对数据的统计分析
24.(2024·全国甲卷17题)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率,如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
解:(1)填写如下列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
则完整的2×2列联表如下:
优级品 非优级品 总计
甲车间 26 24 50
乙车间 70 30 100
总计 96 54 150
K2==4.687 5.
因为K2=4.687 5>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异;
因为K2=4.687 5<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题意可知==0.64,
又p+1.65=0.5+1.65×≈0.5+1.65×≈0.57,
所以>p+1.65,
所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
25.(2022·全国乙卷19题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,≈1.377.
解:(1)估计该林区这种树木平均一棵的根部横截面积===0.06,
估计该林区这种树木平均一棵的材积量===0.39.
(2)(xi-)(yi-)=xiyi-10=0.013 4,
(xi-)2=-10()2=0.002,
(yi-)2=-10()2=0.094 8,
所以==≈0.01×1.377=0.013 77,
所以样本相关系数r=≈≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=,
所以Y==1 209,即该林区这种树木的总材积量的估计值为1 209 m3.
考点九 概率与统计的综合问题
26.(2023·新高考Ⅱ卷19题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c).当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
解:(1)由题图知,(100-95)×0.002=1%>0.5%,所以95<c<100,
则p(c)=(c-95)×0.002=0.5%,所以c=97.5,
所以q(c)=0.01×2.5+0.002×5=3.5%.
(2)依题意,当c∈[95,100]时,f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82;
当c∈(100,105]时,f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98.
故f(c)=
所以f(c)在区间[95,105]的最小值为f(100)=0.02.
13 / 13
同课章节目录