资源详情

2021届高考数学艺体生文化课总复习第十二章概率与统计课件（6份打包）

文档属性

名称	2021届高考数学艺体生文化课总复习第十二章概率与统计课件（6份打包）
格式	zip
文件大小	7.0MB
资源类型	教案
版本资源	通用版
科目	数学
更新时间	2021-03-10 08:57:21

点击下载

文档简介

(共25张PPT)
第十二章
概率与统计
第十二章测试　概率与统计
一、选择题
1.(2015广东)袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,
1个红球的概率为
(
)
2.小王通过英语听力测试的概率是,他连续测试3次,那么其中恰有1次获得通过的概率是
(　　)
3.(2019新课标Ⅱ卷,文理)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
(　　)
A.中位数
B.平均数
C.方差
D.极差
【答案】
A
【解析】
设9位评委评分按从小到大排列为x1≤x2≤x3≤x4…≤x8≤x9.
则①原始中位数为x5,去掉最低分x1,最高分x9,
后剩余x2≤x3≤x4…≤x8,
中位数仍为x5,故A正确.
4.某班有60名学生,一次考试后数学成绩分布满足ξ~N(110,102),若P(100≤ξ≤110)=0.35,则估计该班学生数学成绩在120分以上的人数为
(　　)
A.10
B.9
C.8
D.7
【答案】
B
【解析】
由已知,正态曲线的对称轴为ξ=110,
即P(110≤ξ≤120)=P(100≤ξ≤110)=0.35,
所以该班学生数学成绩在120分以上的人数为
(1-2×0.35)×60=9.故选B.
5.(2018广州模拟)为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是
(　　)
A.20
B.30
C.50
D.60
【答案】
D
【解析】
设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,
所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,
所以前3个小组的频数分别为5,15,25,所以n=
=60.故选D.
7.(2019新课标Ⅲ卷,4)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为
(　　)
A.0.5
B.0.6
C.0.7
D.0.8
【答案】
C
【解析】
由题意得,
阅读过《西游记》的学生人数为90-80+60=70,
则其与该校学生人数之比为70÷100=0.7.故选C.
8.(2020新课标Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10
℃至40
℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是
(　　)
A.y=a+bx
B.y=a+bx2
C.y=a+bex
D.y=a+blnx
【答案】
D
【解析】
由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率y和温度x的回归方程类型的是y=a+blnx.故选D.
9.(2020新课标Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且
pi=1,则下面四种情形中,对应样本的标准差最大的一组是
(　　)
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
【答案】
B　
【解析】对于A选项,该组数据的平均数为
=(1+4)×0.1+(2+3)×0.4=2.5,
方差为sA2=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×
0.1=0.65;
对于B选项,该组数据的平均数为
=(1+4)×0.4+(2+3)×0.1=2.5,
方差为sB2
=(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×
0.4=1.85;
对于C选项,该组数据的平均数为
=(1+4)×0.2+(2+3)×0.3=2.5,
方差为sC2
=(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×
0.2=1.05;
对于D选项,该组数据的平均数为
=(1+4)×0.3+(2+3)×0.2=2.5,
方差为sD2
=(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×
0.3=1.45.
因此,B选项这一组的标准差最大.故选B.
10.(多选)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.
已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论正确的是
(　　)
A.最低气温与最高气温都为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0
℃的月份有4个
【答案】
ABC
【解析】在A中,最低气温与最高气温都为正相关,故A正确;
在B中,10月的最高气温不低于5月的最高气温,故B正确;
在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;
在D中,最低气温低于0
℃的月份有3个,故D错误.
故选ABC.
二、填空题
11.设随机变量X的分布列如下表所示,则p4的值是　　　　　.?
X
1
2
3
4
P
p4
12.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差的平方和m如下表:
你认为甲、乙、丙、丁四位哪位同学的试验结果体现A、B两变量有更强的线性相关性
(从甲、乙、丙、丁中选一位)
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
【答案】
丁
【解析】
相关系数r越接近于1和残差平方和m越小,两变量A,B的线性相关性越强.故选丁.
13.(2019新课标Ⅱ卷,文理)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为　　　　　.?
【答案】
0.98
【解析】
由题意得,经停该高铁站的列车正点数约为10×0.97+20×0.98+10×0.99=39.2,
其中高铁个数为10+20+10=40,所以经停该站高铁列车所有车次的平均正点率约为
=0.98.
14.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)
现已知其线性回归方程为
=0.36x+
,则
=　　　　　,根据此线性回归方程估计数学得90分的同学的物理成绩为　　　　　.(四舍五入到整数)?
学生的编号i
1
2
3
4
5
数学成绩x
80
75
70
65
60
物理成绩y
70
66
68
64
62
三、解答题
15.某产品按行业生产标准分成8个等级,等级系数X依次为1,2,…,
8,其中X≥5为标准A,X≥3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件,假定甲、乙两厂的产品都符合相应的执行标准.
(1)已知甲厂产品的等级系数X1的概率分布列如表所示:
且X1的数学期望E(X1)=6,求a,b的值.
X1
5
6
7
8
P
0.4
a
b
0.1
(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
3　5　3　3　8　5　5　6　3　4
6　3　4　7　5　3　4　8　5　3
8　3　4　3　4　4　7　5　6　7
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望.
【解析】
(2)由已知得,样本的频率分布表如下:
用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的概率分布列如下:
所以E(X2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8.即乙厂产品的等级系数X2的数学期望为4.8.
X2
3
4
5
6
7
8
f
0.3
0.2
0.2
0.1
0.1
0.1
X2
3
4
5
6
7
8
P
0.3
0.2
0.2
0.1
0.1
0.1
(3)在(1),(2)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?说明理由.
【注】①产品的“性价比”=产品的等级系数的数学期望/产品的零售价;②“性价比”大的产品更具可购买性.
【解析】
(3)乙厂的产品更具可购买性.
理由如下:因为甲厂产品的等级系数的数学期望等于6,价格为6元/件,所以其性价比为
=1;
因为乙厂产品的等级系数的数学期望等于4.8,价格为4元/件,所以其性价比为
=1.2.据此,乙厂的产品更具可购买性.
16.(2018深圳二模)耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表:
绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的线性回归方程为
(1)求
,并估计当浇灌海水浓度为8‰时该品种的亩产量;
-0.02
0.02
0.01
0
-0.01
【解析】
(2)①由(1)知
=-0.08x+0.88,完成残差表如下:
(2)①完成下列残差表:
浓度(千分之)xi
3
4
5
6
7
亩产量yi(吨)
0.62
0.58
0.49
0.4
0.31
残差
②统计学中常用拟合指数R2来刻画回归效果,R2越大,模型拟合效果越好,如假设R2=0.8,就说明预报变量y的差异有80%是由解释变量x引起的.请计算拟合指数R2(精确到0.01),并指出亩产量的变化多大程度上是由浇灌海水浓度引起的?(共29张PPT)
第十二章
概率与统计
第1节
随机事件的概率、抽样方法
知识梳理
1.随机事件A的概率:
P(A)=
(N:基本事件总数;n:事件A包含的基本事件的个数).
2.古典概率P(A)=
,特性:等可能性和有限性.
3.抽样方法:
(1)简单随机抽样(包括随机数表法,抽签法).
(2)分层抽样(用于个体有明显差异时).
精选例题
【例1】
我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为
(
)
A.134石
B.169石
C.338石
D.1365石
【例2】
(2020天津卷)已知甲、乙两球落入盒子的概率分别为和
.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为
;甲、乙两球至少有一个落入盒子的概率为
.
专题训练
1.(2018新课标Ⅱ卷)从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为
(
)
A.0.6
B.0.5
C.0.4
D.0.3
【答案】
D　
【解析】
从5人中任选2人,共10种可能,选中两人都是女的共3种可能,所以概率为0.3.故选D.
2.(2019新课标Ⅰ卷,理)我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“
”和阴爻“
”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是
(
)
3.(2018新课标Ⅲ卷)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为
(
)
A.0.3
B.0.4
C.0.6
D.0.7
【答案】
B　
【解析】
不用现金支付的概率为P=1-0.45-0.15=0.4.故选B.
4.袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为
(
)
5.(2017新课标Ⅱ卷)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为
(
)
【答案】
D　
【解析】
如下表所示,表中的点横坐标表示第一次取到的数,纵坐标表示第二次取到的数.
总计有25种情况,满足条件的有10种,所以所求概率为
.故选D.
1
2
3
4
5
1
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
2
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
3
(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
4
(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
5
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
6.(2020新课标Ⅰ卷,山东)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是
(
)
A.62%
B.56%
C.46%
D.42%
【答案】
C　
【解析】
记“该中学学生喜欢足球”为事件A,“该中学学生喜欢游泳”为事件B,则“该中学学生喜欢足球或游泳”为事件A+B,“该中学学生既喜欢足球又喜欢游泳”为事件A·B,
则P(A)=0.6,P(B)=0.82,P(A+B)=0.96,
所以P(A·B)=P(A)+P(B)-P(A+B)=0.6+0.82-0.96=0.46,
所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选C.
7.(2020新课标Ⅱ卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者
(
)
A.10名
B.18名
C.24名
D.32名
【答案】
B　
【解析】
由题意,第二天新增订单数为500+1600-1200=900,
设需要志愿者x名,由
≥0.95,得x≥17.1,
故至少需要志愿者18名.故选B.
8.甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为
件.
【答案】
1800　
【解析】
分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件.在4800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为1800件.
9.(2013新课标)从1,2,3,4,5中任意取出两个不同的数,其和为5的概率是
(
)
10.(2018新课标Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是
(
)
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了
经济收入的一半
建设前经济收入构成比例
建设后经济收入构成比例
【答案】
A　
【解析】
由题意,可以假设原来收入为a,则新农村建设后的收入为2a,根据收入的构成比例,原来的种植收入为0.6a,新农村建设后的种植收入为2a·0.37=0.74a.明显比0.6a要大.所以不正确的是A.
11.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是
(
)
49
54
43
54
82
17
37
93
23
78
87
35
20
96
43
84
26
34
91
64
57
24
55
06
88
77
04
74
47
67
21
76
33
50
25
83
92
12
06
A.22
B.09
C.02
D.16
【答案】
D　
【解析】
从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17…故第4个志愿者的座号为16.故选D.
12.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为
(
)
A.200,20
B.100,20
C.200,10
D.100,10
图①
图②
【答案】
A　
【解析】
该地区中小学生总人数为3500+2000+4500=10000,
则样本容量为10000×2%=200,其中抽取的高中生近视人数为2000×2%×50%=20.故选A.
13.(2019新课标Ⅲ卷,文)两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是
(
)
【答案】
D　
【解析】
两位男同学和两位女同学排成一列,因为男生和女生人数相等,两位女生相邻与不相邻的排法种数相同,所以两位女生相邻与不相邻的概率均是
.故选D.
14.某商店试销某种商品20天,获得如下数据:
试销结束后(假设该商品的日销售量的分布规律不变),设某天开始营业时有该商品3件,当天营业结束后检查存货,若发现存货少于2件,则当天进货补充至3件,否则不进货,将频率视为概率.当天商店不进货的概率为
.
日销售量(件)
0
1
2
3
频数
1
5
9
5
15.《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出
钱(所得结果四舍五入,保留整数).
16.(2019天津,文)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.
(1)应从老、中、青员工中分别抽取多少人?
【解析】
(1)由已知,老、中、青员工人数之比为6∶9∶10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员中分别抽取6人,9人,10人.
(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如下表,其中“○”表示享受,“×”表示不享受.
现从这6人中随机抽取2人接受采访.
员工
项目
A
B
C
D
E
F
子女教育
○
○
×
○
×
○
继续教育
×
×
○
×
○
○
大病医疗
×
×
×
○
×
×
住房贷款利息
○
○
×
×
○
○
住房租金
×
×
○
×
×
×
赡养老人
○
○
×
×
×
○
①试用所给字母列举出所有可能的抽取结果;
②设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.
【解析】
(2)①从已知的6人中随机抽取2人的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{B,C},{B,D},{B,E},{B,F},{C,D},
{C,E},{C,F},{D,E},{D,F},{E,F}
共15种.
【解析】
(2)②由表格知,符合题意的所有可能结果为{A,B},
{A,D},{A,E},{A,F},{B,D},{B,E},{B,F},{C,E},{C,F},{D,F},{E,F}共11种.
所以,事件M发生的概率为P(M)=
.
17.(2017新课标Ⅲ卷,文)某超市计划按月订购一种酸奶,每天进货量相同,进货成本为每瓶4元,售价为每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得到下面的频数分布表:
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
【解析】
(1)需求量不超过300瓶,即最高气温不高于25℃,从表中可知有54天,所以所求概率为P=
.
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
【解析】
(2)最高气温低于20℃时,
Y=200×6+250×2-450×4=-100;
最高气温位于区间[20,25)时,Y=300×6+150×2-450×4=300;
最高气温不低于25℃时,Y=450×(6-4)=900;
∴Y的可能值列表如下:
∴Y大于零的概率为
=0.8.
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
Y
-100
-100
300
900
900
900
18.(2020新课标Ⅰ卷)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为
.
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.(共29张PPT)
第十二章
概率与统计
第2节
离散型随机变量的均值与方差
知识梳理
1.离散型随机变量
(1)随机变量
如果随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用字母X,Y,ξ,η表示.
(2)离散型随机变量
对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.
2.离散型随机变量的分布列
随机变量X可能取的值为x1,x2,…,xn,X取每一个值xi(i=1,2,…,n)的概率P(X=xi)=pi,则表
称为离散型随机变量X的概率分布列,简称X的分布列.
其中:①pi≥0(i=1,2,…,n);
②
pi=p1+p2+…+pn=1.
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
3.离散型随机变量的均值与方差
(1)均值(数学期望,简称期望)
称E(X)=
xipi=x1p1+x2p2+…+xnpn为随机变量X的均值或数学期望.它反映了离散型随机变量取值的平均水平.
(2)方差
称D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn为随机变量X的方差.它刻画了随机变量X与其均值E(X)的平均偏离程度.其中算术平方根
为随机变量X的标准差.
(3)性质
E(ax+b)=aE(x)+b
D(ax+b)=a2D(x)
D(x)=E(x2)-(E(x))2
4.两点分布
(1)若随机变量X的分布列为
则这样的分布列称为两点分布列.
(2)P(X=1)=p为成功概率.
(3)E(X)=p.
(4)D(X)=p(1-p).
X
0
1
P
1-p
p
5.超几何分布
在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件{X=k}发生的概率为:
P(X=k)=
,k=0,1,2,…,m,(其中m=min{M,n},n≤N,M≤N),则称分布列
为超几何分布列.
X
0
1
…
m
P
…
精选例题
【例2】　某食品集团生产的火腿按行业生产标准分成8个等级,等级系数X依次为1,2,3,…,8,其中X≥5为标准A,X≥3为标准B.已知甲车间执行标准A,乙车间执行标准B生产该产品,且两个车间的产品都符合相应的执行标准.
(1)已知甲车间的等级系数X1的概率分布列如下表,若X1的数学期望E(X1)=6.4,求a,b的值;
X1
5
6
7
8
P
0.2
a
b
0.1
【解析】
(1)E(X1)=5×0.2+6a+7b+8×0.1=6.4,即6a+7b=4.6　①,
又0.2+a+b+0.1=1,即a+b=0.7　②,
联立①②得
解得
(2)为了分析乙车间的等级系数X2,从该车间生产的火腿中随机抽取30根,相应的等级系数组成一个样本如下:
3
5
3
3
8
5
5
6
3
4　6
3
4
7
5
3
4
8
5
3　8
3
4
3
4
4
7
5
6
7
用该样本的频率分布估计总体,将频率视为概率,求等级系数X2的概率分布列和均值.
【解析】
(2)由样本的频率分布估计总体分布,可得等级系数X2的分布列如下:
E(X2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,
即乙车间的等级系数的均值为4.8.
X2
3
4
5
6
7
8
P
0.3
0.2
0.2
0.1
0.1
0.1
专题训练
2.已知某一随机变量X的分布列如下,且E(X)=6.3,则a的值为(　　)
A.5
B.6
C.7
D.8
X
4
a
9
P
0.5
0.1
b
【答案】
C　
【解析】
由分布列性质知,0.5+0.1+b=1,得b=0.4,
∵E(X)=4×0.5+a·0.1+9×0.4=6.3,
∴a=7.故选C.
3.(2019浙江)设0则当a在(0,1)内增大时
(　　)
A.D(X)增大
B.D(X)减小
C.D(X)先增大后减小
D.D(X)先减小后增大
X
0
a
1
P
4.(2018江西六校联考)若随机变量ξ的分布列如表所示,E(ξ)=1.6,则a-b=
(　　)
A.0.2
B.-0.2
C.0.8
D.-0.8
ξ
0
1
2
3
P
0.1
a
b
0.1
【答案】
B　
【解析】
已知a,b∈[0,1],由0.1+a+b+0.1=1,得a+b=0.8,
又由E(ξ)=0×0.1+1·a+2·b+3×0.1=1.6,得a+2b=1.3,
解得a=0.3,b=0.5,则a-b=-0.2.故选B.
5.(多选)设离散型随机变量X的分布列为
若离散型随机变量Y满足Y=2X+1,则下列结果正确的有
(　　)
A.q=0.1
B.E(X)=2,D(X)=1.4
C.E(X)=2,D(X)=1.8
D.E(Y)=5,D(Y)=7.2
【答案】
ACD　
【解析】
因为q+0.4+0.1+0.2+0.2=1,所以q=0.1,故A正确;
又E(X)=0×0.1+1×0.4+2×0.1+3×0.2+4×0.2=2,
D(X)=(0-2)2×0.1+(1-2)2×0.4+(2-2)2×0.1+(3-2)2×0.2+(4-2)2×0.2
=1.8,故C正确;
因为Y=2X+1,所以E(Y)=2E(X)+1=5,D(Y)=4D(X)=7.2,故D正确.
故选ACD.
X
0
1
2
3
4
P
q
0.4
0.1
0.2
0.2
6.(2020新课标Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且
pi=1,则下面四种情形中,对应样本的标准差最大的一组是
(　　)
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
【答案】
B　
【解析】对于A选项,该组数据的平均数为
=(1+4)×0.1+(2+3)×0.4=2.5,
方差为sA2=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×
0.1=0.65;
对于B选项,该组数据的平均数为
=(1+4)×0.4+(2+3)×0.1=2.5,
方差为sB2
=(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×
0.4=1.85;
对于C选项,该组数据的平均数为
=(1+4)×0.2+(2+3)×0.3=2.5,
方差为sC2
=(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×
0.2=1.05;
对于D选项,该组数据的平均数为
=(1+4)×0.3+(2+3)×0.2=2.5,
方差为sD2
=(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×
0.3=1.45.
因此,B选项这一组的标准差最大.故选B.
7.一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.X表示在未来3天内日销售量不低于100个的天数,
则数学期望E(X)=　　　　　,
方差D(X)=　　　　　.?
【答案】
1.8;0.72
　
【解析】
由题意知,日销售量不低于100个的频率为(0.006+0.004+0.002)×50=0.6,且X~B(3,0.6),
所以期望E(X)=3×0.6=1.8,
方差D(X)=3×0.6×(1-0.6)=0.72.
8.(2020浙江)一个盒子里有1个红1个绿2个黄四个相同的球,每次拿一个,不放回,拿出红球即停,设拿出黄球的个数为ξ,
则P(ξ=0)=　　　　　;E(ξ)=　　　　　.?
9.甲,乙,丙三位学生独立地解同一道题,甲做对的概率为
,乙,丙做对的概率分别为m,n(m>n),且三位学生是否做对相互独立.记ξ为这三位学生中做对该题的人数,其分布列为:
(1)求至少有一位学生做对该题的概率;
ξ
0
1
2
3
P
a
b
(2)求m,n的值;
(3)求ξ的数学期望.
10.某中药种植基地有两处种植区的药材需在下周一、下周二两天内采摘完毕,基地员工一天可以完成一处种植区的采摘.由于下雨会影响药材品质,基地收益如下表所示:
若基地额外聘请工人,可在周一当天完成全部采摘任务.无雨时收益为20万元;有雨时,收益为10万元.额外聘请工人的成本为a万元.
已知下周一和下周二有雨的概率相同,两天是否下雨互不影响,基地收益为20万元的概率为0.36.
周一
无雨
无雨
有雨
有雨
周二
无雨
有雨
无雨
有雨
收益
20万元
15万元
10万元
7.5万元
(1)若不额外聘请工人,写出基地收益X的分布列及基地的预期收益;
【解析】
(1)设下周一无雨的概率为p,由题意,p2=0.36,p=0.6,
基地收益X的可能取值为20,15,10,7.5,则P(X=20)=0.36,P(X=15)=0.24,P(X=10)=0.24,P(X=7.5)=0.16,
则基地收益X的分布列为:
E(X)=20×0.36+15×0.24+10×0.24+7.5×0.16=14.4,
所以基地的预期收益为14.4万元.
X
20
15
10
7.5
P
0.36
0.24
0.24
0.16
(2)该基地是否应该外聘工人,请说明理由.
【解析】
(2)设基地额外聘请工人时的收益为Y万元,则其预期收益E(Y)=20×0.6+10×0.4-a=16-a(万元),E(Y)-E(X)=1.6-a,
综上,当额外聘请工人的成本高于1.6万元时,不外聘工人;
成本低于1.6万元时,外聘工人;
成本恰为1.6万元时,是否外聘工人均可以.
11.甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司底薪70元,每单抽成2元;乙公司无底薪,40单以内(含40单)的部分每单抽成4元,超出40单的部分每单抽成6元.假设同一公司送餐员一天的送餐单数相同,现从两家公司各随机抽取一名送餐员,并分别记录其100天的送餐单数,得到如下频数表:
甲公司送餐员送餐单数频数表
送餐单数
38
39
40
41
42
天数
20
40
20
10
10
乙公司送餐员送餐单数频数表
送餐单数
38
39
40
41
42
天数
10
20
20
40
10
(1)现从甲公司记录的这100天中随机抽取两天,求这两天送餐单数都大于40的概率;
(2)若将频率视为概率,回答以下问题:
①记乙公司送餐员日工资为X
(单位:元),求X的分布列和数学期望;
【解析】
(2)①设乙公司送餐员送餐单数为a,则
当a=38时,X=38×4=152;当a=39时,X=39×4=156;
当a=40时,X=40×4=160;当a=41时,X=40×4+1×6=166;
当a=42时,X=40×4+2×6=172.
所以X的所有可能取值为152,156,160,166,172.
故X的分布列为:
X
152
156
160
166
172
P
②小明拟到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为他作出选择,并说明理由.
【解析】
(2)
②依题意,甲公司送餐员日平均送餐单数为38×0.2+39×0.4+40×0.2+41×0.1+42×0.1=39.5,
所以甲公司送餐员日平均工资为70+2×39.5=149元.
由①得乙公司送餐员日平均工资为162元.
因为149<162,故推荐小明去乙公司应聘.(共29张PPT)
第十二章
概率与统计
第3节　二项分布及其应用
知识梳理
1.条件概率及其性质
(1)条件概率:设A,B为两个事件,且P(A)>0,则称P(B|A)=
为事件B在事件A发生的条件下的概率.
(2)条件概率的性质:
①0≤P(B|A)≤1;
②若B,C是两个互斥的事件,则P(B∪C|A)=P(B|A)+P(C|A).
2.相互独立事件
(1)若事件A的发生对事件B的发生没有影响,则称事件A与B相互独立.
(2)若事件A与B相互独立,则P(AB)=P(A)·P(B).
(3)若事件A,B相互独立,则
与B,A与
相互独立.
3.独立重复试验与二项分布
(1)独立重复试验
独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是相等的.
(2)二项分布
在n次独立重复的试验中,X表示事件A发生的次数,p是事件A发生的概率,则事件A恰好发生k次的概率是P(X=k)=
pk(1-p)n-k,
k=0,1,2,…,n,此时称随机变量X服从二项分布,记作X~B(n,p),并称p为成功概率.
(3)二项分布的期望与方差
若离散型随机变量X~B(n,p),则E(X)=np,D(X)=np(1-p).
精选例题
【例1】　从1,2,3,4,5中任取2个不同的数,事件A=“取到的2个数之和为偶数”,事件B=“取到的2个数均为偶数”,则P(B|A)=(　　)
【例2】　(2015广东,理)已知随机变量X服从二项分布B(n,p),若E(X)=30,D(X)=20,则p=　　　　　.?
【例3】　(2019天津)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.
(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;
X
0
1
2
3
P
(2)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.
【解析】
(2)设乙同学上学期间的三天中7:30之前到校的天数为Y,则Y~B
,且M={X=3,Y=1}∪{X=2,Y=0}.
由题意知事件{X=3,Y=1}与{X=2,Y=0}互斥,且事件{X=3}与{Y=1},事件{X=2}与{Y=0}均相互独立,从而由(1)知
P(M)=P({X=3,Y=1}∪{X=2,Y=0})=P(X=3,Y=1)+P(X=2,Y=0)
=P(X=3)P(Y=1)+P(X=2)P(Y=0)=
专题训练
1.如果随机变量ξ~B(n,p),且E(ξ)=7,D(ξ)=6,则p等于　　　　　.?
3.设X为随机变量,X~B
,若随机变量X的均值E(X)=2,则P(X=2)等于　　　　　.?
4.(2017新课标Ⅱ卷)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)=　　　　　.?
【答案】
1.96　
【解析】
由题意可得,抽到二等品的件数符合二项分布,
即X~B(100,0.02),
由二项分布的期望公式可得
D(X)=np(1-p)=100×0.02×0.98=1.96.
5.(2014新课标Ⅱ卷)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是(　　)
A.0.8
B.0.75
C.0.6
D.0.45
6.(2018新课标Ⅲ卷)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立,设X为该群体的10位成员中使用移动支付的人数,DX=2.4,P(X=4)(　　)
A.0.7
B.0.6
C.0.4
D.0.3
【答案】
B　
【解析】
由X~B(10,p),∴DX=10p(1-p)=2.4,∴10p2-10p+2.4=0,
解之得p1=0.4,p2=0.6,
由P(X=4)即
p4(1-p)6<
p6(1-p)4,可以知道p=0.6.故选B.
7.(2015新课标Ⅰ卷,理)投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为
(　　)
A.0.648
B.0.432
C.0.36
D.0.312
【答案】
A　
【解析】
根据独立重复试验公式得,
该同学通过测试的概率为
0.62×0.4+0.63=0.648.故选A.
8.(2019新课标Ⅱ卷,文理)11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10∶10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
【解析】
(1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.
因此P(X=2)=0.5×0.4+(1-0.5)×(1-0.4)=0.5.
(2)求事件“X=4且甲获胜”的概率.
【解析】
(2)X=4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.
因此所求概率为[0.5×(1-0.4)+(1-0.5)×0.4]×0.5×0.4=0.1.
9.某公司在迎新年晚会上举行抽奖活动,有甲、乙两种抽奖方案供员工选择.
方案甲:员工最多有两次抽奖机会,每次抽奖的中奖率均为
.第一次抽奖,若未中奖,则抽奖结束.若中奖,则通过抛一枚质地均匀的硬币,决定是否继续进行第二次抽奖.规定:若抛出硬币,反面朝上,员工则获得500元奖金,不进行第二次抽奖;若正面朝上,员工则须进行第二次抽奖,且在第二次抽奖中,若中奖,则获得奖金1000元;若未中奖,则所获得的奖金为0元.
方案乙:员工连续三次抽奖,每次中奖率均为
,每次中奖均可获得奖金400元.
(1)求某员工选择方案甲进行抽奖所获奖金X(元)的分布列;
X
0
500
1000
P
(2)试比较某员工选择方案乙与选择方案甲进行抽奖,哪个方案更划算?
10.为全面贯彻党的教育方针,坚持立德树人,适应经济社会发展对多样化高素质人才的需要,按照国家统一部署,湖南省高考改革方案从2018年秋季进入高一年级的学生开始正式实施.新高考改革中,明确高考考试科目由语文、数学、英语3科,及考生在政治、历史、地理、物理、化学、生物6个科目中自主选择的3科组成,不分文理科.假设6个自主选择的科目中每科被选择的可能性相等,每位学生选择每个科目互不影响,甲、乙、丙为某中学高一年级的3名学生.
(1)求这3名学生都选择物理的概率;
(2)设X为这3名学生中选择物理的人数,求X的分布列和数学期望.
X
0
1
2
3
P
?11.(2017新课标Ⅱ卷,理)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
X
200
300
500
P
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
12.(2017广州)某商店计划每天购进某商品若干件,商店每销售一件该商品可获利润60元,若供大于求,剩余商品全部退回,但每件商品亏损10元;若供不应求,则从外部调剂,此时每件调剂商品可获利40元.
(1)若商店一天购进该商品10件,求当天的利润y(单位:元)关于当天需求量n(单位:件,n∈N)的函数解析式;
【解析】
(1)当日需求量n≥10时,
利润为y=60×10+(n-10)·40=40n+200;
当日需求量n<10时,利润为y=60·n-(10-n)·10=70n-100.
所以利润y关于需求量n的函数解析式为y
(2)商店记录了50天该商品的日需求量n(单位:件,n∈N),整理得下表:
若商店一天购进10件该商品,以50天记录的各需求量的频率作为各需求量发生的概率,求当天的利润在区间[500,650]内的概率.
日需求量
7
8
9
10
11
12
频数
4
8
10
14
9
5
【解析】
(2)50天内有4天获得的利润为390元,有8天获得的利润为460元,有10天获得的利润为530元,有14天获得的利润为600元,有9天获得的利润为640元,有5天获得的利润为680元.
若利润在区间[500,650]内,则日需求量为9,10,11,其对应的频数分别为10,14,9.
则利润在区间[500,650]内的概率为
13.(2018新课标Ⅰ卷)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有产品做检验,设每件产品为不合格品的概率都为p(0(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0
.
【解析】
(1)20件产品中恰有2件不合格品的概率为
f(p)=
p2(1-p)18.
因此f'(p)=
[2p(1-p)18-18p2(1-p)17]=2
p(1-p)17(1-10p).
令f'(p)=0,得p=0.1.当p∈(0,0.1)时,f'(p)>0;
当p∈(0.1,1)时,f'(p)<0.
所以f(p)的最大值点为p0=0.1.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
①若不对该箱余下的产品做检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
【解析】
(2)由(1)知,p=0.1.
①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.
所以EX=E(40+25Y)=40+25EY=490.
②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验?
【解析】
(2)②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元.
由于EX=490>400,故应该对余下的产品做检验.(共37张PPT)
第十二章
概率与统计
第4节
正态分布
知识梳理
1.正态曲线
函数φμ,σ(x)=
,x∈R(其中μ,σ为参数,μ表示期望或平均数,σ表示标准差)的图象为正态分布密度曲线,简称正态曲线.
2.正态分布
随机变量X满足P(aφμ,σ(x)dx,则称随机变量X服从正态分布,记为X~N(μ,σ2).
3.正态曲线的性质
(1)曲线位于x轴上方,与x轴不相交.
(2)曲线关于x=μ对称.
(3)单调性
当x∈(-∞,μ)时,单调递增,当x∈(μ,+∞)时,单调递减.
(4)曲线与x轴之间的面积为1.
(5)图象特征:当μ一定时,曲线的形状由σ确定,
当σ越小,曲线越“瘦高”,表示总体的分布越集中;
当σ
越大,曲线越“矮胖”,表示总体的分布越分散.
4.三个特殊区间的取值概率:
P(μ-σP(μ-2σP(μ-3σ注意:通常认为服从正态曲线N(μ,σ2)的随机变量X只取(μ-3σ精选例题
【例1】
设随机变量ξ服从正态分布N(3,4),若P(ξ<2a-3)=P(ξ>a+2),
则a=
(
)
【答案】
D　
【解析】
由2a-3+a+2=6,解得a=
.故选D.
【例2】
已知随机变量服从正态分布N(0,σ2),若P(X>2)=0.023,则P(-2≤X≤2)=
(
)
A.0.477
B.0.628
C.0.954
D.0.977
【答案】
C　
【解析】
X~N(0,σ2)且P(X>2)=P(X<-2)=0.023,
则P(-2≤X≤2)=1-2P(X>2)=1-0.046=0.954.故选C.
【例3】
在某次数学考试中,考生的成绩ξ服从一个正态分布,即ξ~N(90,100).
(1)试求考试成绩ξ位于(70,110)上的概率是多少?
【解析】
(1)∵ξ~N(90,100),∴μ=90,σ=10,
∴P(70<ξ≤110)=P(90-2×10<ξ≤90+2×10),
∴P(70<ξ≤110)=P(μ-2σ∴P(70<ξ≤110)=0.9544,
∴ξ位于(70,110)上的概率是0.9544.
(2)若这次考试共有考生2000人,试估计考试成绩在(80,100)间的考生大约有多少人?
【解析】
(2)∵P(80<ξ≤100)=P(μ-σ∴P(80<ξ≤100)=0.6826,
∴考生大约有0.6826×2000=1365(人),
∴成绩在(80,100)间的考生大约有1365人.
【例4】
某个部件由三个元件按下图方式连接而成,元件1或元件2正常工作,且元件3正常工作,则部件正常工作,设三个电子元件的使用寿命(单位:小时)均服从正态分布N(1000,502),且各个元件能否正常工作相互独立,那么该部件的使用寿命超过1000小时的概率为
.
专题训练
1.已知随机变量ξ服从正态分布N(2,σ2),P(ξ>4)=0.2,则P(ξ<0)=(
)
A.0.8
B.0.6
C.0.4
D.0.2
【答案】
D　
【解析】
P(ξ<0)=P(ξ>4)=0.2.故选D.
2.已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.6826,
P(X>4)=
(
)
A.0.1588
B.0.1587
C.0.1586
D.0.1585
【答案】
B　
【解析】
P(3≤X≤4)=
P(2≤X≤4)=0.3413,
P(X>4)=0.5-P(3≤X≤4)=0.5-0.3413=0.1587.
故选B.
3.如果随机变量ξ~N(-1,σ2),且p(-3≤ξ≤-1)=0.4,则p(ξ≥1)=
(
)
A.0.4
B.0.3
C.0.2
D.0.1
【答案】
D　
【解析】
由随机变量ξ~N(-1,σ2)知,总体密度曲线关于x=-1对称,
所以P(-3≤ξ≤-1)=P(-1≤ξ≤1)=0.4,P(ξ≤-3)=P(ξ≥1)=0.1.故选D.
考点:正态曲线.
4.(2018青岛质检)设随机变量ξ~N(μ,σ2),且P(ξ<-3)=P(ξ>1)=0.2,
则P(-1<ξ<1)=
.
【答案】
0.3　
【解析】
由P(ξ<-3)=P(ξ>1)=0.2得P(ξ>-1)=0.5,
所以P(-1<ξ<1)=0.5-0.2=0.3.
5.设两个正态分布N(μ1,)(σ1>0)和N(μ2,)(σ2>0)的密度函数图象如图所示,则有μ1与μ2,σ1与σ2的大小关系是
.
【答案】
μ1<μ2,σ1<σ2
　
【解析】
μ反映的是状态分布的平均水平,x=μ是状态密度曲线的对称轴,由题意知道μ1<μ2;而σ反映的是状态分布的离散程度,σ越大,越分散,曲线越“矮胖”,σ越小,越集中,曲线越“瘦高”,由题图可知σ1<σ2.
6.设随机变量X服从正态分布N(0,1),P(X>1)=p,则P(X>-1)=(
)
A.p
B.1-p
C.1-2p
D.2p
【答案】
B　
【解析】
∵随机变量X服从正态分布N(0,1),P(X>1)=p,
∴P(X<-1)=p,P(X>-1)=1-P(X<-1)=1-p.故选B.
考点:正态分布.
7.已知随机变量X服从正态分布N(5,4),且P(X>k)=P(X.
【答案】
7　
【解析】
由题意可知
=5,解得k=7.
8.已知随机变量ξ服从正态分布N(2,a2),且P(ξ<4)=0.8,则P(0<ξ<2)
=
(
)
A.0.6
B.0.4
C.0.3
D.0.2
【答案】
C
【解析】
由P(ξ<4)=0.8,得P(ξ≥4)=1-P(ξ<4)=1-0.8=0.2,
由随机变量ξ服从正态分布N(2,a2)知,正态曲线关于x=2对称,
所以P(ξ≤0)=0.2,
从而P(0<ξ<4)=1-0.2-0.2=0.6,
因此P(0<ξ<2)=
P(0<ξ<4)=
×0.6=0.3.故选C.
考点:概率中的正态分布.
9.已知随机变量ξ服从正态分布N(1,4),若P(ξ>2)=a,则P(0<ξ<1)=
(
)
A.a
B.1-a
C.2a-1
D.
-a
10.(2018广东七校联考)已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为
(
)
(附:正态分布N(μ,σ2)中,P(μ-σ<ξ<μ+σ)=68.26%,P(μ-2σ<ξ<μ+2σ)=
95.44%)
A.4.56%
B.13.59%
C.27.18%
D.31.74%
11.(2018洛阳联考)已知随机变量X~B(2,p),Y~N(2,σ2),
若P(X≥1)=0.64,P(04)=
.
【答案】
0.1　
【解析】
∵随机变量服从X~B(2,p),
∴P(X≥1)=1-
(1-p)2=0.64,解得p=0.4.
又Y~N(2,σ2),
∴P(Y>4)=P(Y<0)=0.5-P(012.(2014新课标Ⅰ卷)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组数据用该区间的中点值作代表);
【解析】
(1)
抽取产品质量指标值的样本平均数
和样本方差s2分别为:
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220
×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+
202×0.08+302×0.02=150.
(2)由频率分布直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,δ2),其中μ近似为样本平均数
,δ2近似为样本方差s2.
①利用该正态分布,求P(187.8【解析】
(2)①由(1)知Z~N(200,150),
从而P(187.8②某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E(X).
附:
≈12.2.若Z~N(μ,σ2),则P(μ-σμ+2σ)=0.9544.
【解析】
(2)②由①知,一件产品中质量指标值为于区间(187.8,212.2)的概率为0.6826,
依题意知X~B(100,0.6826),所以E(X)=100×0.6826=68.26.
13.(正态分布)未来制造业对零件的精度要求越来越高.3D打印通常是采用数字技术材料打印机来实现的,常在模具制造、工业设计等领域被用于制造模型,后逐渐用于一些产品的直接制造,已经有使用这种技术打印而成的零部件.该技术应用十分广泛,可以预计在未来会有广阔的发展空间.某制造企业向A高校3D打印实验团队租用一台3D打印设备,用于打印一批对内径有较高精度要求的零件.该团队在实验室打印出了一批这样的零件,从中随机抽取10个零件,度量其内径的茎叶图如图所示(单位:μm).
9
10
11
7　7　8
2　5　7　8　9
3　4
(1)计算平均值μ与标准差σ;
(2)假设这台3D打印设备打印出品的零件内径Z服从正态分布N(μ,σ2),该团队到工厂安装调试后,试打了5个零件,度量其内径分别为(单位:μm):86,95,103,109,118,试问此打印设备是否需要进一步调试,为什么?
参考数据:
P(μ-2σ0.95443=0.87,0.99744=0.99,0.04562=0.002.
【解析】
(2)结论:需要进一步调试.
【方法1】
理由如下:如果机器正常工作,
则Z服从正态分布N(105,62),
P(μ-3σ零件内径在(87,123)之外的概率只有0.0026,而86?(87,123),
根据3σ原则,知机器异常,需要进一步调试.
【方法2】
理由如下:如果机器正常工作,
则Z服从正态分布N(105,62),
P(μ-3σ正常情况下5个零件中恰有一件内径在(87,123)外的概率为
P=
×0.0026×0.99744=5×0.0026×0.99=0.001287,为小概率事件,
而86?(87,123),小概率事件发生,说明机器异常,需要进一步调试.
【方法3】
理由如下:
如果机器正常工作,则Z服从正态分布N(105,62),
P(μ-2σ正常情况下5件零件中恰有2件内径在(93,117)外的概率为
P=
×0.004562×0.95443=10×0.002×0.87=0.0174,此为小概率事件,
而86?(93,117),118?(93,117),小概率事件发生,说明机器异常,需要进一步调试.
14.某市对所有高校学生进行普通话水平测试,发现成绩服从正态分布N(μ,σ2),下表用茎叶图列举出来抽样出的10名学生的成绩.
(1)计算这10名学生的成绩的均值和方差;
(2)给出正态分布的数据:P(μ-σ=0.9544.
由(1)估计从全市随机抽取一名学生的成绩在(76,97)的概率.
【解析】
(2)由(1)可估计,μ=90,σ=7.
∵76=90-2×7,97=90+7,
∴P(76=P(μ-2σ即
=0.8185.
故从全市随机抽取一名学生的成绩在(76,97)的概率为0.8185.
7
8
9
10
9
0　5　5
0　3　5　6　7
0
15.某公司开发了一种产品,有一项质量指标为“长度”(记为l,单位:cm),先从中随机抽取100件,测量发现全部介于85
cm和155
cm之间,得到如下频数分布表:
已知该批产品的该项质量指标值服从正态分布N(μ,σ2),其中μ近似为样本平均数
,σ2近似为样本方差s2(同一组中的数据用该组区间的中点值作代表).
分组
[85,95)
[95,105)
[105,115)
[115,125)
[125,135)
[135,145)
[145,155]
频数
2
9
22
33
24
8
2
(1)求P(132.2【解析】
(1)抽取产品质量指标值的样本平均数
=90×0.02+100×0.09+110×0.22+120×0.33+130×0.24+140
×0.08+150×0.02=120,
抽取产品质量指标值的方差s2=900×0.02+400×0.09+100×0.22+0×0.33+100×0.24+400
×0.08+900×0.02=150.
所以l~N(120,150),又σ=
≈12.2,
所以P(μ×0.6827≈0.3414,
P(μ×0.9545≈0.4773,
所以P(132.2(2)公司规定:当l≥115时,产品为正品;当l<115时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元.记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和数学期望.
参考数据:
≈12.2.
若X~N(μ,σ2),则P(μ-σP(μ-3σ【解析】
(2)由频数分布表得,P(l<115)=0.02+0.09+0.22=0.33,
P(l≥115)=1-0.33=0.67.
随机变量ξ的取值为90,-30,且P(ξ=90)=0.67,P(ξ=-30)=0.33.
则随机变量ξ的分布列为
所以E(ξ)=90×0.67-30×0.33=50.4.
ξ
90
-30
P
0.67
0.33
16.(2017新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
【解析】
(1)由题可知尺寸落在(μ-3σ,μ+3σ)之内的概率为0.9974,所以落在(μ-3σ,μ+3σ)之外的概率为0.0026.
P(X=0)=
(1-0.9974)00.997416≈0.9592,
P(X≥1)=1-P(X=0)≈1-0.9592=0.0408.
由题可知X~B(16,0.0026),
∴E(X)=16×0.0026=0.0416.
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
【解析】
(2)①尺寸落在(μ-3σ,μ+3σ)之外的概率为0.0026,
由正态分布知尺寸落在(μ-3σ,μ+3σ)之外为小概率事件,
因此上述监控生产过程的方法合理.
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
【解析】
②μ-3σ=9.97-3×0.212=9.334,
μ+3σ=9.97+3×0.212=10.606,
(μ-3σ,μ+3σ)=(9.334,10.606),
∵9.22?(9.334,10.606),∴需对当天的生产过程检查.
因此剔除9.22,剔除数据之后μ=
=10.02.
σ2=[(9.95-10.02)2+(10.12-10.02)2+(9.96-10.02)2+(9.96-10.02)2
+(10.01-10.02)2+(9.92-10.02)2+(9.98-10.02)2+(10.04-10.02)2
+(10.26-10.02)2+(9.91-10.02)2+(10.13-10.02)2+(10.02-10.02)2
+(10.04-10.02)2+(10.05-10.02)2+(9.95-10.02)2]×
≈0.008.
∴σ=
≈0.09.(共79张PPT)
第十二章
概率与统计
第5节
频率直方图、2×2列联表、
茎叶图、线性回归方程、相关关系
知识梳理
常用公式:
1.2×2列联表求观测值:K2=
2.由频率直方图:
(1)频率:f=组距×高.
(2)估计平均数公式:
3.求方差公式:
频率分布直方图中求方差的参考公式:
(其中x1,x2,…,xn取各分段的中间值)
4.线性回归方程公式:
(回归直线一定过样本中心
)
5.相关系数:
(|r|越接近1,说明两个变量的线性相关性越强,通常|r|>0.75时认为两个变量有比较强的线性相关性)
6.相关指数:
(R2越大,模型的拟合效果越好,R2越小,模型的拟合效果越差;R2越接近1,表示回归的效果越好.)
精选例题
考点1:茎叶图
【例1】
(2014新课标Ⅱ卷)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民评分情况有如下表:
甲部门
乙部门
3
5　9
4
4
0　4　4　8
9　7
5
1　2　2　4　5　6　6　7　7　7　8　9
9　7　6　6　5　3　3　2　1　1　0
6
0　1　1　2　3　4　6　8　8
9　8　8　7　7　7　6　6　5　5　5　5　5　4　4　4　3　3　3　2　1　0　0
7
0　0　1　1　3　4　4　9
6　6　5　5　2　0　0
8
1　2　3　3　4　5
6　3　2　2　2　0
9
0　1　1　4　5　6
10
0　0　0
(1)分别估计该市的市民对甲、乙部门评分的中位数;
【解析】
(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为
=67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)分别估计该市的市民对甲、乙部门的评分高于90的概率;
【解析】
(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为
故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
【解析】
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:利用其他统计量进行分析,结论合理的同样给分.)
考点2:独立性检验(2×2列联表)
【例2】
为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下2×2列联表:平均每天喝500
ml以上为常喝,体重超过50
kg为肥胖.
已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为
.
常喝
不常喝
合计
肥胖
2
不肥胖
18
合计
30
(1)请将上面的列联表补充完整;
【解析】
(1)设常喝碳酸饮料且肥胖的学生有x人,
由
,得x=6.
常喝
不常喝
合计
肥胖
6
2
8
不胖
4
18
22
合计
10
20
30
(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.
(3)现从常喝碳酸饮料且肥胖的学生中(其中有2名为女生),抽取2人参加电视节目,则正好抽到一男一女的概率是多少?
参考数据:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
考点3:频率分布直方图(中位数、平均数、众数、分层抽样)
【例3】
(2015广东)某城市100户居民的月平均用电量(单位:度)以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),
[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
【解析】
(1)由题意知,
(0.002+0.0025+0.005+x+0.0095+0.011+0.0125)×20=1,
则x=0.0075.
(2)求月平均用电量的众数和中位数;
【解析】
(2)由题意知,众数为
=230;
∵[160,180),[180,200),[200,220),三组所占的频率为20×(0.002+0.0095+0.011)=0.45,
[240,260),[260,280),[280,300]三组所占的频率为20×(0.0075+0.005+0.0025)=0.3,
∴中位数m∈[220,240),由中位数的性质知
0.45+0.0125(m-220)=0.0125(240-m)+0.3,
∴2m=448,即m=224,所以中位数为224.
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电在[220,240)的用户中应抽取多少户?
【解析】
(3)由题意知,[220,240),[240,260),[260,280),[280,300],
四组的频率之比为
(20×0.0125)∶(20×0.0075)∶(20×0.005)∶(20×0.0025)
=5∶3∶2∶1,
所以用分层抽样的方法从月平均用电量[220,240)的用户中应抽取
×11=5(户).
考点4:线性回归方程
【例4】　(2015重庆)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y
(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程
;
i
ti
yi
ti2
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
合计
15
36
55
120
【解析】
(1)列表:
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
【解析】
(2)将t=6代入回归方程
=1.2t+3.6,可以预测该地区2015年的人民币储蓄存款为y=1.2×6+3.6=10.8(千亿元).
【例5】　(2016新课标Ⅲ卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2008~2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
1.(2015新课标Ⅱ卷)某公司为了了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对其产品的满意度的评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.
A地区用户满意度评分的频率分布直方图
B地区用户满意度评分的频数分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100)
频数
2
8
14
10
6
专题训练
(1)在答题卡上作出B地区用户满意度评分的频率分布直方图,并通过此图比较两地区满意度评分的平均值及分散程度.(不要求计算出具体值,给出结论即可)
B地区用户满意度评分的频率分布直方图
【解析】
(1)如图:
通过两个地区满意度评分的频率分布直方图可以看出,B地区的满意度评分的平均分值高于A地区用户满意度评分的平均分值,B地区的满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)根据用户满意度评分,将用户的满意度评分分为三个等级:
估计哪个地区的用户的满意度等级为不满意的概率大,说明理由.
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
【解析】
(2)记CA表示事件为“A地区用户满意度等级为不满意”,记CB表示事件为“B地区用户满意度等级为不满意”.
由直方图知,P(CA)的估值为(0.01+0.02+0.03)×10=0.6,
P(CB)的估值为:(0.005+0.02)×10=0.25,
P(CA)>P(CB),所以A地区的满意度等级为不满意的概率大.
2.(2019新课标Ⅲ卷,文理)为了解甲、乙两种离子在小鼠体内的残留程度，进行如下试验：将200只小鼠随机分成A、B两组，每组100只，其中A组小鼠给服甲离子溶液，B组小鼠给服乙离子溶液，每组小鼠给服的溶液体积相同、摩尔浓度相同．经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图：
记C为事件：“乙离子残留在体内的百分比不低于5.5”，根据直方图得到P（C）的估计值为0.70．
甲离子残留百分比直方图
乙离子残留百分比直方图
(1)求乙离子残留百分比直方图中a，b的值；
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)．
【解析】
(1)由已知得0.70=a+0.20+0.15，故a=0.35．
b=1–0.05–0.15–0.70=0.10．
【解析】(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05．
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00．
3.(2018新课标Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;
【解析】
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35
m3的概率的估计值为0.48.
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
4.(2017新课标Ⅱ卷)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100
个网箱,测量各箱水产品的产量(单位:kg)某频率直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:旧养殖法的箱产量低于50
kg,新养殖法的箱产量不低于50
kg,估计A的概率;
【解析】
(1)记“旧养殖法的箱产量低于50
kg”
为事件B,“新养殖法的箱产量不低于50
kg”为事件C.
而P(B)=0.040×5+0.034×5+0.024×5+0.014×5+0.012×5=0.62,
P(C)=0.068×5+0.046×5+0.010×5+0.008×5=0.66,
P(A)=P(B)·P(C)=0.4092.
62
38
34
66
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
【解析】
(2)由计算可得K2的观测值为
K2=
≈15.705,
∵15.705>6.635,
∴P(K2≥6.635)≈0.010,
∴有99%以上的把握认为箱产量与养殖方法有关.
箱产量<50
kg
箱产量≥50
kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
参考数据:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【解析】
(3)∵1÷5=0.2,0.2-(0.004+0.020+0.044)=0.032,
0.032÷0.068=
×5≈2.35,
50+2.35=52.35,∴中位数为52.35.
5.(2019新课标Ⅰ卷,文)某商场为提高服务质量，随机调查了50名男顾客和50名女顾客，每位顾客对该商场的服务给出满意或不满意的评价，得到下面列联表：
?
(1)分别估计男、女顾客对该商场服务满意的概率；
满意
不满意
男顾客
40
10
女顾客
30
20
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异？
附：
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
6.(2020新课标Ⅰ卷,山东)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
　　　　　SO2
PM2.5　　　　　
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
【解析】
(1)由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数有32+6+18+8=64天,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率为
=0.64.
(2)根据所给数据,完成下面的2×2列联表:
【解析】
(2)由所给数据,可得2×2列联表为:
　　　　　　SO2
PM2.5　　　　　　
[0,150]
(150,475]
[0,75]
(75,115]
合计
64
16
80
10
10
20
合计
74
26
100
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附：
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
7.(2018新课标Ⅲ卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
第一种生产方式?
第二种生产方式
8
6
5　5　6　8　9
9　7　6　2
7
0　1　2　2　3　4　5　6　6　8
9　8　7　7　6　5　4　3　3　2
8
1　4　4　5
2　1　1　0　0
9
0
【解析】
(1)第二种生产方式的效率更高.
理由如下:
①由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
②由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的
中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
③由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
15
5
5
15
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
　　　　　锻炼人次
空气质量等级　　　　　
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
8.(2020新课标Ⅲ卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
空气质量等级
1
2
3
4
概率的估计值
0.43
0.27
0.21
0.09
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
【解析】
(2)一天中到该公园锻炼的平均人次的估计值为
×(100×20+300×35+500×45)=350.
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
人次≤400
人次>400
空气质量好
空气质量不好
【解析】
(3)根据所给数据,可得2×2列联表:
根据列联表得K2=
≈5.820.
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
人次≤400
人次>400
空气质量好
33
37
空气质量不好
22
8
9.(线性回归方程)(2015深圳二模,文)PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如下表:
时间
周一
周二
周三
周四
周五
车流量x(万辆)
50
51
54
57
58
PM2.5的浓度y(微克/立方米)
69
70
74
78
79
(1)根据上表数据,请在下列坐标系中画出散点图;
【解析】
(1)散点图如下图所示.
(2)根据上表数据,用最小二乘法求出y关于x的线性回归方程;
(3)若周六同一时间段车流量是25万辆,试根据(2)求出的线性回归方程预测,此时PM2.5的浓度为多少(保留整数)?
10保险公司统计的资料表明:居民住宅区到最近消防站的距离x(单位:千米)和火灾所造成的损失数额y(单位:千元)有如下的统计资料:
如果统计资料表明y与x有线性相关关系,试求:
(1)求相关系数r(精确到0.01);
距消防站距离x(千米)
1.8
2.6
3.1
4.3
5.5
6.1
火灾损失费用y(千元)
17.8
19.6
27.5
31.3
36.0
43.2
(2)求线性回归方程(精确到0.01);
(3)若发生火灾的某居民区与最近的消防站相距10.0千米,评估一下火灾的损失(精确到0.01).
11.某市春节期间7家超市广告费支出xi(万元)和销售额yi(万元)数据如下:
(1)若用线性回归模型拟合y与x的关系,求y与x的线性回归方程;
超市
A
B
C
D
E
F
G
广告费支出xi
1
2
4
6
11
13
19
销售额yi
19
32
40
44
52
53
54
(2)若用二次函数回归模型拟合y与x的关系,可得回归方程:
,经计算二次函数回归模型和线性回归模型的R2分别约为0.93和0.75,请用R2说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出3万元时的销售额.
【解析】
(2)∵0.75<0.93,∴二次函数回归模型更合适.
当x=3万元时,预测A超市销售额为33.47万元.
12.(2018新课标Ⅱ卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:
=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②
:=99+17.5t.
【解析】
(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
【解析】
(2)利用模型②得到的预测值更可靠.
理由如下:
①从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于另一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型
=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
②从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.
以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
13.(2020新课标Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
【解析】
(2)样本(xi,yi)(i=1,2,…,20)的相关系数为
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
【解析】
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
14.(2018广州模拟)某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增加量y(百斤)与使用某种液体肥料x(千克)之间对应数据为如图所示的折线图.
(1)依据数据的折线图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01).(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量X限制,并有如下关系:
若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.若商家安装了3台光照控制仪,求商家在过去50周周总利润的平均值.
周光照量X(单位:小时)
3050≤X≤70
X>70
光照控制仪最多可运行台数
3
2
1
【解析】
(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪.
①安装1台光照控制仪可获得周总利润3000元.
②安装2台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,
此时周总利润Y=3000-1000=2000元,
当30此时周总利润Y=2×3000=6000元,
故Y的分布列为
所以EY=2000×0.2+6000×0.8=5200元.
Y
2000
6000
P
0.2
0.8
③安装3台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,
此时周总利润Y=1×3000-2×1000=1000元,
当50≤X≤70时,有2台光照控制仪运行,
此时周总利润Y=2×3000-1×1000=5000元,
当30故Y的分布列为
所以EY=1000×0.2+5000×0.7+9000×0.1=4600元.
综上可知,为使商家周总利润的均值达到最大应该安装2台光照控制仪.
Y
1000
5000
9000
P
0.2
0.7
0.1
15.(2012新课标Ⅱ卷)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.
(1)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式.
(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:
①假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数;
日需求量n
14
15
16
17
18
19
20
频数
10
20
16
16
15
13
10
【解析】
(2)①这100天中有10天的日利润为55元,20天的日利润为65元,16天日利润为75元,54天日利润为85元,
所以这100天的日利润平均数为
×(55×10+65×20+75×16+85×54)=76.4(元).
②若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率.
【解析】
(2)
②利润不低于75元当且仅当日需求量不少于16枝,
所以当天利润不少于75元的概率为P=0.16+0.16+0.15+0.13+0.1=0.7.
16.(2011新课标卷,理)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测试了每件产品的质量指标值,得到下面试验结果:
A配方的频数分布表
B配方的频数分布表
指标值分组
[90,94)
[94,98)
[98,102)
[102,106)
[106,110]
频数
8
20
42
22
8
指标值分组
[90,94)
[94,98)
[98,102)
[102,106)
[106,110]
频数
4
12
42
32
10
(1)分别估计用A配方,B配方生产的产品的优质品率;
【解析】
(1)由实验结果知,用A配方生产的产品中优质的频率为
=0.3,
所以用A配方生产的产品的优质品率的估计值为0.3.
由实验结果知,用B配方生产的产品中优质品的频率为
=0.42,
所以用B配方生产的产品的优质品率的估计值为0.42.
(2)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为
y=
从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以实验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)
【解析】
(2)用B配方生产的100件产品中,其质量指标值落入区间[90,94),[94,102),[102,110]的频率分别为0.04,0.54,0.42,
因此P(X=-2)=0.04,P(X=2)=0.54,P(X=4)=0.42,
即X的分布列为
X的数学期望值E(X)=-2×0.04+2×0.54+4×0.42=2.68.
X
-2
2
4
P
0.04
0.54
0.42

点击下载

同课章节目录

点击下载

VIP下载