概率和统计综合问题高考大题的类型与解法
概率和统计综合问题是近几年高考的热点问题之一,可以这样毫不夸张地说,只要是数学高考试卷,都必有一个概率和统计综合问题的12分大题。从题型上看是18或19题的12分大题,难度为中,低档题型,一般的考生都会拿到9到12分。纵观近几年高考试卷,归结起来概率和统计综合大题问题主要包括:①概率与统计中22列联表的综合问题;②概率与统计中线性回归方程的综合问题;③概率与统计指标的综合问题;④概率与简单随机抽样的综合问题;⑤概率与统计图的综合问题等几种类型。各种类型问题结构上具有一定的特征,解答方法也有一定的规律可寻。那么在实际解答概率和统计综合大题问题时,到底应该如何抓住问题的结构特征,快捷,准确地解答问题呢?下面通过典型例题的详细解析来回答这个问题。
【典例1】解答下列问题:
1、某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天)
锻炼人次
(0,200]
(200,400]
(400,600]
空气质量等级
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”,若某天的空气质量等级为3或4,则称这天“空气质量不好”。根据所给数据,完成下面22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?(2020全国高考新课标III)
人次400
人次>400
空气质量好
空气质量不好
附:=
,
P(k)
0.050
0.010
0.001
其中n=a+b+c+d。
K
3.841
6.635
10.828
【解析】
【考点】①统计表的定义与性质;②统计估计的基本方法;③求古典概率的基本方法;④求组距数列平均数的基本方法;⑤22列联表的定义与性质;⑥两个变量相关的定义与判定的基本方法。
【解题思路】(1)运用统计表,统计估计的基本方法和求古典概率的基本方法分别求出该市一天的空气质量等级为1,2,3,4的概率就可得出结果;(2)根据统计表和求组距数列平均数的基本方法求出一天中到该公园锻炼的平均人次就可得出结果;(3)利用统计表填写22列联表,由22列联表,结合公式求出的值,依据计算结果和附表就可得出结论。
【详细解答】(1)设样本中该市一天的空气质量等级为1,2,3,4的事件分别为A,B,C,
D,P(A)==0.43,P(B)=
=0.27,P(C)=
=0.21,
P(D)=
=0.09,估计该市一天的空气质量等级为1,2,3,4的概率分别是0.43,0.27,0.21,0.09;(2)样本中一天中到该公园锻炼的平均人次为:
=350,一天中到该公园锻炼的平均人次的估计值为350;
(3)根据统计表得到22列联表如下表所示:
人次400
人次>400
空气质量好
33
37
空气质量不好
22
8
==5.820>3.841,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关。
2、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和S浓度(单位:ug/),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率;
S
[0,50]
(50,150]
(150,475]
PM2.5
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(2)根据所给数据,完成下面22列联表:
S
[0,150]
(150,475]
PM2.5
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与S浓度有关?(2020全国高考新高考I)
赋:附:=
,
P(k)
0.050
0.010
0.001
其中n=a+b+c+d。
K
3.841
6.635
10.828
【解析】
【考点】①统计表的定义与性质;②统计估计的基本方法;③求古典概率的基本方法;④求组距数列平均数的基本方法;⑤22列联表的定义与性质;⑥两个变量相关的定义与判定的基本方法。
【解题思路】(1)运用统计表,统计估计的基本方法和求古典概率的基本方法求出事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率就可得出结果;(2)根据统计表填写22列联表就可得到22列联表;(3)由22列联表,结合公式求出的值,利用计算的结果和附表就可得出结论。
【详细解答】(1)设“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的事件为A,P(A)==0.64,估计事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率为0.64;(2)根据统计表得到22列联表如下表所示:
S
[0,150]
(150,475]
PM2.5
[0,75]
64
16
(75,115]
10
10
(3)==7.488>6.635,有99%的把握认为该市一天空气中PM2.5浓度与S浓度有关。
3、某公司有1000名员工,其中男性员工400名,采用分层抽样的方法随机抽取100名员工进行5G手机购买意向的调查,将计划在今年购买5G手机的员工称为“追光簇”,计划在明年及明年以后才购买5G手机的员工称为“观望者”调查结果发现抽取的这100名员工中属于“追光簇”的女性员工和男性员工各有20人。
属于“追光簇”
属于“观望者”合计
(理)(1)完成下列22列联表,并判断
女性员工
是否有95%的把握认为该公司员工属于“追
男性员工
光簇”与性别有关;
合计
100
(2)已知被抽取的这100名员工中,有10名是人事部的员工,这10名中有3名“追光簇
”,现从这10名员工中随机抽取3名,记被抽取的3名中属于“追光簇”的人数为随机变量X,求X的分布列及首席期望。
(文)(1)同(理)(1);
(2)已知被抽取的这100名员工中,有6名是人事部的员工,,这6名中有3名“追光簇
”,现从这6名员工中随机抽取3名,求抽取到的3名中恰有1名属于“追光簇”的概率(2020成都市高三一诊)
附:=
,其中n=a+b+c+d。
P()
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.801
5.024
6.635
7.879
10.828
【解析】
【考点】①统计表的定义与性质;②22列联表的定义与性质;③两个变量相关的定义与判定的基本方法;④求随机变量分布列的基本方法;⑤数学期望的定义与基本求法;⑥求古典概率的基本方法。
【解题思路】(1)运用统计表填写22列联表,就可得到22列联表,根据22列联表,结合公式求出的值,依据计算结果和附表就可得出结论;(2)(理)根据求古典概率的基本方法分别求出随机变量为0,1,2,3的概率,从而得到随机变量的分布列,利用求数学期望的基本方法就可求出随机变量的数学期望;(文)运用古典概率的基本求法,就可求出从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的概率。
【详细解答】(理)(1)男员工应该抽取的人数=100
=40(人),女员工应该抽取的人数=100=60(人),“追光簇”的男,女员工各
有20人,男员工的“观望者”=40-20=20(人),女员工的“观望老”=60-20=40(人),22列联表如下表所示:
属于“追光簇”
属于“观望老”
合计
女性员工
20
4
0
60
男性员工
20
20
40
合计
40
60
100
==2.778<3.841,没有95%的把握认为该公司的“追光簇”与性别有关;(2)随机变量X的取值可能为0,1,2,3,P(X=0)
===,P(X=1)=
=
X
0
1
2
3
=
,P(X=2)=
=
=
,
P
P(X=3)=
=
,随机变量X的分布列如表所示:=0+1+2
+3==。
(文)(1)男员工应该抽取的人数=100=40(人),女员工应该抽取的人数=100
=60(人),“追光簇”的男,女员工各有20人,男员工的“观望者”=40-20=20(人),女员工的“观望者”=60-20=40(人),22列联表如表所示:
属于“追光簇”
属于“观望者”
合计
女性员工
20
40
60
男性员工
20
20
40
合计
40
60
100
==2.778<3.841,没有95%的把握认为
该公司的“追光簇”与性别有关;(2)设从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的事件为C,6名人事部员工中,3名追光簇分别为,,,3名观望者分别为,,,从6名人事部的员工中随机抽取3名的基本事件有:,,
,
,,
,,,
,,,,,,,,,
,,共20个,从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的事件有:,
,,,,,,
,共9个,从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的概率P(C)==。
3、(理)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某企业为了调查内部员工对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有99%的把握认为满意度与年龄有关?
(2)为了帮助年龄在40岁及以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1000+700x;方案乙:y=
3000,0<x5,已知这8名员工的贡献积分分别为2分,3分,6分,7分,7分,11分,
5600,,5<x10,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为
9000,x>10
,“A类员工”,为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率。
(文)为了让税收政策更好的为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育,继续教育,大病医疗,住房贷款利息,住房租金,赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行,某机关为了调查内部职员对新个税方案的满意程度是否与年龄有关系,通过问卷调查,整理数据得如下22列联表:
(1)根据列联表,能否有85%的把握认为满意度与年龄有关?
(2)若已经在满意程度为“基本满意”的职员中用分层抽样的方式选取了5名职员,现从这5名职员中随机选取3名进行面谈,求面谈的职员中恰有2名年龄在40岁及以下的概率(2019成都市高三二诊)
【解析】
【考点】①22列联表的定义与性质;②相关系数的计算公式与求法;③判断两组数据是否相关的基本方法;④函数值的定义与求法;⑤古典概率的定义与求法;⑥分层抽样的定义与求各层抽样数的基本方法。
【解题思路】(1)运用22列联表,结合公式求出的值,根据所求的值利用参数数据得出结论;(2)(理)根据方案甲,乙通过运算确定“A类员工”的人数,再依据随机事件概率的计算公式求出随机事件的概率;(文)根据分层抽样各层抽样数的计算公式通过运算确定“基本满意”在40岁以下和40岁以上的人数,再利用古典概率的计算公式求出事件的概率。
【详细解答】(理)(1)==11.429>
6.635,有99%的把握认为该企业员工对新个税方案的满意程度与年龄有关系;
(2)①当积分为2分时,方案甲获得的补贴=1000+7002=2400(元),方案乙获得的补贴=3000(元),2400<3000,积分是2分的员工不属于“A类员工”;②
当积分为3分时,方案甲获得的补贴=1000+7003=3100(元),方案乙获得的补贴=3000(元),3100>3000,积分是3分的员工属于“A类员工”;③
当积分为6分时,方案甲获得的补贴=1000+
7006=5200(元),方案乙获得的补贴=5600(元),5200<5600,积分是6分的员工不属于“A类员工”;④
当积分为7分时,方案甲获得的补贴=1000+7007=5900(元),方案乙获得的补贴=5600(元),5900>3000,积分是7分的员工属于“A类员工”;⑤
当积分为11分时,方案甲获得的补贴=1000+70011=8700(元),方案乙获得的补贴=9000(元),8700<9000,积分是11分的员工不属于“A类员工”;⑥
当积分为12分时,方案甲获得的补贴=1000+70012=9400(元),方案乙获得的补贴=9000(元),9400>9000,积分是12分的员工属于“A类员工”;
综上所述,该企业8名需要解决实际困难的员
工中属于“A类员工”的有5人,设从8名员工中随机抽取4名,恰好抽到3名“A类员工”
的事件为B,从8名员工中随机抽取4名的基本事件===70,从8名员工中随机抽取4名恰好有3名“A类员工”的基本事件=.=
=310=30,P(B)==,即从8名员工中随机抽取4名,恰好抽到3名“A类员工”
的概率为。
(文)(1)==11.429>2.072,有85%的把握认为该企业员工对新个税方案的满意程度与年龄有关系;
(2)40岁以下抽取的人数=5=3(人),40岁以上抽取的人数=5=2(人),设从5名员工中随机抽取3名面谈,恰好抽到2名年龄在40岁以下的事件为C,三名40岁以下的员工分别为,,,二名40岁以上的员工分别为,,从
5名员工中随机抽取3名的基本事件有:,,,,
,
,
,,,共10个,从5名员工中随机抽取3名恰好有2名年龄在40岁以下的基本事件有:,,,,
,
共6个,P(C)==,即从5名员工中随机抽取3名进行面谈,恰好抽到2名年龄在40岁以下的概率为。
〖思考问题1〗
(1)【典例1】是概率与统计中22列联表综合的问题,解答这类问题需要理解古典概率,22列联表,两个变量相关的基本概念;掌握古典概率,两个变量相关系数的求法,还需要掌握判定两个变量是否相关的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;22列联表依据统计表可以直接列出,求相关系数时,需要根据22列联表和相关公式通过运算就可求出,判定两个变量是否相关是利用相关系数,结合附表就可得出结论。
[练习1]解答下列问题:
1、(理)为治疗某种疾病,研制了甲,乙两种新药,希望知道哪种新药更有效,为此进行动物试验。试验方案如下:每一轮选取两只白鼠对药效进行对比试验,对于两只白鼠,随机选取一只施以甲药,另一只施以乙药,一轮的治疗效果得出后,再安排下一轮试验,当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效。为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药的1分,乙药的-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药的1分,甲药的-1分;
若都治愈或都未治愈两种药均得0分。甲,乙两种药的治愈率分别记为和,一轮试验中甲药的得分及为X(i=1,2,----,7),其中a=P(X=-1),,b=P(X=0),c=P(X=1),假设=0.5,=0.8。
(1)求X的分布列;
(2)若甲药,乙药在试验开始时都赋予4分,(i=0,1,-----,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则=0,=1,=a+b+c
①证明:{-}(i=1,2,----,7)为等比数列;
②求,并根据的值解释这种试验方案的合理性。
(文)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男,女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男,女顾客对该商场服务的评价有差异?(2019全国高考新课标I)
(文科列联表)
(文科参考数据)
2、某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(2018全国高考新课标III卷)
第一种生产方式
第二种生产方式
超过m
不超过m
8
6
5
5
6
8
9
第一种生产
9
7
6
2
7
0
1
2
2
3
4
5
6
6
8
方式
9
8
7
7
6
5
4
3
3
2
8
1
4
4
5
第二种生产
2
1
1
0
0
9
0
方式
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入如图的列联表;
(3)根据(2)中列联表,能否有99%的把握认为两种生产方式的效率有差异?
3、海水养殖场进行某水产品的新,旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99℅的把握认为箱产量与养殖方法有关;
箱产量<50kg
箱产量50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
(文)(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99℅的把握认为箱产量与养殖方法有关;
箱产量<50kg
箱产量50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优
进行比较(2017全国高考新课标II卷)
附:
,=
【典例2】解答下列问题:
1、某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,制
作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润,该公司2013年至2019年的利润y关于年份代号x的统计数据如下表(一致该公司的年利润与年份代号线性相关):
年
份
2013
2014
2015
2016
2017
2018
2019
年份代号x
1
2
3
4
5
6
7
年利润y(单位:亿元)
29
33
36
44
48
52
59
(1)求y关于x的线性回归方程,并预测该公司2020年(年份代号记为8)的年利润;
(2)(理)当统计表中某年年利润的实际值大于由(1)中线性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2013年至2020年这8年中随机抽取2年,求恰有1(1)中线年为A级利润年的概率;(文)当统计表中某年年利润的实际值大于由性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2015年至2020年这6年中随机抽取2年,求恰有1年为A级利润年的概率(2020成都市高三二诊)。
参考公式:=,=-。
【解析】
【考点】①线性回归方程的定义与性质;②求线性回归方程的基本方法;③古典概率的定义与基本求法。
【解题思路】(1)运用公式,结合统计表中的数据分别求出,的值,从而得到公司2013年至2019年的利润y关于年份代号x的线性回归方程;(2)(理)根据A级利润年的定义,确定出2013年至2020年这8年中的A级利润年,利用求古典概率的基本方法就可求出从2013年至2020年这8年中随机抽取2年,恰有1年为A级利润年的概率;(文)根据A级利润年的定义,确定出2015年至2020年这8年中的A级利润年,利用求古典概率的基本方法就可求出从2015年至2020年这6年中随机抽取2年,恰有1年为A级利润年的概率。
【详细解答】(1)==4,=
=43,=(1-4)(29-43)+(2-4)(33-43)+(3-4)(36-43)+(4-4)(44-43)
+(5-4)(48-43)+(6-4)(52-43)+(7-4)(59-43)=42+20+7+0+5+18+48=140,
=(1-4)+(2-4)+(3-4)+(4-4)+(5-4)+(6-4)+(7-4)=9+4+1+0+1+4
+9=28,===5,=-=43-54=23,y关于x的线性回归方程为:=5x+23,当x=8时,=58+23=63,该公司2020年的年利润约为63亿元;(2)(理)当x=1时,=51+23=28<29,当x=2时,=52+23=33,当x=3时,=53+23=38>36,当x=4时,=54+23=43<44,当x=5时,=55+23=48,当x=6时,=56+23=53>52,当x=7时,=57+23=58<59,该公司从2013年至2020年这8年中,只有三年为A级利润年,设从2013年至2020年这8年中随机抽取2年,恰有1年为A级利润年的事件为B,P(B)===,从2013年至2020年这8年中随机抽取2年,恰有1年为A级利润年的概率为;
(文)当x=3时,=53+23=38>36,当x=4时,=54+23=43<44,当x=5时,=55+23=48,当x=6时,=56+23=53>52,当x=7时,=57+23=58<59,该公司从2015年至2020年这6年中,只有两年为A级利润年,设从2015年至2020年这6年中随机抽取2年,恰有1年为A级利润年的事件为B,两个A级利润年分别为,,四个非A级利润年分别为,,,,从6年中随机抽取2年的基本事件有,,,,,,,,,,,,,,共15个,6年中随机抽取2年,恰有1年为A级利润年的基本事件有,,,,,,,共8个,P(B)=,从2015年至2020年这6年中随机抽取2年,恰有1年为A级利润年的概率为。
2、(理)在2018年俄罗斯世界杯期间,莫斯科的部分餐厅经营了来自中国的小龙虾,这些小龙虾均标有等级代码,为得到小龙虾等级代码数值x与销售单价y之间的关系,经统计得到如下数据:(2019成都市高三一诊)
(理)(1)已知销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的线性回归方程(系数精确到0.1);
(2)(理)若莫斯科某个餐厅打算从上表的6种等级的中国小龙虾中随机选2种进行促销,记被选中的2种等级代码数值在60以下(不含60)的数量为X,求X的分布列记数学期望。
(文)若莫斯科某个餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?
【解析】
【考点】①线性回归方程的定义与性质;②求线性回归方程的基本方法;③古典概率的定义与基本求法;④随机变量概率分布列的定义与基本求法;⑤随机变量分布列数学期望的定义与基本求法。
【解题思路】(1)运用公式求出,的值,从而得到y关于x的线性回归方程;(2)(理)由问题的条件可知随机变量X的可能取值为0,1,2,分别求出P(X=0),P(X=1),P(X=2)的值,得到随机变量X的分布列,再利用数学期望的计算公式求出结果;(文)由(1)中求出的线性回归方程,当x=98时,代入回归方程就可求出销售单价的估计值。
【详细解答】(1)==0.2,=-=21.5-0.263
=8.9,y关于x的回归方程是:=0.2x+8.9;
(2)(理)由题知随机变量X的可能取值为X=0或X=1或
X
0
1
2
X=2,
P(X=0)=
=
,P(X=1)=
=
,
P
P(X
=2)=
=,随机变量X的分布列如右表所示:
EX=0+1+2=1。
(文)当x=98时,=0.298+8.9=41.2(元),当等级代码数值为98时,估计该等级的中国小龙虾的销售单价为41.2元。
2、如图所示,是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图。
为了预测该地区2018年的环境设施投资额,建立了y与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量t的值依次为1,2,----,17)建立模型①:=-30.4
+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,----,7)建立模型②:=99+17.5t(2018全国高考新课标II卷)。
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪一个模型得到的预测值更可靠?并说明理由。
【解析】
【考点】①线性回归方程的定义与性质;②给定随机变量的值,求在线性回归方程下预测值的基本方法;③统计折线图的定义与性质;④判断线性回归方程是否可靠的基本求法。
【解题思路】(1)运用线性回归方程的性质和给定随机变量的值,求在线性回归方程下预测值的基本方法,结合问题条件分别根据两个线性回归方程就可求出该地区2018年的环境基础设施投资额的预测值;(2)利用统计折线图和判断线性回归方程是否可靠的基本求法分别对两个线性回归方程进行判断就可得出结论。
【详细解答】(1)利用模型①,当t=19时,=-30.4+13.519=226.1(亿元),利用模型①该地区2018年的环境基础设施投资额的预测值为226.1亿元;利用模型②,当t=19时,=99+17.59=256.5(亿元),利用模型②该地区2018年的环境基础设施投资额的预测值为256.5亿元;(2)从统计折线图可以看出,2000年到2016年的数据对应点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年到2016年的数据建立的模型①不能很好地描述环境基础设施投资额的变化趋势,2010年相对于2009年的环境基础设施投资额有明显增加,2010年到2016年的数据对应点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年到2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,所以利用模型②得到的预测值更可靠。
〖思考问题2〗
(1)【典例2】是概率与统计中线性回归方程综合的问题,解答这类问题需要理解古典概率,线性回归方程的基本概念;掌握古典概率,线性回归方程的基本求法,还需要掌握判断线性回归方程是否可靠的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;求线性回归方程时,需要根据统计数据和相关公式通过运算分别求出,的值,把所求的值代入式子就可得到线性回归方程,判断线性回归方程是否可靠只需看折线图中统计数据的点是否在回归方程所在直线的附近就能得出结论。
[练习2]解答下列问题:
1、某医疗科研项目对5只小白鼠体内的A,B两项指标数据进行收集和分析,得到的数据如下表:(2018成都市高三零诊)
指标
1号小白鼠
2号小白鼠
3号小白鼠
4号小白鼠
5号小白鼠
A
5
7
6
9
8
B
2
2
3
4
4
(1)若通过数据分析,得知A项指标数据与B项指标数据具有线性相关关系,试根据上表,
求B项指标数据y关于A项指标数据x的线性回归方程=x+;
(2)现要从这5只小白鼠中随机抽取3只,求其中至少有一只B项指标数据高于3的概率。
参考公式:
==
,=
-。
2、(理)2014年4月10日至12日,第七届中国
成都文化(分值
10分
8分
6分
4分
西部国际化工博览会在成都举行,为使志愿者
志愿
更好地服务于大会,主办方决定对40名志愿者进
者知识
人
行一次考核,考核分为两个科目,“成都文化”和(等级)
数
“志愿者知识”,其中“成都文化”的考核成绩分
A
5
1
7
0
为10分,8分,6分,4分共四个档次,“志愿者
B
3
2
7
1
知识”的考核结果分为A,B,C,D共四个等级,
C
1
0
6
3
这40名志愿者的考核结果如表所示:
D
1
1
2
0
(1)求这40名志愿者“成都文化”考核成绩的平均值;
(2)从“成都文化”考核成绩为10分的志愿者中挑选3人,记“志愿者知识”考核结果为A等级的人数为,求随机变量的分布列及射线期望。
(文)某企业统计自2011年到2017年的产品研发费x和销售额y的数据如下表:
根据上表中的数据作出散点图,得知产品研发费的自然对数值z(精确到小数点后第二位)和销售额y具有线性相关关系。
(1)求销售额y关于产品研发费x的回归方程=lnx+(,的计算结果精确到小数点后第二位);
(2)根据(1)的结果预测:若2018年的销售额要达到70万元,则产品研发费大约需要多少万元?(2018成都市高三三诊)
参考数据:ln55.54.02,ln60.34.10,ln127.74.85,
参考公式:对于一组数据(,),(,),---,(,),其回归方程=x+的斜率和截距的最小二乘估计分别为:=,=
-。
3、某项科研活动共进行了5次试验,其数据如下表所示:(2017成都市高三二诊)
特征量
第一次
第二次
第三次
第四次
第五次
X
555
559
551
563
552
y 601
605
597
599
598
(1)从5次特征量y的试验数据中,随机地抽取两个数据,求至少有一个大于600的概率;
(2)求特征量y关于x的线性回归方程=x+,并预测当特征量x为570时特征量y的值。
(附:线性回归方程=x+中的和的最小二乘法估计公式分别为:=
,=
-)。
【典例3】解答下列问题:
1、(理)甲,乙,丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束。
经抽签,甲,乙首先比赛,丙轮空。设每场比赛双方获胜的概率都为。
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率。
(文)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级,加工业务约定:对于A级品,B级品,C级品,厂家每件分别收取加工费90元,50元,20元,对于D级品,厂家每件要赔偿原料损失费50元,该厂有甲,乙两个分厂可承接加工业务,甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件,厂家决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
乙分厂产品等级的频数分布表
等级
A
B
C
D
等级
A
B
C
D
频数
40
20
20
20
频数
28
17
34
21
(1)分别估计甲,乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲,乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?(2020全国高考新课标I)
【解析】
【考点】①古典概率的定义与基本求法;②频率的定义与基本求法;③统计估计值的基本方法;④统计数据平均数的定义与基本求法。
【解题思路】(理)(1)运用求古典概率中相互独立事件同时发生概率的基本方法,结合问题条件通过运算就可求出甲连胜四场的概率;(2)运用求古典概率中相互独立事件同时发生和互斥事件恰有一个发生概率的基本方法,结合问题条件通过运算就可求出需要进行第五场比赛的概率;(3)运用求古典概率中相互独立事件同时发生和互斥事恰有一个发生概率的基本方法,结合问题条件通过运算就可求出丙最终获胜的概率。(文)(1)运用求频率的基本方法,结合问题条件分别求出甲,乙两分厂加工出来的一件产品为A级品的频率,从而就可分别估计甲,乙两分厂加工出来的一件产品为A级品的概率;(2)运用统计数据平均数的基本求法,结合问题条件分别求出甲,乙两分厂加工出来的100件产品的平均利润,
利用计算结果就可作出选择。
【详细解答】(理)(1)设甲连胜四场的事件为A,每场比赛甲获胜的概率为,
P(A)==;(2)设需要进行第五场比赛的事件为B,每场比赛甲,乙,丙获胜的概率都为,P(B)=+=+=;(3)设丙最终获胜的事件为C,每场比赛甲,乙,丙获胜的概率都为,P(C)=1---=。(文)甲分厂加工出来的一件产品为A级品的频率==0.4,乙厂加工出来的一件产品为A级品的频率=
=0.28,估计甲,乙两分厂加工出来的一件产品为A级品的概率分别为0.4,0.28;(2)
===15(元),
===10(元),>,以平均利润为依据,厂家应选甲分厂承接加工业务。
2、某公司为加强对销售员的考核与管理,从销售部门随机抽取了2019年度某一销售小组的月均销售额,该小组各组员2019年度的月均销售额(单位:万元)分别为:3.35,3.35,3.38,
3.41,3.43,3.44,3.46,3.48,3.51,3.54,3.56,3.56,3.57,3.59,3.60,3.64,3.64,3.67,3.70,3.70(2020成都市高三三诊)。
(1)根据公司人力资源部门的要求,若月均销售额超过3.52万元的组员不低于全组人数的65%,则对该销售小组给予奖励,否则不予奖励,判断该公司是否需要对抽取的销售小组发放奖励;
(2)(理)在该销售小组中,已知月均销售额最高的5名销售员中有一名的月均销售额造假,为找出月均销售额造假的组员,现决定请专业机构对这5名销售员的月均销售额逐一进行审核,直到能确定出造假组员为止,设审核次数为X,求X的分布列及数学期望;
(文)从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员,求选取的2名组员中至少有1名月均销售额超过3.68万元的概率。
【解析】
【考点】①求百分数的基本方法;②随机变量概率分布列的定义与求法;③随机变量数学期望的定义与求法;④古典概率的定义性质;⑤求古典概率的基本方法。
【解题思路】(1)结合问题条件确定出该组组员销售额不低于平均数的人数,根据求百分数的基本方法求出该组组员销售额不低于平均数的百分数就可作出判断;(2)(理)运用求随机变量概率分布列的基本方法求出随机变量X的分布列,根据分布列利用求随机变量数学期望的基本方法通过运算就可求出随机变量X的数学期望;(文)运用求古典概率的基本方法通过运算就可求出从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员至少有1名月均销售额超过3.68万元的概率。
【详细解答】(1)该小组组员中有11名组员销售额超过3.52万元,月均销售额超过
3.52万元的百分数为:100%=55%,55%<65%,该公司不需要对抽取的销售小组发放奖励;(2)(理)随机变量X的可能取值为:1,2,3,4,P(X=1)==,
P(X=2)=
.
=,P(X=3)=..=,P(X=4)=..
.
=,随机变量X的分布列为:
X
1
2
3
4
P
随机变量X的数学期望EX=1+2+3+4=;(文)该小组组员中有5名组员销售额超过3.6万元,设从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员至少有1名月均销售额超过3.68万元的事件为A,组员销售额超过3.6万元但没有超过3.68万元的组员分别为,,,组员销售额超过3.68万元的组员分别为,,
从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员的基本事件有,,,,
,,,,,共10个,从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员,至少有1名月均销售额超过3.68万元的基本事件有,,
,,,,共7个,P(A)=,即从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员至少有1名月均销售额超过3.68万元的概率为。
3、(理)11分制乒乓球比赛,每赢一球的1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束。甲,乙两位同学进行单打比赛,假设甲发球时,甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立,在某局双方10:10平后,甲先发球,两人又打了x个球该局比赛结束。
(1)求P(x=2);
(2)求事件“x=4且甲获胜”的概率。
(文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频率分布表。
(1)分别估计这类企业中产值增长率不低于40%的企业比例,产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到0.01)(2019全国高考新课标II)附:8.602
【解析】
【考点】①古典概率的定义与基本方法;②求相互独立事件同时发生概率的基本方法;③频率的定义与基本求法;④平均数的定义与性质;⑤标准差的定义与性质;⑥条件估计的基本方法。
【解题思路】(理)(1)运用求相互独立事件同时发生概率的基本方法,结合问题条件通运算就可求出P(x=2);(2)运用求相互独立事件同时发生概率的基本方法,结合问题条件通运算就可求出事件“x=4且甲获胜”的概率。(文)(1)运用求频率的基本方法通过运算分别求出样本这类企业中产值增长率不低于40%企业和产值负增长的企业的频率,根据统计估计的基本方法就可分别估计这类企业中产值增长率不低于40%的企业比例和产值负增长的企业的比例;(2)运用求平均数,标准差的基本方法分别求出样本这类企业产值增长率的平均数与标准差,利用统计估计的基本方法就可求出这类企业产值增长率的平均数与标准差的估计值。
【详细解答】(理)(1)设两人又打了2个球该局比赛结束的事件为A,P(A)=0.50.4
+0.5(1-0.4)=0.2+0.3=0.5,
P(x=2)的概率为0.5;(2)设“x=4且甲获胜”的事件为B,P(B)=0.5(1-0.4)0.50.4+(1-0.5)0.40.50.4=0.06+0.04=0.1,“x=4且甲获胜”的概率为0.1。(文)(1)样本中这类企业中产值增长率不低于40%企业的频率为=,产值负增长的企业的频率为=,估计这类企业中产值增长率不低于40%的企业比例为,产值负增长的企业的比例为;(2)样本中=0.30,
s==0.17,估计这类企业产值增长率的平均数约为0.30,,标准差的估计值为0.86。
〖思考问题3〗
(1)【典例3】是概率与统计指标综合的问题,解答这类问题需要理解古典概率,平均数,标准差,方差的基本概念;掌握古典概率,平均数,标准差,方差的计算公式和基本求法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;求平均数,标准差,方差时,需要根据统计数据,结合相关公式通过运算就可求出相应的统计指标。
[练习3]解答下列问题:
1、电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值,假设所有电影是否获得好评相互独立。
(理)(1)从电影公司收集的电影中随机选取1部,求这部是获得好评的第四类电影的概率;
(2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;
(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“=1”表示
第k类电影得到人们喜欢,“=0”
表示第k类电影没有得到人们喜欢(k=1,2,3,4,
5,6),写出方差D,D,D,D,D,D的大小关系。
(文)(1)从电影公司收集的电影中随机选取1部,求这部是获得好评的第四类电影的概率;
(2)随机选取1部电影,估计这部电影没有获得好评的概率;
(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化,假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)(2018全国高考北京卷)
2、(理)王师傅为响应国家开展全民健身运动的号召,每天坚持“健步走”,并用计步器对每天“健步走”步数进行统计,他从某个月中随机抽取10天“健步走”的步数,绘制出的频率分布直方图如图所示。
(1)试估计该月王师傅每天“健步走”的步数的中位数及平均数(精确到小数点后1位);
(2)某健身组织队“健步走”结果的评价标准为:
按每天的步数分组(千步)
[8,10)
[10,12)
[12,14]
评论级别
及格
良好
优秀
现从这10天中随机抽取2天,求这2天的“健步走”不属于同一评价级别的概率。
(文)(1)试估计该月王师傅每天“健步走”的步数的中位数及平均数(精确到小数点后1位);
(2)某健身组织队“健步走”结果的评价标准为:
按每天的步数分组(千步)
[8,10)
[10,12)
[12,14]
评论级别
及格
良好
优秀
现从这10天中评价级别是“良好”或“及格”的天数里随机抽取2天,求这2天的“健步走”属于同一评价级别的概率(2017成都市高三零珍)
3、(理)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:
设该险种一续保人一年内出险次数与相应概率如下:
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60℅的概率;
(3)求续保人本年度的平均保费与基本保费的比值。
(文)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
(1)记A为事件:“一续保人本年度的保费不高于基本保费”求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费,但不高于基本保费的160℅”求P(B)的估计值;
(3)求续保人本年度的平均保费估计值(2016全国高考新课标II卷)
【典例4】解答下列问题:
1、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分为面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(,)(i=1,2,-----,20),其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得:=60,=1200,=80,=9000,=800。
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(,)(i=1,2,-----,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由(2020全国高考新课标II)。
附:相关系数r=,1.414.
【解析】
【考点】①统计数据平均数的定义与求法;②求统计估计值的基本方法;③相关系数的定义与基本求法;④随机抽样的定义与性质;⑤给定抽样对象,确定抽样方法的基本方法。
【解题思路】(1)运用求统计数据平均数的基本方法,结合问题条件求出样本的平均数,根据统计估计值的基本方法就可求出该地区这种野生动物数量的估计值;(2)运用求相关系
数的基本方法和公式通过运算就可求出样本的相关系数;(3)依据研究对象的特征,利用确定抽样方法的基本方法就可作出选择。
【详细解答】(1)==60,=60200=12000(支),该地区这种野生动物数量的估计值为12000支;(2)r===0.94;
(3)各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,根据分层抽样的特征,应该采用分层抽样的简单随机抽样方法。
2、为践行“绿水青山就是金山银山”的发展理念,某城区对辖区内A,B,C三类行业共200个单位的生态环境治理成效进行了考核评估,考评分数达到80分及其以上的单位被称为“星级”环保单位,未达到80分的单位被称为“非星级”环保单位,现通过分层抽样的方法获得了这三类行业的20个单位,其考评分数如下:
A类行业:
85,
82,
77,
78,
83,
87;
B类行业:
76,
67,
80,
85,
79,
81;
C类行业:
87,
88,
76,
86,
75,
84,
90,
82。
(1)试估算着三类行业中每类行业的单位个数;
(2)若在A行业抽样的这6个单位中,随机选取3个单位进行交流发言,求选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的概率(2020成都市高三零诊)
【解析】
【考点】①分层抽样的定义与性质;②求统计估计值的基本方法;③古典概率的定义与基本求法。
【解题思路】(1)运用分层抽样的性质和分层抽样各层抽样数计算的基本方法,结合问题条件通过运算就可得出各类行业的单位个数;(2)(理)根据组合数计算的基本方法和古典概率的基本求法,结合问题条件通过运算就可得出所求概率;(文)根据画树状图基本方法和古典概率的基本求法,结合问题条件通过运算就可得出所求概率。
【详细解答】(1)设A,B,C三类行业的单位个数分别为,,,=6,=6=60;=6,=6=60;=8,=8=80,A,B,C三类行业的单位个数分别为60,60,80;(2)(理)设选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的事件为D,在A类行业抽样的这6个单位中,随机选取3个单位的基本事件数n===20,选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的基本事件数m=.+.=41+2=4+12=16,P(D)===。(文)设选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的事件为D,A类行业的6个单位分别为,,,,,,在A类行业抽样的这6个单位中,随机选取3个单位的基本事件数n为:,,,,,,
,,,,,,,,,,,,,共20个,选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的基本事件数m为:,,,,,,
,,,,,,,,,共16个,
P(D)===。
〖思考问题4〗
(1)【典例4】是概率与随机抽样方法综合的问题,解答这类问题需要理解古典概率,随机抽样的基本概念;掌握古典概率,各种随机抽样的计算公式和基本求法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;随机抽样需要根据问题的特征,确定适合的随机抽样方法,就可达到解决问题的目的。
[练习4]解答下列问题:
1、(理)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药,一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“”表示服药者,“+”表示未服药者。
(1)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;
(2)从图中A,B,C,D四人中随机选出两人,记为选出的两人中指标x的值大于17的人数,求的分布列和数学期望E();
(3)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小(只需写出结论)
(文)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),------,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等,试估计总体中男生和女生人数的比例(2017全国高考北京卷)
2、(理)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm),根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正太分布N(u,)。
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(u-3,u+3)之外的零件数,求P(X1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(u-3,u+3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查。
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95,经计算得
==9.97,S===0.212,其中为抽取的第i个零件的尺寸,i=1,2------,16。
用样本平均数作为u的估计值,用样本标准差S作为的估计值,利用估计值判断
是否需对当天的生产过程进行检查?剔除(u-3,u+3)之外的数据,用剩下的数据估计u和(精确到0.01).
附:若随机变量Z服从正太分布N(u,),则P(u-3<Z<u+3)=0.9974-
=0.9592,=0.09.
(文)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm),下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
9
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
抽取次序
10
11
12
13
14
15
16
零件尺寸
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得==9.97,S===0.212,其中为抽取的第i个零件的尺寸,i=1,2------,16。
(1)求(,i)(i=1,2------,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检零件中,如果出现了尺寸在(u-3,u+3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查。
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在(-3S,+3S)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产
的零件尺寸的均值与标准差(精确到0.01)(2017全国高考新课标I卷)
附:样本(,)(i=1,2------,n)的相关系数r=
=0.09.
【典例5】解答下列问题:
1、2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮,某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:分钟)将学生分成六个组:[0,20),[20,40),[40,60),[60,80),[80,100),[100,120],经统计得到了如图所示的频率分布直方图(2019成都市高三零诊)。
(1)求频率分布直方图中a的值;并估计该校文学院的学生每天诵读诗词的时间的平均数;
(2)若两个同学诵读诗词的时间x,y满足|x-y|>60,则这两个同学组成一个“Tean”,已知从每天诵读诗词的时间小于20分钟和大于或等于80分钟的所有学生中用分层抽样的方法抽取了5人,现从这5人中随机选取2人,求选取的两人能组成一个“Tean”的概率。
【解析】
【考点】①频率分布直方图的定义与性质;②求统计估计值的基本方法;③分层抽样的定义与性质;④古典概率的定义与基本求法。
【解题思路】(1)运用频率分布直方图的性质,结合问题条件通过运算就可求出a的值,从而求出样本该校文学院的学生每天诵读诗词的时间的平均数并得出该校文学院的学生每天诵读诗词的时间的平均数的估计值;(2)根据分层抽样的性质分别求出每天诵读诗词的时间小于20分钟或大于或等于80分钟的的学生人数,利用“Tean”的定义和求古典概率的基本方法,结合问题条件通过运算就可得出选取的两人能组成一个“Tean”的概率。
【详细解答】(1)(a+a+6a+8a+3a+a)20=1,a=0.0025,该校文学院的学生每天诵读诗词的时间的平均数为:100.05+300.05+500.30+700.40+900.15+1100.05=64(分钟);(2)抽取的5人中,每天诵读诗词的时间小于20分钟的人数为5=1(人),大于或等于80分钟的的学生人数为5=4(人),设从这5人中随机选取2人,选取的两人能组成一个“Tean”的事件为A,每天诵读诗词的时间小于20分钟的1人为B,大于或等于80分钟的4人分别为,,,,从这5人中随机选取2人的基本事件有:B,B,B,B,,,,,,共10个,,选取的两人能组成一个“Tean”的基本事件有:B,B,B,B共4个,
P(A)==。
2、(理)某部门为了解企业在生产过程中的用水量情况,对每
7
3
1
天的用水量作了记录,得到了大量该企业的日用水量的统计数据,
8
3
5
6
7
8
9
从这些统计数据中随机抽取12天的数据作为样本,得到如图所
9
5
7
8
9
示的茎叶图(单位:吨),若用水量不低于95吨,则称这一天
的用水量超标。
(1)从这12天的数据中随机抽取3个,求至多有1天用水量超标的概率;
(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X为未来3天中用水量超标的天数,求X的分布列和数学期望。
(文)某部门为了解企业在生产过程中的用水量
日用水量
[70,80)[80,90)[90,100]
情况,对每天的用水量作了记录,得到了该企业(单位:吨)
的日用水量的统计数据,从这些统计数据中随机
频数
3
6
m
抽取12天的用水量的数据作为样本,得到的统
频率
n
0.5
p
计结果如右表:(2018成都市高三一诊)
(1)求m,n,p的值;
(2)已知样本中日用水量在[80,90)内的这六个数据分别为83,85,86,87,88,89,从六个数据中随机抽取两个,求抽取的两个数据中至少有一个大于86的概率。
【解析】
【考点】①茎叶图的定义与性质;②古典概率的定义与基本求法;③求组合数的基本方法;④随机变量概率分布列的定义与基本求法;⑤数学期望的定义与基本求法;⑥频率的定义与性质。
【解题思路】(理)(1)茎叶图的性质,结合问题条件通过运算就可求出从12天的数据中随机抽取3个的基本事件数n,从12天的数据中随机抽取3个至多有一天用水量超标的基本事件数m的值,从而求出从这12天的数据中随机抽取3个,至多有1天用水量超标的概率;(2)运用频率的求法求出样本中12天用水量超标的频率,从而得出12中天用水量超标的概率,由题意可知随机变量X的可能取值为0,1,2,3,分别求出各自的概率得到随机变量X的概率分布列,利用求扇形期望的基本方法就可求出随机变量X的数学期望。(文)运用频率的性质,结合问题条件就可求出m,n,p的值;(2)利用求古典概率的基本方法就可求出从六个数据中随机抽取两个,抽取的两个数据中至少有一个大于86的概率。
【详细解答】(理)(1)设从这12天的数据中随机抽取3个,至多有1天用水量超标的事件为A,从这12天的数据中随机抽取3个的基本事件为:==220,从这12天的数据中随机抽取3个,至多有1天用水量超标的基本事件为:+.=
+4=56+112=168,P(A)==,即从这12天的数据中随机抽取3个,至多有1天用水量超标的概率为;(2)样本中12天用水量超标的频率为=,12中天用水量超标的概率为,随机变量X的可能取值为0,1,2,3,P(X=0)==,
P(X=1)=
=,P(X=2)=(1-)=,P(X=3)=
=
,随机变量X的概率分布列为:
X
0
1
2
3
E(X)=0+1+2+3=1(天),
p
即随机变量X的数学期望为1天。
(文)(1)m=12-3-6=3,n==0.25,p==0.25;(2)设从六个数据中随机抽取两个,抽取的两个数据中至少有一个大于86的事件为A,六个数据中小于或等于86的数据分别为,,,大于86的数据分别为,,,从六个数据中随机抽取两个的基本事件有:,,,,,,,,,,,,,,共15个,抽取的两个数据中至少有一个大于86的基本事件有:,,,,,,,,,,,共12个,P(A)==,即从六个数据中随机抽取两个,抽取的两个数据中至少有一个大于86的概率为。
3、(理)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完。根据往年销售经验,每天需求量与当天最高气温(单位:)有关,如果气温不低于25,需求量为500瓶;如果气温位于区间[20,25),需求量为300瓶;如果气温低于20,需求量为200瓶。为了确定6月份的订购计划,统计了前三年六月份各天的最高气温数据,得到下面的频率分布表:
最高气温
[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率(2017全国高考新课标III卷)。
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,y的数学期望达到最大值?
(文)(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出y的所有可能值,并估计y大于零的概率。
【解析】
【考点】①频率的定义与性质;②古典概率的定义与基本求法;③随机变量概率分布列的定义与基本求法;④销售利润的定义与基本求法;⑤求函数最值的基本方法;⑥求统计估计值的基本方法。
【解题思路】(理)(1)频率的性质,结合问题条件通过运算分别求出需求量为200瓶,3
00瓶,500瓶的频率,从而分别求出需求量为200瓶,3
00瓶,500瓶的概率就可得到随机变量X的概率分布列;(2)运用求销售利润的基本方法,结合(1)的随机变量X的概率分布列分别写出y关于n的函数解析式,利用求函数最值的基本方法就可求出进货量n的值。(文)运用频率的性质,结合问题条件求出一天的需求量不超过300瓶的频率就可得到六月份这种酸奶一天的需求量不超过300瓶的概率;(2)根据求销售利润的基本方法分别写出y的表达式就可得到y的所有可能值,利用求古典概率的基本方法就可求出y大于零的概率。
【详细解答】(理)(1)随机变量X的可能取值为200,300,500,需求量为200瓶,3
00瓶,500瓶的频率分别为:=,=,=,P(X=200)=,
P(X=300)=,
P(X=500)=,随机变量X概率的分布列为:
X
200
300
500
(2)①当n
200瓶时,y=(6-4)n=2n,
p
此时当n=200时,=2200=400(元);②当200y=
[2200-2(n-200)]+
(6-2)n=+=,此时当n=300时,==520(元);③当200y=[2200-2(n-200)]+
[2300-2(n-300)]+
(6-4)n=++=,<
=520(元);④当n>500时,
y=[2200-2(n-200)]+
[2300-2(n-300)]+
[2
500-2
(n-500)]=++
=,<=440(元),综上所述,当n=300时,y的数学
期望达到最大值520元。(文)(1)设六月份这种酸奶一天的需求量不超过300瓶的事件为A,
P(A)=
=
,六月份这种酸奶一天的需求量不超过300瓶的概率为;(2)①当六月份一天的最高气温低于20时,
y=[2200-2(450-200)]=80
-100=-20(元),②当六月份一天的最高气温高于或等于20低于25时,
y=[2300-2(450-300)]=240-120=120(元);③当六月份一天的最高气温高于或等于25时,
y=
450(6-4)=900=360(元),设y大于零的事件为B,
P(B)=+=,估计y大于零的概率为。
〖思考问题5〗
(1)【典例5】是概率与统计图综合的问题,解答这类问题需要理解古典概率,统计图的基本概念;掌握古典概率的基本求法和各种统计图的性质与作法;
(2)求某个事件的概率,根据统计图,结合古典概率的计算公式通过运算就可求出某个事件的概率;运用统计图解答相关问题时,应该根据问题条件确定统计图属于哪一种类型,结合这种统计图的性质实施问题的解答。
[练习5]解答下列问题:
1、(理)某保险公司给年龄在20—70岁的民众提供某种疾病的一年期医疗保险,现从10000名参保人员中随机抽取100名作为样本进行分析,按年龄段[20,30),[30,40),[40,50),[50,60),[60,70],分成五组,其频率分布直方图如图所示,参保年龄与每人每年拟缴纳的保费如表所示。据统计,该公司每年为这一万名参保人员支出的各种费用为一百万元。
(1)用样本的频率分布估计总体分布,为使公司不亏本,求x精确整数时的最小值;
(2)经调查,年龄在[60,70]之间的老人每50人中有1人患该项疾病(以此频率作为概率),该病的治疗费为12000元,如果参保,保险公司补贴治疗费10000元,某老人年龄65岁,
若购买该项保险(x取(1)中的),针对此疾病所支付的费用为X元;若没有购买该项保险,针对此疾病所支付的费用为Y元,试比较X和Y的期望值大小,并判断该老人购买此项保险是否划算?
(文)某保险公司给年龄在20—70岁的民众提供某种疾病的一年期医疗保险,现从10000名参保人员中随机抽取100名作为样本进行分析,按年龄段[20,30),[30,40),[40,
50),[50,60),[60,70],分成五组,其频率分布直方图如图所示,参保年龄与每人每年拟缴纳的保费如表所示。
(1)求频率分布直方图中实数a的值,并求出该样本年龄的中位数;
(2)现分别在年龄段[20,30),[30,40),[40,50),[50,60),[60,70]中各选出
1人共5人进行回访,若从这5人中随机选出2人,求这2人所交保费之和大于200元的概率(2019成都市高三三诊)
2、为了解甲,乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同,摩尔浓度相同,经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70。
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲,乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)(2019全国高考新课标III)
3、(理)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药,一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“”表示服药者,“+”表示未服药者。
(1)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;
(2)从图中A,B,C,D四人中随机选出两人,记为选出的两人中指标x的值大于17的人数,求的分布列和数学期望E();
(3)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小(只需写出结论)
(文)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),------,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等,试估计总体中男生和女生人数的比例(2017全国高考北京卷)
(理科图)
(文科图)