高考试题中统计问题的类型与解法 学案

文档属性

名称 高考试题中统计问题的类型与解法 学案
格式 zip
文件大小 2.0MB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2021-12-08 13:54:28

图片预览

文档简介

高考试题中统计问题的类型与解法
统计问题是近几年高考的热点内容之一。可以这样毫不夸张地说,高考试卷中,每卷必有统计问题。从题型上看,可能是选择题或填空题,也可能是大题,难度为中档或低档。纵观近几年高考试卷,归结起来统计问题主要包括:①随机抽样的基本方法;②统计表,统计图和统计指标;③两个随机变量之间的相关关系;④线性回归方程及回归分析;⑤独立性检验等几种类型。各种类型问题结构上具有一定的特征,解答方法也有一定的规律可寻。那么在实际解答统计问题时到底应该如何抓住问题的结构特征,快捷,准确的解答问题呢?下面通过典型例题的详细解析来回答这个问题。
【典例1】解答下列问题:
1、为了加强全民爱眼意识,提高民簇健康素质,1996年,卫生部,教育部,团中央等12个部委联合发出通知,将爱眼日活动列为国家节日之一,并确定每年的6月6日为“全国爱眼日”,某校高二(1)班有40名学生,学号为01到40,线采用随机数表法从该班抽取5名学生参加“全国爱眼日”宣传活动,已知随机数表中第六行至第七行的各数如下:
若从随机数表第6行第9列的数开始向右读,则抽取的第5名学生的学号是( )(成都市2021高三零诊)
A 17 B 23 C 35 D 37
【解析】
【考点】①随机数表法抽样的定义与性质;②随机数表法抽样的基本方法。
【解题思路】根据随机数表法抽样的性质和随机数表法抽样的基本方法,结合问题条件确定出第5名学生的学号就可得出选项。
【详细解答】抽样是从随机数表第6行第9列的数开始向右读, 第1名学生的学号为39,第2名学生的学号为17,第3名学生的学号为37,第4名学生的学号为23,第5名学生的学号为35,C错误,选C。
2、某中学有高中生1500人,初中生1000人,为了解该校学生自主锻炼的时间,采用分层抽样的方法从高中学生和初中学生中抽取一个容量为n的样本,若样本中高中学生恰有30人,则n的值为( )(成都市2020高三二诊)
A 20 B 50 C 40 D 60
【解析】
【考点】①样本容量定义与性质;②分层抽样定义与性质;③分层抽样各层抽样数的计算公式及运用;④计算分层抽样各层抽样数的基本方法。
【解题思路】根据分层抽样的性质,运用分层抽样各层抽样数的计算公式,结合问题条件得到关于n的方程,求解方程求出样本容量n的值就可得出选项。
【详细解答】n=30, n=30=50, B正确,选B。
3、下列抽样方法是简单随机抽样方法的是( )
A在某年明信片的销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2700的为三等奖;B某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽取一包产品,称其重量是否合格;C某学校分别从行政人员,教师,后勤人员抽取2人,14人,4人了解对学校机构改革的意见;D用抽签的方法从10件从产品中抽取3件进行质量检验。
【解析】
【知识点】①简单随机抽样的定义与性质;②简单随机抽样的基本方法。
【解题思路】运用简单随机抽样的性质和简单随机抽样的基本方法,对各选项进行判断就可得出选项。
【详细解答】对A,在100万张明信片中,后四位为2700的明信片每一万张中就有一张,属于系统抽样,A不正确;对B,在自动包装的传送带上,每隔30分钟抽取一包产品,属于等距抽样, B不正确;对C,分别从行政人员,教师,后勤人员抽取2人,14人,4人属于分层抽样, C不正确;对D,用抽签的方法从10件从产品中抽取3件符合简单随机抽样的特征, D正确,即选D。
4、某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,------,840随机编号,则抽取的42人中,编号落在区间[481,720]的人数为( )
A 11 B 12 C 13 D 14
【解析】
【知识点】①系统抽样的定义与性质;②系统抽样的基本方法。
【解题思路】运用系统抽样的性质和系统抽样的基本方法,确定出k的值,再确定[481,720]含k的个数就可得出选项。
【详细解答】k==20,=36-23=13,编号落在区间[481,720]的人数为13人,C正确,选C。
5、将参加夏令营的600名学生编号为001,002,-------,600,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003,这600名学生分住在三个营区,从001到300在第I营区,从301到495在第II营区,从496到600在第III营区,三个营区被抽中的人数依次为( )
A 26,16,8 B 25,17,8 C 25,16,9 D 24,17,9
【解析】
【知识点】①系统抽样的定义与性质;②系统抽样的基本方法。
【解题思路】运用系统抽样的性质和系统抽样的基本方法,确定出k的值,再确定区间[001,300],[301,485],[496,600],分别含k的个数就可得出选项。
【详细解答】=12,=25,=16+,=8+,三个营区被抽取的人数分别为25人,17人,8人,B正确,选B。
6、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分为面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(,)(i=1,2,-----,20),其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得:=60,=1200,=80,=9000,=800。
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(,)(i=1,2,-----,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由(2020全国高考新课标II)。
附:相关系数r=,1.414.
【解析】
【考点】①统计数据平均数的定义与求法;②求统计估计值的基本方法;③相关系数的定义与基本求法;④随机抽样的定义与性质;⑤给定抽样对象,确定抽样方法的基本方法。
【解题思路】(1)运用求统计数据平均数的基本方法,结合问题条件求出样本的平均数,根据统计估计值的基本方法就可求出该地区这种野生动物数量的估计值;(2)运用求相关系
数的基本方法和公式通过运算就可求出样本的相关系数;(3)依据研究对象的特征,利用确定抽样方法的基本方法就可作出选择。
【详细解答】(1)==60,=60200=12000(支),该地区这种野生动物数量的估计值为12000支;(2)r===0.94;
(3)各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,根据分层抽样的特征,应该采用分层抽样的简单随机抽样方法。
7、为践行“绿水青山就是金山银山”的发展理念,某城区对辖区内A,B,C三类行业共200个单位的生态环境治理成效进行了考核评估,考评分数达到80分及其以上的单位被称为“星级”环保单位,未达到80分的单位被称为“非星级”环保单位,现通过分层抽样的方法获得了这三类行业的20个单位,其考评分数如下:
A类行业: 85, 82, 77, 78, 83, 87;
B类行业: 76, 67, 80, 85, 79, 81;
C类行业: 87, 88, 76, 86, 75, 84, 90, 82。
(1)试估算着三类行业中每类行业的单位个数;
(2)若在A行业抽样的这6个单位中,随机选取3个单位进行交流发言,求选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的概率(2020成都市高三零诊)
【解析】
【考点】①分层抽样的定义与性质;②求统计估计值的基本方法;③古典概率的定义与基本求法。
【解题思路】(1)运用分层抽样的性质和分层抽样各层抽样数计算的基本方法,结合问题条件通过运算就可得出各类行业的单位个数;(2)(理)根据组合数计算的基本方法和古典概率的基本求法,结合问题条件通过运算就可得出所求概率;(文)根据画树状图基本方法和古典概率的基本求法,结合问题条件通过运算就可得出所求概率。
【详细解答】(1)设A,B,C三类行业的单位个数分别为,,,=6,=6=60;=6,=6=60;=8,=8=80,A,B,C三类行业的单位个数分别为60,60,80;(2)(理)设选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的事件为D,在A类行业抽样的这6个单位中,随机选取3个单位的基本事件数n===20,选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的基本事件数m=.+.=41+2=4+12=16,P(D)===。(文)设选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的事件为D,A类行业的6个单位分别为,,,,,,在A类行业抽样的这6个单位中,随机选取3个单位的基本事件数n为:,,,,,,
,,,,,,,,,,,,,共20个,选出的3个单位中既有“星级”环保单位,又有“非星级”环保单位的基本事件数m为:,,,,,, ,,,,,,,,,共16个,
P(D)===。
『思考问题1』
(1)【典例1】概率与统计中随机抽样基本方法的综合问题,解答这类问题需要理解古典概率,随机抽样的定义,了解随机抽样中各种抽样方法的特征与适用范围,掌握求古典概率和各种随机抽样的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;
(3)运用抽签法必须注意两个基本条件:①抽签是否方便,②号签是否容易搅匀,一般地当总体容量和样本容量较小时可以采用抽签法;
(4)运用随机数时,若遇到三位数或四位数,可以选择随机数表中某行某列的数字计起,每三个(或四个)作为一个单位,自左向右选取,有超过总体号码或重复号码舍去;
(5)系统抽样的特征是:①总体容量较大,②样本容量较大,③总体中各个个体之间没有明显的差异,④每个个体被抽到的可能性相等;
(6)系统抽样的基本方法是:①将总体中的个体进行统一编号,②把总体平均分成若干个部分(若总体容量不能被样本容量整除时,可以将总体随机剔除几个个体来确定分段间隔),③在第一个部分用简单随机抽样的方法确定开始的个体编号x,④按照每一组的个体数确定个体之间相隔的距离抽取样本;
(7)分层抽样的特征是:①总体容量较大,②总体由几个个体差异明显的部分构成;
(8)各层样本单位数的确定可按公式:某层抽取的样本数=样本数,通过计算来确定。
【典例2】解答下列问题:
1、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )(2021全国高考甲卷)
A该地农户家庭年收入低于4.5万元的农户比率估计为6%
B该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C估计该地农户家庭年收入的平均值不超过6.5万元
D根据该地有一半以上农户,其家庭年收入介于4.5万元至8.5万元之间
【解析】
【考点】①频率分布直方图的定义与性质;②频率的定义与基本求法;③统计估计的基本方法;④平均数计算公式及运用。
【解题思路】根据样频率分布直方图的性质和求频率的基本方法,结合问题条件分别求出该地农户家庭年收入低于4.5万元的农户,低于10.5万元的农户和介于4.5万元至8.5万元之间的农户的频率,运用计算平均数的公式求出该地农户家庭年收入的平均值,利用统计估计的基本方法就可得出选项。
【详细解答】该地农户家庭年收入低于4.5万元的农户比率为(0.02+0.04)1
=0.06,A正确;该地农户家庭年收入低于10.5万元的农户比率(0.02+0.04+
0.13+0.14+0.202)1=0.90,该地农户家庭年收入不低于10.5万元的农户比率为1-0.90=0.10,即B正确;该地农户家庭年收入的平均值为0.02(3+12+13+14)+0.04(4+11)+0.10(5+9+10)+0.146+0.20(7+8)=7.68>6.5,C错误,C结论不正确,选C。
2、有一组样本数据,,------,,由这组数据得到新样本数据,,-------,,其中=+c(i=1,2,-----,n),c为非零常数,则( )(2021全国高考新高考I)
A 两组样本数据的样本平均数相同 B 两组样本数据的样本中位数相同
C 两组样本数据的样本标准差相同 D 两组样本数据的样本极差相同
【解析】
【考点】①样本定义与性质;②样本平均数定义与性质;③样本中位数定义与性质;④样本标准差定义与性质;⑤样本极差定义与性质;⑥求一组数据平均数,中位数,标准差和极差的基本方法。
【解题思路】根据样本,样本平均数,样本中位数,样本标准差和样本极差的性质,运用求一组数据平均数,中位数,标准差和极差的基本方法,结合问题条件分别求出两个样本数据的平均数,中位数,标准差和极差就可得出选项。
【详细解答】样本数据,,------,的平均数= ,新样本数据,,-------,的平均数= =+c,,A错误;样本数据,,------,的中位数与新样本数据,,-------,的中位数=+c,+c,B错误;样本数据,,------,的标准差=,新样本数据,,-------,的标准差==
==,C正确;样本数据,,------,的极差=-,新样本数据,,-------,的极=-=+c--c=-,D正确,C,D正确,选C,D。
3、下列统计量中,能度量样本,,------,的离散程度的是( )
A 样本,,------,的标准差 B 样本,,------,的中位数
C 样本,,------,的极差 D 样本,,------,的平均数
【解析】
【考点】①样本定义与性质;②样本平均数定义与性质;③样本中位数定义与性质;④样本标准差定义与性质;⑤样本极差定义与性质。
【解题思路】根据样本,样本平均数,样本中位数,样本标准差和样本极差的性质,确定出能够度量样本数据,,------,离散程度的统计指标就可得出选项。
【详细解答】样本,,------,的标准差反映的是样本,,------,的离散程度,样本,,------,的中位数反映的是样本,,------,的集中趋势,样本,
,------,的极差反映的是样本,,------,的离散程度,样本,,------,
的平均数反映的是样本,,------,的集中趋势,A,C正确,选A,C。
4、甲乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:,分别表示甲乙
甲 0 1 0 2 2 0 3 1 2 4
乙 2 2 1 1 1 2 1 1 0 1
两组数据的平均数,,分别表示甲乙两组数据的方差,则下列选项正确的是( )(成都市2021高三一诊)
A = ,> B >,> C <,< D >,<
【解析】
【考点】①平均数的定义与性质;②方差的定义与性质;③求平均数的基本方法;④求方差的基本方法。
【解题思路】根据平均数和方差的性质,运用求平均数和方差的基本方法,结合问题条件分别求出,,,的值就可得出选项。
【详细解答】 ==1.5(件),=
=1.2(件), >,= =1.75,==0.36, >,B正确,选B。
5、某市环境保护局公布了该市A,B两个景区2014年至2020年各年的全年空气质量优良天数的数据,现根据这些数据绘制了如图所示的折线图,则由该折线图得出的下列结论中正确的是( )(成都市2021高三三诊)
A 景区A这7年的空气质量优良天数的极差为98 B 景区B这7年的空气质量优良天数的中位数为283 C 分别记景区A,B这7年的空气质量优良天数的众数为,,则>
D分别记景区A,B这7年的空气质量优良天数的标准差为 ,,则 >
【解析】
【考点】①极差的定义与性质;②确定统计数据极差的基本方法;③中位数的定义与性质;④确定统计数据中位数的基本方法;⑤众数的定义与性质;⑥确定统计数据众数的基本方法;⑦标准差的定义与性质;⑧求统计数据标准差的基本方法。
【解题思路】根据极差,中位数,众数,标准差的性质和确定的基本方法分别确定景区A,景区B这7年的空气质量优良天数的极差,中位数,众数和标准差就可得出选项。
【详细解答】景区A这7年的空气质量优良天数的极差为320-200=120 98,A错误,
景区B这7年的空气质量优良天数的中位数为280283,B错误,分别记景区A,B这7年的空气质量优良天数的众数为,,=260,=260,=,C错误,
从折线图可知景区A这7年的空气质量优良天数的波动性比景区B这7年的空气质量优良天数的波动性大,若分别记景区A,B这7年的空气质量优良天数的标准差为,,则 >,D正确,选D。
6、(理)在一组样本数据中,1,2,3,4出现的频率分别为,,,,且=1,则下列四种情形中,对应样本的标准差最大的一组是( )
A ==0.1,==0.4 B ==0.4,==0.1
C ==0.2,==0.3 D ==0.3,==0.2
(文)设一组样本数据,,-------,的方差为0.01,则数据10,10,-------,10的方差为( )(2020全国高考新课标III)
A 0.01 B 0.1 C 1 D 10
【解析】
【考点】①样本平均数定义与性质;②求样本平均数的基本方法;③样本标准差定义与性质;④求样本标准差的基本方法。
【解题思路】(理)根据样本平均数,标准差的性质和求样本平均数,标准差的基本方法,结合问题条件分别求出数据,,,的平均数与标准差,通过比较得出标准差最大的一组数据就可得出选项。(文)根据样本平均数,方差的性质和求样本平均数,方差的基本方法,结合问题条件求出数据10,10,-------,10的方差就可得出选项。
【详细解答】(理)对A, =0.1(1+4)+0.4(2+3)=2.5,
==;对B,=0.4(1+4)+0.1(2+3)=2.5,
==;对C,=0.2(1+4)+0.3(2+3)=2.5,
==,对D,
=0.3(1+4)+0.2(2+3)=2.5,
==,>>>,B组数据对应样本的标准差最大,B正确,选B。(文)数据
,,-------,的平均数= ,方差
= =0.01,数据10,10,-------,10的平均数==10,方差
==100=1000.01=1, C正确,选C。
7、如图,是某赛季甲,乙两名篮球运动员9场比赛 甲 乙
所得分数的茎叶图,则下列说法错误的是( )(20 0 8
20成都市高三零诊)A 甲所得分数的极差为22 B 7 5 1 1 1 2 6 8
乙所得分数的中位数为18 C 两人所得分数的众数相 4 2 2 0 2 0 2 2
等D 甲所得分数的平均数低于乙所得分数的平均数 3 2 3 1
【解析】
【考点】①茎叶图的定义与性质;②极差的定义与求法;③中位数的定义与求法;④众数的定义与求法;⑤平均数的定义与求法。
【解题思路】运用茎叶图的性质,结合问题条件分别求出甲所得分数的极差,乙所得分数的
中位数,甲,乙所得分数的众数和平均数就可得出选项。
【详细解答】甲所得分数的极差为33-11=22,A正确;乙所得分数的中位数为18,B正确;甲,乙所得分数的众数分别为22,22,C正确;甲,乙所得分数的平均数分别为
= 21.8,
= 17.8,21.8>17.8,>,D错误,选D。
8、某校随机抽取100名同学进行“垃圾分类”的问卷测试,测试结果发现这100名同学的得分都在[50,
100]内,按得分分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图,则这100名同学得分的中位数为( )(2020成都市高三一诊)
A 72.5 B 75 C 77.5 D 80
【解析】
【考点】①频率的定义与性质;②统计条形图的定义与运用;③中位数的定义及组局数列中位数的基本求法。
【解题思路】根据中位数的定义和组距数列中位数的基本求法,先确定中位数所在的组,再运用中位数就是使频率为0.5的数的特征求出中位数。
【详细解答】分数在[50,70)的频率=(0.010+0.030)10=0.4<0.5,分数在[50,80)的频率=(0.010+0.030+0.040)10=0.7>0.5,中位数在[70,80)这一组内,设中位数为70+x,0.4+0.040x=0.5,x==2.5, 这100名同学得分的中位数为70+2.5=72.5(分) , A正确,选A。
1、某厂研究了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别为和,样本方差分别记为和。
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-2
,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高)(2021全国高考乙卷)。
【解析】
【考点】①样本平均数的定义与性质;②样本方差的定义与性质;③求样本平均数的基本方法;④求样本方差的基本求法。
【解题思路】(1)根据样本平均数,方差的性质和求样本平均数,方差的基本方法,结合问题条件通过运算就可求出,,,的值;(2)根据(1)的计算结果分别求出-和2值,通过比较就可得出结论。
【详细解答】(1)==10,==10.3,
==0.036,
==0.04;(2)-
=10.3-10.0=0.03,2=2=2=<=0.3,
能够认为新设备生产产品的该项指标的均值较旧设备有显著提高。
2、(理)甲,乙,丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束。
经抽签,甲,乙首先比赛,丙轮空。设每场比赛双方获胜的概率都为。
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率。
(文)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级,加工业务约定:对于A级品,B级品,C级品,厂家每件分别收取加工费90元,50元,20元,对于D级品,厂家每件要赔偿原料损失费50元,该厂有甲,乙两个分厂可承接加工业务,甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件,厂家决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表 乙分厂产品等级的频数分布表
等级 A B C D 等级 A B C D
频数 40 20 20 20 频数 28 17 34 21
(1)分别估计甲,乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲,乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?(2020全国高考新课标I)
【解析】
【考点】①古典概率的定义与基本求法;②频率的定义与基本求法;③统计估计值的基本方法;④统计数据平均数的定义与基本求法。
【解题思路】(理)(1)运用求古典概率中相互独立事件同时发生概率的基本方法,结合问题条件通过运算就可求出甲连胜四场的概率;(2)运用求古典概率中相互独立事件同时发生和互斥事件恰有一个发生概率的基本方法,结合问题条件通过运算就可求出需要进行第五场比赛的概率;(3)运用求古典概率中相互独立事件同时发生和互斥事恰有一个发生概率的基本方法,结合问题条件通过运算就可求出丙最终获胜的概率。(文)(1)运用求频率的基本方法,结合问题条件分别求出甲,乙两分厂加工出来的一件产品为A级品的频率,从而就可分别估计甲,乙两分厂加工出来的一件产品为A级品的概率;(2)运用统计数据平均数的基本求法,结合问题条件分别求出甲,乙两分厂加工出来的100件产品的平均利润,
利用计算结果就可作出选择。
【详细解答】(理)(1)设甲连胜四场的事件为A,每场比赛甲获胜的概率为,
P(A)==;(2)设需要进行第五场比赛的事件为B,每场比赛甲,乙,丙获胜的概率都为,P(B)=+=+=;(3)设丙最终获胜的事件为C,每场比赛甲,乙,丙获胜的概率都为,P(C)=1---=。(文)甲分厂加工出来的一件产品为A级品的频率==0.4,乙厂加工出来的一件产品为A级品的频率=
=0.28,估计甲,乙两分厂加工出来的一件产品为A级品的概率分别为0.4,0.28;(2)
===15(元),
===10(元),>,以平均利润为依据,厂家应选甲分厂承接加工业务。
3、某公司为加强对销售员的考核与管理,从销售部门随机抽取了2019年度某一销售小组的月均销售额,该小组各组员2019年度的月均销售额(单位:万元)分别为:3.35,3.35,3.38,
3.41,3.43,3.44,3.46,3.48,3.51,3.54,3.56,3.56,3.57,3.59,3.60,3.64,3.64,3.67,3.70,3.70(2020成都市高三三诊)。
(1)根据公司人力资源部门的要求,若月均销售额超过3.52万元的组员不低于全组人数的65%,则对该销售小组给予奖励,否则不予奖励,判断该公司是否需要对抽取的销售小组发放奖励;
(2)(理)在该销售小组中,已知月均销售额最高的5名销售员中有一名的月均销售额造假,为找出月均销售额造假的组员,现决定请专业机构对这5名销售员的月均销售额逐一进行审核,直到能确定出造假组员为止,设审核次数为X,求X的分布列及数学期望;
(文)从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员,求选取的2名组员中至少有1名月均销售额超过3.68万元的概率。
【解析】
【考点】①求百分数的基本方法;②随机变量概率分布列的定义与求法;③随机变量数学期望的定义与求法;④古典概率的定义性质;⑤求古典概率的基本方法。
【解题思路】(1)结合问题条件确定出该组组员销售额不低于平均数的人数,根据求百分数的基本方法求出该组组员销售额不低于平均数的百分数就可作出判断;(2)(理)运用求随机变量概率分布列的基本方法求出随机变量X的分布列,根据分布列利用求随机变量数学期望的基本方法通过运算就可求出随机变量X的数学期望;(文)运用求古典概率的基本方法通过运算就可求出从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员至少有1名月均销售额超过3.68万元的概率。
【详细解答】(1)该小组组员中有11名组员销售额超过3.52万元,月均销售额超过
3.52万元的百分数为:100%=55%,55%<65%,该公司不需要对抽取的销售小组发放奖励;(2)(理)随机变量X的可能取值为:1,2,3,4,P(X=1)==,
P(X=2)= . =,P(X=3)=..=,P(X=4)=.. . =,随机变量X的分布列为: X 1 2 3 4
P
随机变量X的数学期望EX=1+2+3+4=;(文)该小组组员中有5名组员销售额超过3.6万元,设从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员至少有1名月均销售额超过3.68万元的事件为A,组员销售额超过3.6万元但没有超过3.68万元的组员分别为,,,组员销售额超过3.68万元的组员分别为,,
从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员的基本事件有,,,, ,,,,,共10个,从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员,至少有1名月均销售额超过3.68万元的基本事件有,, ,,,,共7个,P(A)=,即从该销售小组月均销售额超过3.60万元的销售员中随机抽取2名组员至少有1名月均销售额超过3.68万元的概率为。
『思考问题2』
(1)【典例2】是概率与统计中的统计表,统计图和统计指标相关综合问题,解答这类问题需要理解古典概率,统计表,茎叶图,频率分布直方图,平均数,方差,标准差的定义,掌握求古典概率的基本方法,茎叶图,频率分布直方图的基本作法和平均数,方差,标准差的基本求法,注意茎叶图,频率分布直方图的性质;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;
(3)茎叶图的特征是:①茎叶图能够看到真实的数据,没有任何信息损失;②茎叶图便于记录和表示;③茎叶图只便于表示两位有效数字的数据;④茎叶图也只方便记录两组数据;
(4)茎叶图的基本画法是:①用两短竖线分成把图分成两部分,②两组数据中选一组放左边,另一组放右边,③把数据的十位数记在两短竖线之间,④将数据的个位数分别记在左右两边;
(5)解答频率分布直方图问题的关键是读懂频率分布直方图,频率分布直方图中的每一个小矩形的面积是指样本数据落在该区域的频率,所有小矩形面积的和为1;
(6)作频率分布直方图的基本方法是:①求出原始数据的极差(最大值与最小值的差);②确定组数与组距;③确定各组的起始点与终点;④列出统计数据分布表;⑤画出频率分布直方图;
(7)总体估计的常用方法有:①点估计;②区间估计;
(8)点估计是直接运用样本指标作为总体指标,常用的样本指标有:①样本的平均数;②样本的标准差;③样本的方差;常用的总体指标有:①总体的平均数;②总体的标准差;③总体的方差;
(9)区间估计是根据问题要求可靠程度去确定总体指标取值的区间,其基本方法是:①由问题要求的可靠程度确定抽样的平均误差;②根据抽样平均误差确定抽样误差的允许范围;③根据抽样误差的允许范围确定总体指标的取值范围。
【典例3】解答下列问题:
1、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同温度条件下进行种子发芽率实验,由实验数据(,)(i=1,2------,20)得到如下散点图:由此散点图,在10至40之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型是( )(2020全国高考新课标I)
A y=a+bx B y=a+b C y=a+b D y=a+blnx
【解析】
【考点】①随机变量相关关系定义与性质;②随机变量散点图及运用;③回归方程定义与性
质;④根据随机变量散点图求回归方程的基本方法。
【解题思路】根据随机变量相关关系的性质和随机变量散点图,运用根据随机变量散点图求回归方程的基本方法,确定出发芽率y和温度x的回归方程的类型就可得出选项。
【详细解答】发芽率y和温度x散点图可知,实验数据(,)(i=1,2------,20)的点分布在对数函数图像的附近,最适宜作为发芽率y和温度x的回归方程类型是y=a+blnx,D正确,选D。
2、某实验室对小白鼠体内x,y两项指标进行 小白鼠体内x 120 110 125 130 115
研究,连续五次实验所测得的这两项指标数据如 小白鼠体内y 92 83 90 96 89
表所示,已知y与x具有线性相关关系,利用表中数据求得回归直线方程为=x+,若下一次实验中x=170,利用该回归直线方程预测得=117,则的值为 (成都市2020高三三诊)
【解析】
【考点】①线性相关的定义与性质;②求回归直线方程的基本方法;③利用回归直线方程进行预测的基本方法。
【解题思路】根据线性相关的性质和求回归直线方程的基本方法,结合问题条件得到关于的方程,求解方程就可求出的值。
【详细解答】回归直线方程为=x+,当x=170,利用该回归直线方程预测得=117,
= =120,= =90,=-=90
-120,117=170+90-120,即:=0.54。
3、经验说明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高,由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高,下面给出了某林场在研究树高与胸径之间的关系时收集的某种树的数据:
编号 1 2 3 4 5 6
胸径(cm) 18.1 20.1 22.2 24.4 26.0 28.3
树高(m) 18.8 19.2 21.0 21.0 22.1 22.1
编号 7 8 9 10 11 12
胸径(cm) 29.6 32.4 33.7 35.7 38.3 40.2
树高(m) 22.4 22.6 23.0 24.3 23.9 24.7
(1)根据表绘制树高y与胸径x之间关系的散点图;
(2)分析树高y与胸径x之间的相关关系,并求y关于x的线性回归方程;
(3)预测当树的胸径为50.6cm时,数的高度约是多少(精确到0.01)(2021全国高考新高考II).
附:回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
【解析】
【考点】①随机变量散点图的定义与基本作法;②判断随机变量相关关系的基本方法;③线性回归方程的定义与性质;④求线性回归方程的基本方法;③统计预测的基本求法。
【解题思路】(1)根据表中数据和作随机变量散点图的基本方法,就可作出树高y与胸径x之间关系的散点图;(2)根据线性回归方程的性质和基本求法,结合问题条件,运用公式求出,的值就可得到y关于x的线性回归方程;(3)利用统计预测的基本方法,结合(2)的线性回归方程就可预测当树的胸径为50.6cm时,树的高度。
【详细解答】(1)由表中数据作出树高y与胸径 x之间关系的散点图如图所示:
(2)=(18.1+20.1+22.2+24.4+26.0+28.3+29.6+32.4+33.7+35.7+38.3+40.2)=29.08,
=(18..8+19.2+ 21.0+21.0+22.1+22.1+22.4+22.6+23.0+24.3+23.9+24.7)=22.09,
=7851.03,=10715.74,=
==0.25,=-=22.09-0.2529.08=14.82,即y关于x的线性回归方程为:=0.25x+14.82;(3)当x=50.6时,=0.2550.6+14.82=27.47(m),当树的胸径为50.6cm时,数的高度约是27.47m。
4、某种机械设备,随着使用年限的增加,它的使用功能渐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“值”换算成费用,称之为“失效费”,其中机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.30 3.30 3.60 4.40 4.80 5.20 5.30
(1)由表中数据可知,可用线性回归模型拟合y与x的关系,请用相关关系系数加以说明(精确到0.01);
(2)求出y关于x的线性回归方程,并估算该种机械设备使用10年的失效费(2021成都市高三二诊)
线性回归方程=x+中的斜率和截距的最小二乘估计公式分别为:
【解析】
【考点】①变量相关关系的定义与性质;②判断变量相关关系的基本方法;③线性回归方程
的定义与性质;④求线性回归方程的基本方法;③统计预测的基本求法。
【解题思路】(1)根据表中数据和计算公式,求出相关系数r的值就可判断失效费 y与使用年限x之间线性相关;(2)根据线性回归方程的性质和基本求法,结合问题条件,运用公式求出,的值就可得到y关于x的线性回归方程;(3)利用统计预测的基本方法,结合(2)的线性回归方程就可预测当使用年限为10年时的失效费。
【详细解答】(1)=(1+2+3+4+5+6+7)=4,=(2.30+3.30+3.60+4.40+4.80+5.20
+5.30)=4.3,r=0.99,r0.99接近1,失效费y与使用年限x的线性相关程度很高,从而可以用线性回归模型拟合y与x的关系;(2)
===0.5,=-=4.3-0.54=2.3,y关于x的线性
回归方程为:=0.5x+2.3,当x=10时,=0.510+2.3=7.3(万元),估计该种机
械设备使用10年的失效费为7.3万元。
5、某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,制
作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润,该公司2013年至2019年的利润y关于年份代号x的统计数据如下表(一致该公司的年利润与年份代号线性相关):
年 份 2013 2014 2015 2016 2017 2018 2019
年份代号x 1 2 3 4 5 6 7
年利润y(单位:亿元) 29 33 36 44 48 52 59
(1)求y关于x的线性回归方程,并预测该公司2020年(年份代号记为8)的年利润;
(2)(理)当统计表中某年年利润的实际值大于由(1)中线性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2013年至2020年这8年中随机抽取2年,求恰有1(1)中线年为A级利润年的概率;(文)当统计表中某年年利润的实际值大于由性回归方程计算出该年利润的估计值时,称该年为A级利润年,否则称为B级利润年,将(1)中预测的该公司2020年的年利润视作该年利润的实际值,现从2015年至2020年这6年中随机抽取2年,求恰有1年为A级利润年的概率(2020成都市高三二诊)。
参考公式:=,=-。
【解析】
【考点】①线性回归方程的定义与性质;②求线性回归方程的基本方法;③古典概率的定义与基本求法。
【解题思路】(1)运用公式,结合统计表中的数据分别求出,的值,从而得到公司2013
年至2019年的利润y关于年份代号x的线性回归方程;(2)(理)根据A级利润年的定义,确定出2013年至2020年这8年中的A级利润年,利用求古典概率的基本方法就可求出从2013年至2020年这8年中随机抽取2年,恰有1年为A级利润年的概率;(文)根据A级利润年的定义,确定出2015年至2020年这8年中的A级利润年,利用求古典概率的基本方法就可求出从2015年至2020年这6年中随机抽取2年,恰有1年为A级利润年的概率。
【详细解答】(1)==4,=
=43,=(1-4)(29-43)+(2-4)(33-43)+(3-4)(36-43)+(4-4)(44-43)
+(5-4)(48-43)+(6-4)(52-43)+(7-4)(59-43)=42+20+7+0+5+18+48=140,
=(1-4)+(2-4)+(3-4)+(4-4)+(5-4)+(6-4)+(7-4)=9+4+1+0+1+4
+9=28,===5,=-=43-54=23,y关于x的线性回归方程为:=5x+23,当x=8时,=58+23=63,该公司2020年的年利润约为63亿元;(2)(理)当x=1时,=51+23=28<29,当x=2时,=52+23=33,当x=3时,=53+23=38>36,当x=4时,=54+23=43<44,当x=5时,=55+23=48,当x=6时,=56+23=53>52,当x=7时,=57+23=58<59,该公司从2013年至2020年这8年中,只有三年为A级利润年,设从2013年至2020年这8年中随机抽取2年,恰有1年为A级利润年的事件为B,P(B)===,从2013年至2020年这8年中随机抽取2年,恰有1年为A级利润年的概率为;
(文)当x=3时,=53+23=38>36,当x=4时,=54+23=43<44,当x=5时,=55+23=48,当x=6时,=56+23=53>52,当x=7时,=57+23=58<59,该公司从2015年至2020年这6年中,只有两年为A级利润年,设从2015年至2020年这6年中随机抽取2年,恰有1年为A级利润年的事件为B,两个A级利润年分别为,,四个非A级利润年分别为,,,,从6年中随机抽取2年的基本事件有,,,,,,,,,,,,,,共15个,6年中随机抽取2年,恰有1年为A级利润年的基本事件有,,,,,,,共8个,P(B)=,从2015年至2020年这6年中随机抽取2年,恰有1年为A级利润年的概率为。
『思考问题3』
(1)【典例3】是概率与统计中线性回归方程和线性回归分析的综合问题,解答这类问题需要理解古典概率,线性回归方程,线性回归分析的定义,掌握求古典概率,线性回归方程和线性回归分析的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;
(3)求线性回归方程的基本方法是:①判断两个变量是否具有线性相关关系;②运用公式:
=, =- 求出回归系数,(也可以用待定系数法,即根据回归直线过样本点的中心求系数,),③得到线性回归方程;
(4)判断两个随机变量是否线性相关的基本方法是:①根据数据作出随机变量的散点图,根据散点图进行判断;②运用相关系数的计算公式,通过运算求出相关系数的值,根据相关系数值的大小进行判断;
(5)回归分析及回归预测的基本方法是:①依据线性回归方程视为变量y是变量x(或t)的一次函数,将变量x(或t)的值代入回归直线方程求出变量y的值;②得出同角预测。
【典例4】解答下列问题:
1、甲,乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床,乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?(2021全国高考甲卷)
【解析】
【考点】①统计表的定义与性质;②频率的定义与性质;③求频率的基本方法;④22列联表的定义与性质;⑤两个变量相关的定义与判定的基本方法。
【解题思路】(1)根据统计表,频率的性质和求频率的基本方法,结合问题条件就可分别求出甲机床,乙机床生产的产品中一级品的频率;(2)根据22列联表,结合公式求出的值,依据计算结果和附表就可得出结论。
【详细解答】(1)由统计表可知,甲机床生产200件产品中有一级品150件,甲机床生产的产品中一级品的频率为==0.75,由统计表可知,,乙机床生产200件产品中有一级品120件,乙机床生产的产品中一级品的频率为==0.60,甲机床,乙机床生产的产品中一级品的频率分别是0.75,0.60;(2)=
===10.257>6.635,
有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异。
2、以网络公司为某贫困山区培养了100名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富,该公司将这100名“乡土直播员”中每天直播时间不少于5小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”,根据实际评选结果得到了下面22列联表: 网红乡土直播员 乡土直播达人 合计
(1)根据列联表判断是否有95%的把握认 男 10 40 50
为“网红乡土直播员”与性别有关? 女 20 30 50
(2)(理)在“网红乡土直播员”按分层抽样 合计 30 70 100
方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”中男性人数为,求的分布列和期望。
(文)在“网红乡土直播员”按分层抽样方法抽取6人,在这6人中选2人作为“乡土直播推广大使”,设被选中的2名“乡土直播推广大使”,求这俩人中恰有一男一女的概率(2021成都市高三一诊)
附:
(其中n=a+b+c+d)
【解析】
【考点】①22列联表的定义与性质;②两个变量相关的定义与判定的基本方法;③分层抽样的定义与性质;④分层抽样的基本方法;⑤随机变量概率分布列定义与性质;⑥求随机变量概率分布列的基本方法;⑦随机变量数学期望的定义与性质;⑧求随机变量数学期望的基本方法;⑨古典概率的定义与性质;⑩求古典概率的基本方法。
【解题思路】(1)根据22列联表和公式,结合问题条件求出的值就可判断是否有95%的把握为“网红乡土直播员”与性别有关;(2)(理)根据随机变量概率分布列的性质和求随机变量概率分布列的基本方法,结合问题条件就可得到随机变量的分布列,运用随机变量数学期望的性质和求随机变量数学期望的基本方法就可求出随机变量的数学期望。(文)根据古典概率的性质和求古典概率的基本方法就可求出选取的俩人中恰有一男一女的概率。
【详细解答】(1)==4.762>3.841,
有95%的把握认为“网红乡土直播员”与性别有关;(2)(理)抽取的男性人数为:
6=2(人),女性人数为:6=4(人),随机变量的可能取值为:0,1,2,p(=0)
===,p(=1)= = 0 1 2
= ,p(=2)= = =,随机变量 p
的分布列如表所示,E=0+1+2=。(文)设被选中的2名“乡土直播推广大使”中恰有一男一女的事件为A,抽取的男性人数为:6=2(人),女性人数为:6=4(人),令抽取的2名男性分别为,,抽取的4名女性分别为,,,,从这6人随机抽取2人的基本事件有:,,,,,,,,,,,,,,共15个,从这6人随机抽取2人,恰有一男一女的基本事件有:,,,,,,,共8个,p(A)=,即被选中的2名“乡土直播推广大使”中恰有一男一女的概率为。
3、某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天)
锻炼人次 (0,200] (200,400] (400,600]
空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”,若某天的空气质量等级为3或4,则称这天“空气质量不好”。根据所给数据,完成下面22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?(2020全国高考新课标III)
人次400 人次>400
空气质量好
空气质量不好
附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
【解析】
【考点】①统计表的定义与性质;②统计估计的基本方法;③求古典概率的基本方法;④求组距数列平均数的基本方法;⑤22列联表的定义与性质;⑥两个变量相关的定义与判定的基本方法。
【解题思路】(1)运用统计表,统计估计的基本方法和求古典概率的基本方法分别求出该市一天的空气质量等级为1,2,3,4的概率就可得出结果;(2)根据统计表和求组距数列平均数的基本方法求出一天中到该公园锻炼的平均人次就可得出结果;(3)利用统计表填写22列联表,由22列联表,结合公式求出的值,依据计算结果和附表就可得出结论。
【详细解答】(1)设样本中该市一天的空气质量等级为1,2,3,4的事件分别为A,B,C,
D,P(A)==0.43,P(B)= =0.27,P(C)= =0.21,
P(D)= =0.09,估计该市一天的空气质量等级为1,2,3,4的概率分别是0.43,0.27,0.21,0.09;(2)样本中一天中到该公园锻炼的平均人次为:
=350,一天中到该公园锻炼的平均人次的估计值为350;
(3)根据统计表得到22列联表如下表所示:
人次400 人次>400
空气质量好 33 37
空气质量不好 22 8
==5.820>3.841,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关。
4、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和S浓度(单位:ug/),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率;
S [0,50] (50,150](150,475] S [0,150] (150,475]
PM2.5 PM2.5
[0,35] 32 18 4 [0,75]
(35,75] 6 8 12 (75,115]
(75,115] 3 7 10
(2)根据所给数据,完成下面22列联表:
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与S浓
度有关?(2020全国高考新高考I)
赋:附:= , P(k) 0.050 0.010 0.001
其中n=a+b+c+d。 K 3.841 6.635 10.828
【解析】
【考点】①统计表的定义与性质;②统计估计的基本方法;③求古典概率的基本方法;④求组距数列平均数的基本方法;⑤22列联表的定义与性质;⑥两个变量相关的定义与判定的基本方法。
【解题思路】(1)运用统计表,统计估计的基本方法和求古典概率的基本方法求出事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率就可得出结果;(2)根据统计表填写22列联表就可得到22列联表;(3)由22列联表,结合公式求出的值,利用计算的结果和附表就可得出结论。
【详细解答】(1)设“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的事件为A,P(A)==0.64,估计事件“该市一天空气中PM2.5浓度不超过75,且S浓度不超过150”的概率为0.64;(2)22列联表如表所示:
S [0,150] (150,475]
PM2.5
[0,75] 64 16
(75,115] 10 10
(3)==7.488>6.635,有99%的把握认为该市一天空气中PM2.5浓度与S浓度有关。
5、某公司有1000名员工,其中男性员工400名,采用分层抽样的方法随机抽取100名员工进行5G手机购买意向的调查,将计划在今年购买5G手机的员工称为“追光簇”,计划在明年及明年以后才购买5G手机的员工称为“观望者”调查结果发现抽取的这100名员工中属于“追光簇”的女性员工和男性员工各有20人。 属于“追光簇” 属于“观望者”合计
(理)(1)完成下列22列联表,并判断 女性员工
是否有95%的把握认为该公司员工属于“追 男性员工
光簇”与性别有关; 合计 100
(2)已知被抽取的这100名员工中,有10名是人事部的员工,这10名中有3名“追光簇
”,现从这10名员工中随机抽取3名,记被抽取的3名中属于“追光簇”的人数为随机变量X,求X的分布列及首席期望。
(文)(1)同(理)(1);
(2)已知被抽取的这100名员工中,有6名是人事部的员工,,这6名中有3名“追光簇”,
现从这6名员工中随机抽取3名,求抽取到的3名中恰有1名属于“追光簇”的概率(2020
成都市高三一诊)
附:= ,其中n=a+b+c+d。
P() 0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.801 5.024 6.635 7.879 10.828
【解析】
【考点】①统计表的定义与性质;②22列联表的定义与性质;③两个变量相关的定义与判定的基本方法;④求随机变量分布列的基本方法;⑤数学期望的定义与基本求法;⑥求古典概率的基本方法。
【解题思路】(1)运用统计表填写22列联表,就可得到22列联表,根据22列联表,结合公式求出的值,依据计算结果和附表就可得出结论;(2)(理)根据求古典概率的基本方法分别求出随机变量为0,1,2,3的概率,从而得到随机变量的分布列,利用求数学期望的基本方法就可求出随机变量的数学期望;(文)运用古典概率的基本求法,就可求出从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的概率。
【详细解答】(理)(1)男员工应该抽取的人数=100 =40(人),女员工应该抽取的人数=100=60(人),“追光簇”的男,女员工各 有20人,男员工的“观望者”=40-20=20(人),女员工的“观望老”=60-20=40(人),22列联表如下表所示:
属于“追光簇” 属于“观望老” 合计
女性员工 20 4 0 60
男性员工 20 20 40
合计 40 60 100
==2.778<3.841,没有95%的把握认为该公司的“追光簇”与性别有关;(2)随机变量X的取值可能为0,1,2,3,P(X=0)
===,P(X=1)= = = ,P(X=2)= = = ,
P(X=3)= = ,随机变量X的分 X 0 1 2 3
布列如表所示:=0+1+2 P
+3==。(文)(1)男员工应该抽取的人数=100=40(人),女员
工应该抽取的人数=100=60(人),“追光簇”的男,女员工各有20人,男员工的“观望者”=40-20=20(人),女员工的“观望者”=60-20=40(人),22列联表如表所示:
属于“追光簇” 属于“观望者” 合计
女性员工 20 40 60
男性员工 20 20 40
合计 40 60 100
==2.778<3.841,没有95%的把握认为
该公司的“追光簇”与性别有关;(2)设从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的事件为C,6名人事部员工中,3名追光簇分别为,,,3名观望者分别为,,,从6名人事部的员工中随机抽取3名的基本事件有:,, , ,, ,,, ,,,,,,,,, ,,共20个,从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的事件有:, ,,,,,, ,共9个,从6名人事部的员工中随机抽取3名恰有1名属于“追光簇”的概率P(C)==。
『思考问题4』
(1)【典例4】是概率与统计中独立性检验的综合问题,解答这类问题需要理解古典概率,分类变量,独立性检验的定义,了解2x2列联表的意义,掌握求古典概率,2x2列联表,独立性检验的基本方法;
(2)求某个事件的概率,根据统计数据,结合古典概率的计算公式通过运算就可求出某个事件的概率;
(3)判断两个分类变量是否有关的基本方法是:①运用2x2列联表计算的值进行判断,越大两个分类变量有关的可能性越大;②计算|ad-bc|的值进行判断,|ad-bc|越大两个分类变量有关的可能性越大;
(3)独立性检验的基本方法是:①根据样本数据制成2x2列联表;②运用公式= 计算的观察值;③比较与临界值的大小,作出推断。
同课章节目录