名称 | 【人教A版】2017-2018学年高中数学选修2-3教学案全集含答案 | | |
格式 | zip | ||
文件大小 | 6.9MB | ||
资源类型 | 教案 | ||
版本资源 | 人教新课标A版 | ||
科目 | 数学 | ||
更新时间 | 2018-03-14 22:29:55 |
C.P(AB)=P(B|A)·P(A) D.P(A∩B|A)=P(B) 12.(全国丙卷)定义“规范01数列”{an}如下:{an}共有2m项,其中m项为0,m项为1,且对任意k≤2m,a1,a2,…,ak中0的个数不少于1的个数.若m=4,则不同的“规范01数列”共有( )
答案:C
4.把一枚硬币任意掷两次,事件A={第一次出现正面},事件B={第二次出现正面},则P(B|A)=________.
答案:
条件概率的计算
[典例] 抛掷红、蓝两颗骰子,记事件A为“蓝色骰子的点数为4或6”,事件B为“两颗骰子的点数之和大于8”,求:(1)事件A发生的条件下,事件B发生的概率.
(2)事件B发生的条件下,事件A发生的概率.
[解] [法一 定义法]
抛掷红、蓝两颗骰子,事件总数为6×6=36,事件A的基本事件数为6×2=12,所以P(A)==.
由于3+6=6+3=4+5=5+4>8,4+6=6+4=5+5>8,5+6=6+5>8,6+6>8,所以事件B的基本事件数为4+3+2+1=10,所以P(B)==.在事件A发生的条件下,事件B发生,即事件AB的基本事件数为6.
故P(AB)==.由条件概率公式,得
(1)P(B|A)===,
(2)P(A|B)===.
[法二 缩减基本事件总数法]
n(A)=6×2=12.
由3+6=6+3=4+5=5+4>8,4+6=6+4=5+5>8,5+6=6+5>8,6+6>8知,n(B)=10,其中n(AB)=6.
所以(1)P(B|A)===,
(2)P(A|B)===.
计算条件概率的两种方法
提醒:(1)对定义法,要注意P(AB)的求法.
(2)对第二种方法,要注意n(AB)与n(A)的求法.
[活学活用]
1.已知某产品的次品率为4%,其合格品中75%为一级品,则任选一件为一级品的概率为( )
A.75% B.96%
C.72% D.78.125%
解析:选C 记“任选一件产品是合格品”为事件A,则P(A)=1-P()=1-4%=96%. 记“任选一件产品是一级品”为事件B.由于一级品必是合格品,所以事件A包含事件B,故P(AB)=P(B).由合格品中75%为一级品知P(B|A)=75%; 故P(B)=P(AB)=P(A)·P(B|A)=96%×75%=72%.
2.一个盒子中有6只好晶体管,4只坏晶体管,任取两次,每次取一只,每一次取后不放回.若已知第一只是好的,求第二只也是好的概率.
解:令A={第1只是好的},B={第2只是好的},
法一:n(A)=CC,n(AB)=CC,
故P(B|A)===.
法二:因事件A已发生(已知),故我们只研究事件B发生便可,在A发生的条件下,盒中仅剩9只晶体管,其中5只好的,所以P(B|A)==.
条件概率的应用
[典例] 在一个袋子中装有10个球,设有1个红球,2个黄球,3个黑球,4个白球,从中依次摸2个球,求在第一个球是红球的条件下,第二个球是黄球或黑球的概率.
[解] 法一:设“摸出第一个球为红球”为事件A,“摸出第二个球为黄球”为事件B,“摸出第二个球为黑球”为事件C,则
P(A)=,P(AB)==,P(AC)==.
∴P(B|A)====,P(C|A)===.
∴P(B∪C|A)=P(B|A)+P(C|A)=+=.
∴所求的条件概率为.
法二:∵n(A)=1×C=9,n(B∪C|A)=C+C=5,
∴P(B∪C|A)=.∴所求的条件概率为.
利用条件概率性质的解题策略
(1)分析条件,选择公式:首先看事件B,C是否互斥,若互斥,则选择公式P(B∪C|A)=P(B|A)+P(C|A).
(2)分解计算,代入求值:为了求比较复杂事件的概率,一般先把它分解成两个(或若干个)互不相容的较简单的事件之和,求出这些简单事件的概率,再利用加法公式即得所求的复杂事件的概率.
[活学活用]
在某次考试中,要从20道题中随机地抽出6道题,若考生至少能答对其中4道题即可通过,至少能答对其中5道题就获得优秀.已知某考生能答对其中10道题,并且知道他在这次考试中已经通过,求他获得优秀成绩的概率.
解:记事件A为“该考生6道题全答对”,事件B为“该考生答对了其中5道题,另一道答错”,事件C为“该考生答对了其中4道题,另2道题答错”,事件D为“该考生在这次考试中通过”,事件E为“该考生在这次考试中获得优秀”,则A,B,C两两互斥,且D=A∪B∪C,E=A∪B,可知P(D)=P(A∪B∪C)=P(A)+P(B)+P(C)
=++=,P(AD)=P(A),P(BD)=P(B),
P(E|D)=P(A|D)+P(B|D)
=+=+=.
故所求的概率为.
层级一 学业水平达标
1.已知P(B|A)=,P(A)=,则P(AB)等于( )
A. B.
C. D.
解析:选C P(AB)=P(B|A)·P(A)=×=.
2.4张奖券中只有1张能中奖,现分别由4名同学无放回地抽取.若已知第一名同学没有抽到中奖券,则最后一名同学抽到中奖券的概率是( )
A. B.
C. D.1
解析:选B 因为第一名同学没有抽到中奖券,所以问题变为3张奖券,1张能中奖,最后一名同学抽到中奖券的概率显然是.
3.甲、乙、丙三人到三个景点旅游,每人只去一个景点,设事件A为“三个人去的景点不相同”,B为“甲独自去一个景点”,则概率P(A|B)等于( )
A. B.
C. D.
解析:选C 由题意可知,n(B)=C22=12,n(AB)=A=6.
∴P(A|B)===.
4.甲、乙两市都位于长江下游,根据一百多年来的气象记录,知道一年中下雨天的比例甲市占20%,乙市占18%,两地同时下雨占12%,记P(A)=0.2,P(B)=0.18,P(AB)=0.12,则P(A|B)和P(B|A)分别等于( )
A., B. ,
C., D. ,
解析:选C P(A|B)===,P(B|A)===.
5.用“0”“1”“2”组成的三位数码组中,若用A表示“第二位数字为0”的事件,用B表示“第一位数字为0”的事件,则P(A|B)=( )
A. B.
C. D.
解析:选B 法一:∵P(B)==,P(AB)==,∴P(A|B)==,故选B.
法二:在B发生的条件下,问题转化为:用“0”“1”“2”组成三位数码,其中第二位数字为0,则P(A|B)为在上述条件下,第一位数字为0的概率,∴P(A|B)==.
6.投掷两颗均匀的骰子,已知点数不同,设两颗骰子点数之和为ξ,则ξ≤6的概率为________.
解析:设A=“投掷两颗骰子,其点数不同”,B=“ξ≤6”,则P(A)==,P(AB)=,∴P(B|A)==.
答案:
7.一个家庭中有两个小孩.假定生男、生女是等可能的,已知这个家庭有一个是女孩,则这时另一个小孩是男孩的概率是________.
解析:设A=“其中一个是女孩”,B=“其中一个是男孩”,则P(A)=,P(AB)=,∴P(B|A)==.
答案:
8.盒中装有6件产品,其中4件一等品,2件二等品,从中不放回地取产品,每次1件,取两次,已知第二次取得一等品,则第一次取得的是二等品的概率是________.
解析:令第二次取得一等品为事件A,第一次取得二等品为事件B,则P(AB)==,P(A)==.
所以P(B|A)==×=.
答案:
9.五个乒乓球,其中3个新的,2个旧的,每次取一个,不放回的取两次,求:
(1)第一次取到新球的概率;
(2)第二次取到新球的概率;
(3)在第一次取到新球的条件下,第二次取到新球的概率.
解:设第一次取到新球为事件A,第二次取到新球为事件B.
(1)P(A)==.
(2)P(B)===.
(3)法一:P(AB)==,
P(B|A)===.
法二:n(A)=3×4=12,n(AB)=3×2=6,
P(B|A)===.
10.某校高三(1)班有学生40人,其中共青团员15人.全班平均分成4个小组,其中第一组有共青团员4人.从该班任选一人作学生代表.
(1)求选到的是第一组的学生的概率;
(2)已知选到的是共青团员,求他是第一组学生的概率.
解:设事件A表示“选到第一组学生”,
事件B表示“选到共青团员”.
(1)由题意,P(A)==.
(2)法一:要求的是在事件B发生的条件下,事件A发生的条件概率P(A|B).不难理解,在事件B发生的条件下(即以所选到的学生是共青团员为前提),有15种不同的选择,其中属于第一组的有4种选择.因此,P(A|B)=.
法二:P(B)==,P(AB)==,
∴P(A|B)==.
层级二 应试能力达标
1.一个盒子里有20个大小形状相同的小球,其中5个红的,5个黄的,10个绿的,从盒子中任取一球,若它不是红球,则它是绿球的概率是( )
A. B.
C. D.
解析:选C 在已知取出的小球不是红球的条件下,问题相当于从5黄10绿共15个小球中任取一个,求它是绿球的概率,∴P==.
2.从1,2,3,4,5中任取2个不同的数,事件A=“取到的2个数之和为偶数”,事件B=“取到的2个数均为偶数”,则P(B|A)=( )
A. B.
C. D.
解析:选B ∵P(A)==,P(AB)==,
∴P(B|A)==.
3.根据历年气象统计资料,某地四月份吹东风的概率为,下雨的概率为,既吹东风又下雨的概率为.则在吹东风的条件下下雨的概率为( )
A. B.
C. D.
解析:选D 设事件A表示“该地区四月份下雨”,B表示“四月份吹东风”,则P(A)=,P(B)=,P(AB)=,从而在吹东风的条件下下雨的概率为P(A|B)===.
4.从混有5张假钞的20张百元钞票中任意抽出2张,将其中1张放到验钞机上检验发现是假钞,则第2张也是假钞的概率为( )
A. B.
C. D.
解析:选D 设事件A表示“抽到2张都是假钞”,事件B为“2张中至少有一张假钞”,所以为P(A|B). 而P(AB)==,P(B)==.∴P(A|B)==.
5.100件产品中有5件次品,不放回地抽取两次,每次抽1件,已知第一次抽出的是次品,则第2次抽出正品的概率为________.
解析:设“第一次抽到次品”为事件A,“第二次抽到正品”为事件B,则P(A)==,P(AB)==,
所以P(B|A)==.
答案:
6.从1~100这100个整数中,任取一数,已知取出的一数是不大于50的数,则它是2或3的倍数的概率为________.
解析:法一:根据题意可知取出的一个数是不大于50的数,则这样的数共有50个,其中是2或3的倍数的数共有33个,故所求概率为.
法二:设A=“取出的球不大于50”,B=“取出的数是2或3的倍数”,则P(A)==,P(AB)=,
∴P(B|A)==.
答案:
7.现有6个节目准备参加比赛,其中4个舞蹈节目,2个语言类节目,如果不放回地依次抽取2个节目,求:
(1)第1次抽到舞蹈节目的概率;
(2)第1次和第2次都抽到舞蹈节目的概率;
(3)在第1次抽到舞蹈的条件下,第2次抽到舞蹈节目的概率.
解:设“第1次抽到舞蹈节目”为事件A,“第2次抽到舞蹈节目”为事件B,则“第1次和第2次都抽到舞蹈节目”为事件AB.
(1)从6个节目中不放回地依次抽取2次的事件数为n(Ω)=A=30,
根据分步计数原理n(A)=AA=20,
于是P(A)===.
(2)因为n(AB)=A=12,于是
P(AB)===.
(3)法一:由(1)(2)可得,在第1次抽到舞蹈节目的条件下,第2次抽到舞蹈节目的概率为P(B|A)===.
法二:因为n(AB)=12,n(A)=20,
所以P(B|A)===.
8.有外形相同的球分装在三个盒子中,每盒10个.其中,第一个盒子中有7个球标有字母A,3个球标有字母B;第二个盒子中有红球和白球各5个;第三个盒子中则有红球8个,白球2个.试验按如下规则进行:先在第一个盒子中任取一个球,若取得标有字母A的球,则在第二个盒子中任取一个球;若第一次取得标有字母B的球,则在第三个盒子中任取一个球.如果第二次取出的是红球,则称试验成功,求试验成功的概率.
解:设A={从第一个盒子中取得标有字母A的球},
B={从第一个盒子中取得标有字母B的球},
R={第二次取出的球是红球},
则容易求得P(A)=,P(B)=,
P(R|A)=,P(R|B)=.
事件“试验成功”表示为RA∪RB,又事件RA与事件RB互斥,
故由概率的加法公式,得
P(RA∪RB)=P(RA)+P(RB)
=P(R|A)P(A)+P(R|B)P(B)
=×+×=0.59.
2.2.2 事件的相互独立性
预习课本P54~55,思考并完成以下问题
1.事件的相互独立性的定义是什么?性质是什么?
2.相互独立事件与互斥事件的区别?
事件的相互独立性
(1)定义:设A,B为两个事件,如果P(AB)=P(A)P(B),则称事件A与事件B相互独立.
(2)性质:A与B是相互独立事件,则也相互独立.
[点睛] 相互独立事件与互斥事件的区别
相互独立事件
互斥事件
条件
事件A(或B)是否发生对事件B(或A)发生的概率没有影响
不可能同时发生的两个事件
符号
相互独立事件A,B同时发生,记作:AB
互斥事件A,B中有一个发生,记作:A∪B(或A+B)
计算公式
P(AB)=P(A)P(B)
P(A∪B)=P(A)+P(B)
1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)
(1)不可能事件与任何一个事件相互独立.( )
(2)必然事件与任何一个事件相互独立.( )
(3)如果事件A与事件B相互独立,则P(B|A)=P(B).( )
(4)“P(AB)=P(A)·P(B)”是“事件A,B相互独立”的充要条件.( )
答案:(1)√ (2)√ (3)√ (4)√
2.甲、乙两水文站同时作水文预报,如果甲站、乙站各自预报的准确率为0.8和0.7.那么,在一次预报中,甲、乙两站预报都准确的概率为________.
答案:0.56
3.一件产品要经过两道独立的工序, 第一道工序的次品率为a, 第二道工序的次品率为b, 则该产品的正品率为________.
答案:(1-a)(1-b)
4.已知A,B是相互独立事件,且P(A)=,P(B)=,则P(A)=________,P(AB)=________.
答案:
事件独立性的判断
[典例] 判断下列事件是否为相互独立事件.
(1)甲组3名男生, 2名女生; 乙组2名男生, 3名女生,现从甲、乙两组中各选1名同学参加演讲比赛, “从甲组中选出1名男生”与“从乙组中选出1名女生”.
(2)容器内盛有5个白乒乓球和3个黄乒乓球,“从8个球中任意取出1个,取出的是白球”与“从剩下的7个球中任意取出1个,取出的还是白球”.
[解] (1)“从甲组中选出1名男生”这一事件是否发生,对“从乙组中选出1名女生”这一事件是否发生没有影响,所以它们是相互独立事件.
(2)“从8个球中任意取出1个,取出的是白球”的概率为,若这一事件发生了,则“从剩下的7个球中任意取出1个,取出的仍是白球”的概率为;若前一事件没有发生,则后一事件发生的概率为,可见,前一事件是否发生,对后一事件发生的概率有影响,所以二者不是相互独立事件.
两个事件是否相互独立的判断
(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.
(2)定义法:如果事件A,B同时发生的概率等于事件A发生的概率与事件B发生的概率的积,则事件A,B为相互独立事件.
(3)条件概率法:当P(A)>0时,可用P(B|A)=P(B)判断.
[活学活用]
把一颗质地均匀的骰子任意地掷一次,判断下列各组事件是否是独立事件?
(1)A={掷出偶数点},B={掷出奇数点};
(2)A={掷出偶数点},B={掷出3的倍数点};
(3)A={掷出偶数点},B={掷出的点数小于4}.
解:(1)∵P(A)=,P(B)=,P(AB)=0,
∴A与B不是相互独立事件.
(2)∵P(A)=,P(B)=,P(AB)=,
∴P(AB)=P(A)·P(B),
∴A与B是相互独立事件.
(3)∵P(A)=,P(B)=,P(AB)=,
∴P(AB)≠P(A)·P(B),
∴A与B不是相互独立事件.
相互独立事件概率的计算
[典例] 根据资料统计, 某地车主购买甲种保险的概率为0.5,购买乙种保险的概率为0.6, 购买甲、乙保险相互独立, 各车主间相互独立.
(1)求一位车主同时购买甲、乙两种保险的概率;
(2)求一位车主购买乙种保险但不购买甲种保险的概率.
[解] 记A表示事件“购买甲种保险”,B表示事件“购买乙种保险”,则由题意得A与B,A与,与B,与都是相互独立事件,且P(A)=0.5,P(B)=0.6.
(1)记C表示事件“同时购买甲、乙两种保险”,
则C=AB,所以P(C)=P(AB)=P(A)·P(B)=0.5×0.6=0.3.
(2)记D表示事件“购买乙种保险但不购买甲种保险”,
则D=B,所以P(D)=P(B)=P()·P(B)=(1-0.5)×0.6=0.3.
[一题多变]
1.[变设问]本例中车主至少购买甲、乙两种保险中的一种的概率是多少?
解:法一:记E表示事件“至少购买甲、乙两种保险中的一种”,则事件E包括B,A,AB,且它们彼此为互斥事件.
所以P(E)=P(B+A+AB)=P(B)+P(A)+P(AB)
=0.5×0.6+0.5×0.4+0.5×0.6=0.8.
法二:事件“至少购买甲、乙两种保险中的一种”与事件“甲、乙两种保险都不购买”为对立事件.
所以P(E)=1-P(AB)=1-(1-0.5)×(1-0.6)=0.8.
2.[变条件,变设问]某同学参加科普知识竞赛,需回答三个问题.竞赛规则规定:答对第一、二、三个问题分别得100分、100分、200分,答错得零分.假设这名同学答对第一、二、三个问题的概率分别为0.8,0.7,0.6,且各题答对与否相互之间没有影响.
(1)求这名同学得300分的概率;
(2)求这名同学至少得300分的概率.
解:记“这名同学答对第i个问题”为事件Ai(i=1,2,3),则P(A1)=0.8,P(A2)=0.7,P(A3)=0.6.
(1)这名同学得300分的概率
P1=P(A12A3)+P(1A2A3)
=P(A1)P(2)P(A3)+P(1)P(A2)P(A3)
=0.8×0.3×0.6+0.2×0.7×0.6=0.228.
(2)这名同学至少得300分的概率P2=P1+P(A1A2A3)=0.228+0.8×0.7×0.6=0.564.
(1)求相互独立事件同时发生的概率的步骤是:
①首先确定各事件之间是相互独立的;
②确定这些事件可以同时发生;
③求出每个事件的概率,再求积.
(2)使用相互独立事件同时发生的概率计算公式时,要掌握公式的适用条件,即各个事件是相互独立的,而且它们同时发生.
相互独立事件概率的实际应用
[典例] 三个元件T1,T2,T3正常工作的概率分别为,,,将它们中的某两个元件并联后再和第三个元件串联接入电路,如图所示,求电路不发生故障的概率.
[解] 记“三个元件T1,T2,T3正常工作”分别为事件A1,A2,A3,则P(A1)=,P(A2)=,P(A3)=.
不发生故障的事件为(A2∪A3)A1,
∴不发生故障的概率为
P=P[(A2∪A3)A1]
=P(A2∪A3)·P(A1)
=[1-P(2)·P(3)]·P(A1)
=×=.
求较为复杂事件的概率的方法
(1)列出题中涉及的各事件,并且用适当的符号表示;
(2)理清事件之间的关系(两事件是互斥还是对立.或者是相互独立),列出关系式;
(3)根据事件之间的关系准确选取概率公式进行计算;
(4)当直接计算符合条件的事件的概率较复杂时,可先间接地计算对立事件的概率,再求出符合条件的事件的概率.
[活学活用]
某校田径队有三名短跑运动员,根据平时的训练情况统计,甲、乙、丙三人100 m跑(互不影响)的成绩在13 s内
(称为合格)的概率分别是,,,如果对这三名短跑运动员的100 m跑成绩进行一次检测.
(1)三人都合格的概率与三人都不合格的概率分别是多少?
(2)出现恰有几人合格的概率最大?
解:设“甲、乙、丙三人100 m跑合格”分别为事件A,B,C,
显然A,B,C相互独立,P(A)=,P(B)=,P(C)=,所以P()=1-=,P()=1-=,P()=1-=.
设恰有k人合格的概率为Pk(k=0,1,2,3).
(1)三人都合格的概率为
P3=P(ABC)=P(A)P(B)P(C)=××=.
三人都不合格的概率为P0=P()=P()P()P()=××=.
所以三人都合格的概率与三人都不合格的概率都是.
(2)因为AB,AC,BC两两互斥,所以恰有两人合格的概率为:P2=P(AB+AC+BC)
=P(AB)+P(AC)+P(BC)
=P(A)P(B)P()+P(A)P()P(C)+P()P(B)P(C)
=××+××+××=.
恰有一人合格的概率为P1=1-P0-P2-P3=1---==.
由(1)(2)知P0,P1,P2,P3中P1最大,所以出现恰有一人合格的概率最大.
层级一 学业水平达标
1.袋内有3个白球和2个黑球,从中不放回地摸球,用A表示“第一次摸得白球”,用B表示“第二次摸得白球”,则A与B是( )
A.互斥事件 B.相互独立事件
C.对立事件 D.不相互独立事件
解析:选D 根据互斥事件、对立事件和相互独立事件的定义可知,A与B不是相互独立事件.故选D.
2.若P(AB)=,P()=,P(B)=,则事件A与B的关系是( )
A.事件A与B互斥 B.事件A与B对立
C.事件A与B相互独立 D.事件A与B既互斥又独立
解析:选C 因为P()=,所以P(A)=,又P(B)=,P(AB)=,所以有P(AB)=P(A)P(B),所以事件A与B相互独立但不一定互斥.
3.打靶时,甲每打10次可中靶8次,乙每打10次可中靶7次,若两人同时射击,则他们同时中靶的概率是( )
A. B.
C. D.
解析:选A 由题意知P甲==,P乙=,所以P=P甲·P乙=.
4.有两名射手射击同一目标,命中的概率分别为0.8和0.7,若各射击一次,则目标被击中的概率是( )
A.0.56 B.0.92 C.0.94 D.0.96
解析:选C 设事件A表示:“甲击中”,事件B表示:“乙击中”.由题意知A,B互相独立.故目标被击中的概率为P=1-P(·)=1-P()P()=1-0.2×0.3=0.94.
5.从甲袋内摸出1个红球的概率是,从乙袋内摸出1个红球的概率是,从两袋内各摸出1个球,则等于( )
A.2个球不都是红球的概率
B.2个球都是红球的概率
C.至少有1个红球的概率
D.2个球中恰好有1个红球的概率
解析:选C 至少有1个红球的概率是×+×+×=.
6.有甲、乙两批种子,发芽率分别为0.8和0.9,在两批种子中各取一粒,则恰有一粒种子能发芽的概率是________.
解析:所求概率P=0.8×0.1+0.2×0.9=0.26.
答案:0.26
7.已知P(A)=0.3,P(B)=0.5,当事件A,B相互独立时,P(A∪B)=________,P(A|B)=________.
解析:∵A,B相互独立,∴P(A∪B)=P(A)+P(B)-P(A)·P(B)=0.3+0.5-0.3×0.5=0.65. P(A|B)=P(A)=0.3.
答案:0.65 0.3
8.设两个相互独立的事件A,B都不发生的概率为,A发生B不发生的概率等于B发生A不发生的概率,则事件A发生的概率P(A)=________.
解析:由已知可得
解得P(A)=P(B)=.
答案:
9.在同一时间内,甲、乙两个气象台独立预报天气准确的概率分别为和.求:
(1)甲、乙两个气象台同时预报天气准确的概率.
(2)至少有一个气象台预报准确的概率.
解:记“甲气象台预报天气准确”为事件A,“乙气象台预报天气准确”为事件B.显然事件A,B相互独立且P(A)=,P(B)=.
(1)P(AB)=P(A)P(B)=×=.
(2)至少有一个气象台预报准确的概率为
P=1-P(AB)=1-P()P()=1-×=.
10.已知A,B,C为三个独立事件,若事件A发生的概率是,事件B发生的概率是,事件C发生的概率是,求下列事件的概率:
(1)事件A,B,C只发生两个;
(2)事件A,B,C至多发生两个.
解:(1)记“事件A,B,C只发生两个”为A1,则事件A1包括三种彼此互斥的情况,A·B·;A··C;·B·C,由互斥事件概率的加法公式和相互独立事件的概率乘法公式,得P(A1)=P(A·B·)+P(A··C)+P(·B·C)=++=,∴事件A,B,C只发生两个的概率为.
(2)记“事件A,B,C至多发生两个”为A2,则包括彼此互斥的三种情况:事件A,B,C一个也不发生,记为A3,事件A,B,C只发生一个,记为A4,事件A,B,C只发生两个,记为A5,
故P(A2)=P(A3)+P(A4)+P(A5)=++=.
∴事件A,B,C至多发生两个的概率为.
层级二 应试能力达标
1.在某段时间内,甲地下雨的概率为0.3,乙地下雨的概率为0.4,假设在这段时间内两地是否下雨之间没有影响,则这段时间内,甲、乙两地都不下雨的概率为( )
A.0.12 B.0.88
C.0.28 D.0.42
解析:选D P=(1-0.3)(1-0.4)=0.42.
2.如图所示,在两个圆盘中,指针落在本圆盘每个数所在区域的机会均等,那么两个指针同时落在奇数所在区域的概率是( )
A. B. C. D.
解析:选A 设A表示“第一个圆盘的指针落在奇数所在的区域”,则P(A)=,B表示“第二个圆盘的指针落在奇数所在的区域”,则P(B)=.故P(AB)=P(A)·P(B)=×=.
3.荷花池中,有一只青蛙在成品字形的三片荷叶上跳来跳去(每次跳跃时,均从一片荷叶跳到另一片荷叶),而且顺时针方向跳的概率是逆时针方向跳的概率的两倍,如图所示.假设现在青蛙在A荷叶上,则跳三次之后停在A荷叶上的概率是( )
A. B.
C. D.
解析:选A 按A→B→C→A的顺序的概率为××=,按A→C→B→A的顺序的概率为××=,故跳三次之后停在A叶上的概率为P=+=.
4.如图,已知电路中4个开关闭合的概率都是,且是互相独立的,则灯亮的概率为( )
A. B.
C. D.
解析:选C 记“A,B,C,D四个开关闭合”分别为事件A,B,C,D,可用对立事件求解,图中含开关的三条线路同时断开的概率为:P()P()[1-P(AB)]=××=.∴灯亮的概率为1-=.
5.加工某零件需经过三道工序,设第一、二、三道工序的次品率分别为,,,且各道工序互不影响,则加工出来的零件的次品率为________.
解析:加工出来的零件的正品率为××=,所以次品率为1-=.
答案:
6.某次知识竞赛规则如下:在主办方预设的5个问题中,选手若能连续正确回答出两个问题,即停止答题,晋级下一轮.假设某选手正确回答每个问题的概率都是0.8,且每个问题的回答结果相互独立,则该选手恰好回答了4个问题就晋级下一轮的概率等于________.
解析:此选手恰好回答4个问题就晋级下一轮,说明此选手第2个问题回答错误,第3、第4个问题均回答正确,第1个问题答对答错都可以.因为每个问题的回答结果相互独立,故所求的概率为1×0.2×0.82=0.128.
答案:0.128
7.某项选拔共有四轮考核,每轮设有一个问题,能正确回答者进入下一轮考核,否则即被淘汰.已知某选手能正确回答第一、二、三、四轮的问题的概率分别为0.6,0.4,0.5,0.2.已知各轮问题能否正确回答互不影响.
(1)求该选手被淘汰的概率;
(2)求该选手在选拔中至少回答了2个问题后最终被淘汰的概率.
解:记“该选手能正确回答第i轮的问题”为事件Ai(i=1,2,3,4),
则P(A1)=0.6,P(A2)=0.4,P(A3)=0.5,P(A4)=0.2.
(1)法一:该选手被淘汰的概率:
P=P(1∪A12∪A1A23∪A1A2A34)
=P(1)+P(A1)P(2)+P(A1)P(A2)P(3)+
P(A1)P(A2)P(A3)P(4)=0.4+0.6×0.6+0.6×0.4×0.5+0.6×0.4×0.5×0.8=0.976.
法二:P=1-P(A1A2A3A4)=1-P(A1)P(A2)·P(A3)·P(A4)=1-0.6×0.4×0.5×0.2=1-0.024=0.976.
(2)法一:P=P(A12∪A1A23∪A1A2A34)=P(A1)P(2)+P(A1)P(A2)P(3)+P(A1)P(A2)P(A3)P(4)=0.6×0.6+0.6×0.4×0.5+0.6×0.4×0.5×0.8=0.576.
法二:P=1-P(1)-P(A1A2A3A4)=1-(1-0.6)-0.6×0.4×0.5×0.2=0.576.
8.(全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区: 73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
解:(1)两地区用户满意度评分的茎叶图如下:
通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.
(2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”;
CA2表示事件:“A地区用户的满意度等级为非常满意”;
CB1表示事件:“B地区用户的满意度等级为不满意”;
CB2表示事件:“B地区用户的满意度等级为满意”,
则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1∪CB2CA2.
P(C)=P(CB1CA1∪CB2CA2)
=P(CB1CA1)+P(CB2CA2)
=P(CB1)P(CA1)+P(CB2)P(CA2).
由所给数据得CA1,CA2,CB1,CB2发生的频率分别为,,,,故P(CA1)=,P(CA2)=,P(CB1)=,P(CB2)=,P(C)=×+×=0.48.
2.2.3 独立重复试验与二项分布
预习课本P56~57,思考并完成以下问题
1.独立重复试验及二项分布的定义分别是什么?
2.两点分布与二项分布之间有怎样的关系?
1.独立重复试验
在相同条件下重复做的n次试验称为n次独立重复试验.
2.二项分布
在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为P(X=k)=Cpk(1-p)n-k,k=0,1,2,…,n.此时称随机变量X服从二项分布,记作X~B(n,p),并称p为成功概率.
[点睛] 两点分布与二项分布的区别
两点分布
二项分布
区
别
只要两个结果,这两个结果是对立的,即要么发生,要么不发生
在每次试验中只有两个结果,这两个结果是对立的,即要么发生,要么不发生.但在n次独立重复试验中共有n+1个结果
1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)
(1)独立重复试验每次试验之间是相互独立的.( )
(2)独立重复试验每次试验只有发生与不发生两种结果.( )
(3)独立重复试验各次试验发生的事件是互斥的.( )
答案:(1)√ (2)√ (3)×
2.已知X~B,则P(X=4)=________.
答案:
3.连续掷一枚硬币5次, 恰好有3次出现正面向上的概率是________.
答案:
4.某人射击一次击中目标的概率为0.6, 经过3次射击, 此人至少有两次击中目标的概率为________.
答案:0.648
独立重复试验概率的求法
[典例] 某人射击5次,每次中靶的概率均为0.9,求他至少有2次中靶的概率.
[解] [法一 直接法]
在5次射击中恰好有2次中靶的概率为C×0.92×0.13;
在5次射击中恰好有3次中靶的概率为C×0.93×0.12;
在5次射击中恰好有4次中靶的概率为C×0.94×0.1;
在5次射击中5次均中靶的概率为C×0.95.
所以至少有2次中靶的概率为
C×0.92×0.13+C×0.93×0.12+C×0.94×0.1+C×0.95
=0.008 1+0.072 9+0.328 05+0.590 49=0.999 54.
[法二 间接法]
至少有2次中靶的对立事件是至多有1次中靶,它包括恰好有1次中靶与全没有中靶两种情况,显然这是两个互斥事件.
在5次射击中恰好有1次中靶的概率为C×0.9×0.14;
在5次射击中全没有中靶的概率为0.15,
所以至少有2次中靶的概率为
1-C×0.9×0.14-0.15=1-0.000 45-0.000 01=0.999 54.
独立重复试验概率求解的关注点
(1)解此类题常用到互斥事件概率加法公式,相互独立事件概率乘法公式及对立事件的概率公式.
(2)运用独立重复试验的概率公式求概率时,首先判断问题中涉及的试验是否为n次独立重复试验,判断时注意各次试验之间是相互独立的,并且每次试验的结果只有两种(即要么发生,要么不发生),在任何一次试验中某一事件发生的概率都相等,然后用相关公式求概率.
[活学活用]
某射手进行射击训练,假设每次射击击中目标的概率为,且每次射击的结果互不影响,已知射手射击了5次,求:
(1)其中只在第一、三、五次击中目标的概率;
(2)其中恰有3次击中目标的概率;
(3)其中恰有3次连续击中目标,而其他两次没有击中目标的概率.
解:(1)该射手射击了5次,其中只在第一、三、五次击中目标,是在确定的情况下击中目标3次,也就是在第二、四次没有击中目标,所以只有一种情况,又因为各次射击的结果互不影响,故所求概率为
P=××××=.
(2)该射手射击了5次,其中恰有3次击中目标.根据排列组合知识,5次当中选3次,共有C种情况,因为各次射击的结果互不影响,所以符合n次独立重复试验概率模型.故所求概率为
P=C×3×2=.
(3)该射手射击了5次,其中恰有3次连续击中目标,而其他两次没有击中目标,应用排列组合知识,把3次连续击中目标看成一个整体可得共有C种情况.
故所求概率为P=C·3·2=.
二项分布问题
[典例] 已知某种从太空飞船中带回来的植物种子每粒成功发芽的概率都为,某植物研究所分两个小组分别独立开展该种子的发芽试验,每次试验种一粒种子,如果某次没有发芽,则称该次试验是失败的.
(1)第一小组做了3次试验,记该小组试验成功的次数为X,求X的概率分布列.
(2)第二小组进行试验,到成功了4次为止,求在第4次成功之前共有3次失败的概率.
[解] (1)由题意,随机变量X可能取值为0,1,2,3,
则X~B.
即P(X=0)=C03=,
P(X=1)=C12=,
P(X=2)=C21=,
P(X=3)=C3=.
所以X的概率分布列为
X
0
1
2
3
P
(2)第二小组第7次试验成功,前面6次试验中有3次失败,3次成功,每次试验又是相互独立的,
因此所求概率为P=C3×3×=.
判断一个随机变量是否服从二项分布的关键
(1)对立性, 即一次试验中,事件发生与否二者必居其一.
(2)重复性, 即试验独立重复地进行了n次.
(3)随机变量是事件发生的次数.
[活学活用]
1.已知X~B,则P(X=2)=________.
解析:P(X=2)=C28=.
答案:
2.某一中学生心理咨询中心服务电话接通率为,某班3名同学商定明天分别就同一问题询问该服务中心.且每人只拨打一次,求他们中成功咨询的人数X的分布列.
解:由题意可知:X~B,
所以P(X=k)=Ck·3-k,k=0,1,2,3.
即P(X=0)=C×0×3=;
P(X=1)=C××2=;
P(X=2)=C×2×=;
P(X=3)=C×3=.
分布列为
X
0
1
2
3
P
层级一 学业水平达标
1.任意抛掷三枚硬币,恰有两枚正面朝上的概率为( )
A. B.
C. D.
解析:选B 每枚硬币正面朝上的概率为,正面朝上的次数X~B,故所求概率为C2×=.
2.在4次独立重复试验中,随机事件A恰好发生1次的概率不大于其恰好发生两次的概率,则事件A在一次试验中发生的概率p的取值范围是( )
A.[0.4,1] B.(0,0.4]
C.(0,0.6] D.[0.6,1)
解析:选A 由题意,C·p(1-p)3≤Cp2(1-p)2,∴4(1-p)≤6p,∴0.4≤p≤1.
3.袋中有红、黄、绿色球各一个,每次任取一个,有放回地抽取三次,球的颜色全相同的概率是( )
A. B.
C. D.
解析:选B 每种颜色的球被抽取的概率为,从而抽取三次,球的颜色全相同的概率为C3=3×=.
4.某电子管正品率为,次品率为,现对该批电子管进行测试,设第ξ次首次测到正品,则P(ξ=3)=( )
A.C2× B.C2×
C.2× D.2×
解析:选C ξ=3表示第3次首次测到正品,而前两次都没有测到正品,故其概率是2×,故选C.
5.在4次独立重复试验中,事件A发生的概率相同,若事件A至少发生1次的概率为,则事件A在一次试验中发生的概率为( )
A. B.
C. D.
解析:选A 设事件A在一次试验中发生的概率为p,由题意得1-Cp0(1-p)4=,所以1-p=,故p=.
6.下列事件中随机变量ξ服从二项分布的有________(填序号).
①随机变量ξ表示重复抛掷一枚骰子n次中出现点数是3的倍数的次数;
②某射手击中目标的概率为0.9,从开始射击到击中目标所需的射击次数ξ;
③有一批产品共有N件,其中M件为次品,采用有放回抽取方法,ξ表示n次抽取中出现次品的件数(M
对于②,ξ的取值是1,2,3,……,P(ξ=k)=0.9×0.1k-1(k=1,2,3,……n),显然不符合二项分布的定义,因此ξ不服从二项分布.
③和④的区别是:③是“有放回”抽取,而④是“无放回”抽取,显然④中n次试验是不独立的,因此ξ不服从二项分布,对于③有ξ~B.故应填①③.
答案:①③
7.一个病人服用某种新药后被治愈的概率为0.9,则服用这种新药的4个病人中至少3人被治愈的概率为________(用数字作答).
解析:至少3人被治愈的概率为C×(0.9)3×0.1+(0.9)4=0.947 7.
答案:0.947 7
8.设X~B(4,p),且P(X=2)=,那么一次试验成功的概率p等于________.
解析:P(X=2)=Cp2(1-p)2=,即p2(1-p)2=2·2,
解得p=或p=.
答案:或
9.某单位6个员工借助互联网开展工作,每天每个员工上网的概率是0.5(相互独立),求一天内至少3人同时上网的概率.
解:记Ar(r=0,1,2,…,6)为“r个人同时上网”这个事件,则其概率为P(Ar)=C0.5r(1-0.5)6-r=C0.56=C,“一天内至少有3人同时上网”即为事件A3∪A4∪A5∪A6,因为A3,A4,A5,A6为彼此互斥事件,所以可应用概率加法公式,得“一天内至少有3人同时上网”的概率为P=P(A3∪A4∪A5∪A6)=P(A3)+P(A4)+P(A5)+P(A6)=(C+C+C+C)=×(20+15+6+1)=.
10.某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是,遇到红灯时停留的时间都是2分钟.
(1)求这名学生在上学路上到第三个路口时首次遇到红灯的概率;
(2)求这名学生在上学路上因遇到红灯停留的总时间ξ的分布列.
解:(1)设这名学生在上学路上到第三个路口时首次遇到红灯为事件A,因为事件A等于事件“这名学生在第一和第二个路口没有遇到红灯,在第三个路口遇到红灯”,所以事件A的概率为
P(A)=××=.
(2)由题意,可得ξ可以取的值为0,2,4,6,8(单位:分钟),
事件“ξ=2k”等价于事件“该学生在路上遇到k次红灯”(k=0,1,2,3,4),
∴P(ξ=2k)=Ck4-k(k=0,1,2,3,4),
即P(ξ=0)=C×0×4=;
P(ξ=2)=C××3=;
P(ξ=4)=C×2×2=;
P(ξ=6)=C×3×=;
P(ξ=8)=C×4×0=.
∴ξ的分布列是
ξ
0
2
4
6
8
P
层级二 应试能力达标
1.在某次试验中,事件A出现的概率为p,则在n次独立重复试验中出现k次的概率为( )
A.1-pk B.(1-p)kpn-k
C.1-(1-p)k D.C(1-p)kpn-k
解析:选D 出现1次的概率为1-p,由二项分布概率公式可得出现k次的概率为C(1-p)kpn-k.
2.将一枚硬币连掷5次,如果出现k次正面的概率等于出现k+1次正面的概率,那么k的值等于( )
A.0 B.1
C.2 D.3
解析:选C 事件A=“正面向上”发生的次数ξ~B,由题设C5=C·5,∴k+k+1=5,∴k=2.
3.若随机变量ξ~B,则P(ξ=k)最大时,k的值为( )
A.1或2 B.2或3
C.3或4 D.5
解析:选A 依题意P(ξ=k)=C×k×5-k,k=0,1,2,3,4,5.
可以求得P(ξ=0)=,P(ξ=1)=,P(ξ=2)=,P(ξ=3)=,P(ξ=4)=,P(ξ=5)=.故当k=2或1时P(ξ=k)最大.
4.位于坐标原点的一个质点P按下述规则移动:质点每次移动一个单位,移动的方向为向上或向右,并且向上、向右移动的概率都是.则质点P移动5次后位于点(2,3)的概率为( )
A.5 B.C5
C.C3 D.CC5
解析:选B 质点每次只能向上或向右移动,且概率均为,所以移动5次可看成做了5次独立重复试验.质点P移动5次后位于点(2,3)(即质点在移动过程中向右移动2次,向上移动3次)的概率为C23=C5.
5.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=,则P(Y≥2)的值为________.
解析:由条件知,P(X=0)=1-P(X≥1)==Cp0(1-p)2,∴p=,∴P(Y≥2)=1-P(Y=0)-P(Y=1)=1-Cp0(1-p)4-Cp(1-p)3=1--=.
答案:
6.口袋里放有大小相同的两个红球和一个白球,有放回地每次摸取一个球,定义数列{an}:an=如果Sn为数列{an}的前n项和,那么S5=3的概率为________.
解析:由题意知有放回地摸球为独立重复试验,且试验次数为5,这5次中有1次摸得红球.每次摸取红球的概率为,所以S5=3时,概率为C·1·4=.
答案:
7.甲、乙、丙三台机床各自独立地加工同一种零件,已知甲、乙、丙三台机床加工的零件是一等品的概率分别为0.7,0.6,0.8,乙、丙两台机床加工的零件数相等,甲机床加工的零件数是乙机床加工的零件数的2倍.
(1)从甲、乙、丙三台机床加工的零件中各取一件检验,求至少有一件一等品的概率;
(2)将甲、乙、丙三台机床加工的零件混合到一起,从中任意地抽取一件检验,求它是一等品的概率;
(3)将甲、乙、丙三台机床加工的零件混合到一起,从中任意地抽取4件检验,其中一等品的个数记为X,求X的分布列.
解:(1)设从甲、乙、丙三台机床加工的零件中任取一件是一等品分别为事件A,B,C,
则P(A)=0.7,P(B)=0.6,P(C)=0.8.
所以从甲、乙、丙三台机床加工的零件中各取一件检验,至少有一件一等品的概率为
P=1-P()P()P()=1-0.3×0.4×0.2=0.976.
(2)将甲、乙、丙三台机床加工的零件混合到一起,从中任意地抽取一件检验,它是一等品的概率为
P==0.7.
(3)依题意抽取的4件样品中一等品的个数X的可能取值为0,1,2,3,4,则
P(X=0)=C×0.34=0.008 1.
P(X=1)=C×0.7×0.33=0.075 6,
P(X=2)=C×0.72×0.32=0.264 6,
P(X=3)=C×0.73×0.3=0.411 6,
P(X=4)=C×0.74=0.240 1,
∴X的分布列为
X
0
1
2
3
4
P
0.008 1
0.075 6
0.264 6
0.411 6
0.240 1
8.某市为“市中学生知识竞赛”进行选拔性测试,且规定:成绩大于或等于90分的有参赛资格,90分以下(不包括90分)的被淘汰,若有500人参加测试,学生成绩的频率分布直方图如图.
(1)求获得参赛资格的人数;
(2)根据频率直方图,估算这500名学生测试的平均成绩;
(3)若知识竞赛分初赛和复赛,在初赛中每人最多有5次选题答题的机会,累计答对3题或答错3题即终止,答对3题者方可参加复赛.已知参赛者甲答对每一个问题的概率都相同,并且相互之间没有影响.已知他前两次连续答错的概率为,求甲在初赛中答题个数ξ的分布列.
解:(1)由频率分布直方图得,获得参赛资格的人数为
500×(0.005 0+0.004 3+0.003 2)×20=125人.
(2)设500名学生的平均成绩为,则=(40×0.006 5+60×0.014 0+80×0.017 0+100×0.005 0+120×0.004 3+140×0.003 2)×20=78.48(分).
(3)设学生甲答对每道题的概率为P(A),
则(1-P(A))2=,
∴P(A)=.
学生甲答题个数ξ的可能值为3,4,5,
则P(ξ=3)=3+3=,
P(ξ=4)=C××3+C××3=,
P(ξ=5)=C×2×2=.
所以ξ的分布列为
ξ
3
4
5
P
2.3.1 离散型随机变量的均值
预习课本P60~63,思考并完成以下问题
1.什么是离散型随机变量的均值?怎么利用离散型随机变量的分布列求出均值?
2.离散型随机变量的均值有什么性质?
3.两点分布、二项分布的均值是什么?
1.离散型随机变量的均值或数学期望
若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称E(X)=x1p1+x2p2+…+xipi+…+xnpn_为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
2.离散型随机变量的均值的性质
若Y=aX+b,其中a,b为常数,则Y也是随机变量且P(Y=axi+b)=P(X=xi),i=1,2,…,n,E(Y)=E(aX+b)=aE(X)+b.
3.两点分布与二项分布的均值
(1)若X服从两点分布,则E(X)=p;
(2)若X服从二项分布,即X~B(n,p),则E(X)=np.
[点睛] 两点分布与二项分布的关系
(1)相同点:一次试验中要么发生要么不发生.
(2)不同点:①随机变量的取值不同,两点分布随机变量的取值为0,1, 二项分布中随机变量的取值X=0,1,2,…,n. ②试验次数不同,两点分布一般只有一次试验;二项分布则进行n次试验.
1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)
(1)随机变量X的数学期望E(X)是个变量,其随X的变化而变化.( )
(2)随机变量的均值与样本的平均值相同.( )
(3)若随机变量ξ的数学期望E(ξ)=3,则E(4ξ-5)=7.( )
答案:(1)× (2)× (3)√
2.已知离散型随机变量X的分布列为
X
1
2
3
P
则X的数学期望E(X)=( )
A. B.2
C. D.3
答案:A
3.设随机变量X~B(16,p), 且E(X)=4, 则p=________.
答案:
4.一名射手每次射击中靶的概率均为0.8, 则他独立射击3次中靶次数X的均值为________.
答案:2.4
求离散型随机变量的均值
[典例] 某种有奖销售的饮料,瓶盖内印有“奖励一瓶”或“谢谢购买”字样,购买一瓶若其瓶盖内印有“奖励一瓶”字样即为中奖,中奖概率为.甲、乙、丙三位同学每人购买了一瓶该饮料.
(1)求甲中奖且乙、丙都没有中奖的概率;
(2)求中奖人数ξ的分布列及均值E(ξ).
[解] (1)设甲、乙、丙中奖的事件分别为A,B,C,那么
P(A)=P(B)=P(C)=.
P(A··)=P(A)P()P()=××=.
故甲中奖且乙、丙都没有中奖的概率是.
(2)ξ的可能取值为0,1,2,3.
P(ξ=k)=Ck3-k,k=0,1,2,3.
P(ξ=0)=C×0×3=;
P(ξ=1)=C××2=;
P(ξ=2)=C×2×=,
P(ξ=3)=C×3×0=.
所以中奖人数ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=.
求离散型随机变量的均值的步骤
(1)确定取值:根据随机变量X的意义,写出X可能取得的全部值;
(2)求概率:求X取每个值的概率;
(3)写分布列:写出X的分布列;
(4)求均值:由均值的定义求出E(X).
其中写出随机变量的分布列是求解此类问题的关键所在.
[活学活用]
1.甲、乙两人各进行3次射击, 甲每次击中目标的概率为, 乙每次击中目标的概率为, 记甲击中目标的次数为X, 乙击中目标的次数为Y,
(1)求X的概率分布列;
(2)求X和Y的数学期望.
解:(1)已知X的所有可能取值为0,1,2,3.
P(X=k)=Ck3-k.
则P(X=0)=C×3=;
P(X=1)=C××2=;
P(X=2)=C×2×=;
P(X=3)=C×3=.
所以X的概率分布列如下表:
X
0
1
2
3
P
(2)由(1)知E(X)=0×+1×+2×+3×=1.5,或由题意X~B,Y~B,
∴E(X)=3×=1.5,E(Y)=3×=2.
2.某运动员投篮投中的概率P=0.6.
(1)求一次投篮时投中次数ξ的数学期望.
(2)求重复5次投篮时投中次数η的数学期望.
解:(1)ξ的分布列为:
ξ
0
1
P
0.4
0.6
则E(ξ)=0×0.4+1×0.6=0.6,
即一次投篮时投中次数ξ的数学期望为0.6.
(2)η服从二项分布,即η~B(5,0.6).
∴E(η)=np=5×0.6=3,
即重复5次投篮时投中次数η的数学期望为3.
离散型随机变量均值的性质
[典例] 已知随机变量X的分布列为:
X
-2
-1
0
1
2
P
m
若Y=-2X,则E(Y)=________.
[解析] 由随机变量分布列的性质, 得
+++m+=1, 解得m=,
∴E(X)=(-2)×+(-1)×+0×+1×+2×=-.
由Y=-2X,得E(Y)=-2E(X),
即E(Y)=-2×=.
[答案]
[一题多变]
1.[变设问]本例条件不变,若Y=2X-3, 求E(Y).
解:由公式E(aX+b)=aE(X)+b及E(X)=-得,
E(Y)=E(2X-3)=2E(X)-3=2×-3=-.
2.[变条件,变设问]本例条件不变, 若ξ=aX+3, 且E(ξ)=-, 求a的值.
解:∵E(ξ)=E(aX+3)=aE(X)+3=-a+3=-,
∴a=15.
与离散型随机变量性质有关问题的解题思路
若给出的随机变量ξ与X的关系为ξ=aX+b,a,b为常数.一般思路是先求出E(X),再利用公式E(aX+b)=aE(X)+b求E(ξ).也可以利用ξ的分布列得到η的分布列,关键由ξ的取值计算η的取值,对应的概率相等,再由定义法求得E(η).
均值的实际应用
[典例] 某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为
ξ
1
2
3
4
5
P
0.4
0.2
0.2
0.1
0.1
商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.
(1)求事件A“购买该商品的3位顾客中,至少有1位采用1期付款”的概率P(A);
(2)求η的分布列及均值E(η).
[解] (1)由A表示事件“购买该商品的3位顾客中至少有1位采用1期付款”知,表示事件“购买该商品的3位顾客中无人采用1期付款”.
P()=(1-0.4)3=0.216,
P(A)=1-P()=1-0.216=0.784.
(2)η的可能取值为200元,250元,300元.
P(η=200)=P(ξ=1)=0.4,
P(η=250)=P(ξ=2)+P(ξ=3)=0.2+0.2=0.4,
P(η=300)=P(ξ=4)+P(ξ=5)=0.1+0.1=0.2,
因此η的分布列为
η
200
250
300
P
0.4
0.4
0.2
E(η)=200×0.4+250×0.4+300×0.2=240(元).
1.实际问题中的均值问题
均值在实际中有着广泛的应用,如在体育比赛的安排和成绩预测,消费预测,工程方案的预测,产品合格率的预测,投资收益等,都可以通过随机变量的均值来进行估计.
2.概率模型的解答步骤
(1)审题,确定实际问题是哪一种概率模型,可能用到的事件类型,所用的公式有哪些.
(2)确定随机变量的分布列,计算随机变量的均值.
(3)对照实际意义,回答概率、均值等所表示的结论.
[活学活用]
甲、乙两人轮流投篮,每人每次投一球.约定甲先投且先投中者获胜,一直到有人获胜或每人都已投球3次时投篮结束.设甲每次投篮投中的概率为,乙每次投篮投中的概率为,且各次投篮互不影响.求投篮结束时甲的投球次数ξ的分布列与数学期望.
解:设Ak,Bk分别表示甲、乙在第k次投篮投中,
则P(Ak)=,P(Bk)=,(k=1,2,3).
ξ的所有可能值为1,2,3.
由独立性知
P(ξ=1)=P(A1)+P(1B1)=+×=,
P(ξ=2)=P(11A2)+P(112B2)=××+2×2=,
P(ξ=3)=P(1122)=2×2=.
综上知,ξ的分布列为
ξ
1
2
3
P
数学期望为E(ξ)=1×+2×+3×=.
层级一 学业水平达标
1.若X是一个随机变量,则E(X-E(X))的值为( )
A.无法求 B.0
C.E(X) D.2E(X)
解析:选B ∵E(aX+b)=aE(X)+b,而E(X)为常数,∴E(X-E(X))=E(X)-E(X)=0.
2.若随机变量ξ的分布列如下表所示,则E(ξ)的值为( )
ξ
0
1
2
3
4
5
P
2x
3x
7x
2x
3x
x
A. B.
C. D.
解析:选C 根据概率和为1,可得x=,E(ξ)=0×2x+1×3x+2×7x+3×2x+4×3x+5×x=40x=.
3.某射击运动员在比赛中每次击中10环得1分,击不中10环得0分.已知他击中10环的概率为0.8,则射击一次得分X的期望是( )
A.0.2 B.0.8
C.1 D.0
解析:选B 因为P(X=1)=0.8,P(X=0)=0.2,所以E(X)=1×0.8+0×0.2=0.8.
4.某班有的学生数学成绩优秀,如果从班中随机地找出5名学生,那么其中数学成绩优秀的学生数ξ~B,则E(-ξ)的值为( )
A. B.-
C. D.-
解析:选D ∵E(ξ)=5×=,∴E(-ξ)=-E(ξ)=-,故选D.
5.有10件产品,其中3件是次品,从中任取2件,用X表示取到次品的个数,则E(X)等于( )
A. B.
C. D.1
解析:选A X的可能取值为0,1,2,P(X=0)==,P(X=1)==,P(X=2)==.所以E(X)=1×+2×=.
6.一射手对靶射击,直到第一次命中为止,每次命中的概率为0.6,现有4颗子弹,命中后的剩余子弹数目X的数学期望为________.
解析:X的可能取值为3,2,1,0,
P(X=3)=0.6;P(X=2)=0.4×0.6=0.24;
P(X=1)=0.42×0.6=0.096;
P(X=0)=0.43=0.064.
所以E(X)=3×0.6+2×0.24+1×0.096+0×0.064
=2.376.
答案:2.376
7.设离散型随机变量X可能的取值为1,2,3,P(X=k)=ak+b(k=1,2,3).又X的均值E(X)=3,则a+b=________.
解析:∵P(X=1)=a+b,P(X=2)=2a+b,P(X=3)=3a+b,
∴E(X)=1×(a+b)+2×(2a+b)+3×(3a+b)=3,
∴14a+6b=3.①
又∵(a+b)+(2a+b)+(3a+b)=1,
∴6a+3b=1.②
∴由①②可知a=,b=-,∴a+b=-.
答案:-
8.某次考试中,第一大题由12个选择题组成,每题选对得5分,不选或错选得0分.小王选对每题的概率为0.8,则其第一大题得分的均值为________.
解析:设小王选对的个数为X,得分为Y=5X,
则X~B(12,0.8),E(X)=np=12×0.8=9.6,
E(Y)=E(5X)=5E(X)=5×9.6=48.
答案:48
9.盒中装有5节同品牌的五号电池,其中混有2节废电池,现在无放回地每次取一节电池检验,直到取到好电池为止.
求:(1)抽取次数X的分布列;
(2)平均抽取多少次可取到好电池.
解:(1)由题意知,X取值为1,2,3.
P(X=1)=;
P(X=2)=×=;
P(X=3)=×=.
所以X的分布列为
X
1
2
3
P
(2)E(X)=1×+2×+3×=1.5,
即平均抽取1.5次可取到好电池.
10.如图所示是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图.
(1)求直方图中x的值;
(2)若将频率视为概率,从这个城市随机抽取3位居民(看作有放回的抽样),求月均用水量在3至4吨的居民数X的分布列和数学期望.
解:(1)依题意及频率分布直方图知,0.02+0.1+x+0.37+0.39=1,解得x=0.12.
(2)由题意知,X~B(3,0.1).
因此P(X=0)=C×0.93=0.729;
P(X=1)=C×0.1×0.92=0.243;
P(X=2)=C×0.12×0.9=0.027;
P(X=3)=C×0.13=0.001.
故随机变量X的分布列为
X
0
1
2
3
P
0.729
0.243
0.027
0.001
故X的数学期望为E(X)=3×0.1=0.3.
层级二 应试能力达标1.已知随机变量ξ的分布列为
ξ
-1
0
1
P
m
若η=aξ+3,E(η)=,则a=( )
A.1 B.2
C.3 D.4
解析:选B 由分布列的性质得++m=1,
∴m=.
∴E(ξ)=-1×+0×+1×=-.
∴E(η)=E(aξ+3)=aE(ξ)+3=-a+3=,∴a=2.
2.已知抛物线y=ax2+bx+c(a≠0)的对称轴在y轴的左侧,其中a,b,c∈{-3,-2,-1,0,1,2,3},在这些抛物线中,记随机变量ξ=|a-b|的取值,则ξ的数学期望E(ξ)为( )
A. B.
C. D.
解析:选A ∵抛物线的对称轴在y轴的左侧,∴-<0,即>0,∴a与b同号.∴ξ的分布列为
ξ
0
1
2
P
∴E(ξ)=0×+1×+2×=.
3.设口袋中有黑球、白球共7个,从中任取2个球,已知取到白球个数的数学期望值为,则口袋中白球的个数为( )
A.3 B.4
C.5 D.2
解析:选A 设白球x个,则黑球7-x个,取出的2个球中所含白球个数为ξ,则ξ取值0,1,2,
P(ξ=0)==,
P(ξ=1)==,
P(ξ=2)==,
∴0×+1×+2×=,解得x=3.
4.甲、乙两台自动车床生产同种标准件,ξ表示甲车床生产1 000件产品中的次品数,η表示乙车床生产1 000件产品中的次品数,经一段时间考察,ξ,η的分布列分别是:
ξ
0
1
2
3
P
0.7
0.1
0.1
0.1
η
0
1
2
3
P
0.5
0.3
0.2
0
据此判定( )
A.甲比乙质量好 B.乙比甲质量好
C.甲与乙质量相同 D.无法判定
解析:选A E(ξ)=0×0.7+1×0.1+2×0.1+3×0.1=0.6,
E(η)=0×0.5+1×0.3+2×0.2+3×0=0.7.
∵E(η)>E(ξ),故甲比乙质量好.
5.设p为非负实数,随机变量X的概率分布为:
X
0
1
2
P
-p
p
则E(X)的最大值为________.
解析:由表可得从而得P∈,期望值E(X)=0×+1×p+2×=p+1,当且仅当p=时,E(X)最大值=.
答案:
6.节日期间,某种鲜花的进价是每束2.5元,售价是每束5元,节后对没有卖出的鲜花以每束1.6元处理.根据前5年节日期间对这种鲜花需求量ξ(束)的统计(如下表),若进这种鲜花500束在今年节日期间销售,则利润的均值是________元.
ξ
200
300
400
500
P
0.20
0.35
0.30
0.15
解析:节日期间这种鲜花需求量的均值为E(ξ)=200×0.20+300×0.35+400×0.30+500×0.15=340(束).
设利润为η,则η=5ξ+1.6×(500-ξ)-500×2.5=3.4ξ-450,
所以E(η)=3.4E(ξ)-450=3.4×340-450=706(元).
答案:706
7.(重庆高考)端午节吃粽子是我国的传统习俗.设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同.从中任意选取3个.
(1)求三种粽子各取到1个的概率;
(2)设X表示取到的豆沙粽个数,求X的分布列与数学期望.
解:(1)令A表示事件“三种粽子各取到1个”,则由古典概型的概率计算公式有P(A)==.
(2)X的所有可能值为0,1,2,且
P(X=0)==,P(X=1)==,
P(X=2)==.
综上知,X的分布列为
X
0
1
2
P
故E(X)=0×+1×+2×=(个).
8.购买某种保险,每个投保人每年度向保险公司交纳保费a元,若投保人在购买保险的一年度内出险,则可以获得10 000元的赔偿金.假定在一年度内有10 000人购买了这种保险,且各投保人是否出险相互独立.已知保险公司在一年度内至少支付赔偿金10 000元的概率为1-0.999104.
(1)求一投保人在一年度内出险的概率p;
(2)设保险公司开办该项险种业务除赔偿金外的成本为50 000 元,为保证盈利的期望不小于0,求每位投保人应交纳的最低保费(单位:元).
解:各投保人是否出险相互独立,且出险的概率都是p,记投保的10 000人中出险的人数为ξ,则ξ~B(104,p).
(1)记A表示事件:保险公司为该险种至少支付10 000元赔偿金,则发生当且仅当ξ=0,P(A)=1-P()=1-P(ξ=0)=1-(1-p)104,
又P(A)=1-0.999104,故p=0.001.
(2)该险种总收入为104a元,支出是赔偿金总额与成本的和.
支出:104ξ+5×104,
盈利:η=104a-(104ξ+5×104),
由ξ~B(104,10-3)知,E(ξ)=10,
E(η)=104a-104E(ξ)-5×104
=104a-105-5×104.
由E(η)≥0?104a-105-5×104≥0?a-10-5≥0?a≥15(元).
故每位投保人应交纳的最低保费为15元.
2.3.2 离散型随机变量的方差
预习课本P64~67,思考并完成以下问题
1.离散型随机变量的方差及标准差的定义是什么?
2.方差具有哪些性质?
3.两点分布与二项分布的方差分别是什么?
1.离散型随机变量的方差
(1)设离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称D(X)=(xi-E(X))2pi为随机变量X的方差,其算术平方根为随机变量X的标准差.
(2)随机变量的方差和标准差都反映了随机变量取值偏离于均值的平均程度,方差或标准差越小,则随机变量偏离于均值的平均程度越小.
2.几个常见的结论
(1)D(aX+b)=a2D(X).
(2)若X服从两点分布,则D(X)=p(1-p).
(3)若X~B(n,p),则D(X)=np(1-p).
1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)
(1)离散型随机变量的方差越大, 随机变量越稳定.( )
(2)若a是常数, 则D(a)=0.( )
(3)离散型随机变量的方差反映了随机变量偏离于期望的平均程度.( )
答案:(1)× (2)√ (3)√
2.若随机变量X服从两点分布, 且成功的概率p=0.5, 则E(X)和D(X)分别为( )
A.0.5和0.25 B.0.5和0.75
C.1和0.25 D.1和0.75
答案:A
3.D(ξ-D(ξ))的值为( )
A.无法求 B.0
C.D(ξ) D.2D(ξ)
答案:C
4.牧场的10头牛,因误食疯牛病毒污染的饲料被感染,已知该病的发病率为0.02,设发病牛的头数为X,则D(X)等于________.
答案:0.196
求离散型随机变量的方差
题点一:用定义求离散型随机变量的方差
1.已知随机变量X的分布列为:
X
0
1
2
3
4
5
P
0.1
0.15
0.25
0.25
0.15
0.1
则D(X)=________.
解析:因为E(X)=0.1×0+0.15×1+0.25×2+0.25×3+0.15×4+0.1×5=2.5,
所以D(X)=(0-2.5)2×0.1+(1-2.5)2×0.15+(2-2.5)2×0.25+(3-2.5)2×0.25+(4-2.5)2×0.15+(5-2.5)2×0.1=2.05.
答案:2.05
题点二:两点分布的方差
2.某运动员投篮命中率p=0.8,则该运动员在一次投篮中命中次数ξ的方差为________.
解析:依题意知:ξ 服从两点分布,
所以D(ξ)=0.8×(1-0.8)=0.16.
答案:0.16
题点三:二项分布的方差
3.一出租车司机从某饭店到火车站途中有6个交通岗, 假设他在各交通岗遇到红灯这一事件是相互独立的, 并且概率是.
(1)求这位司机遇到红灯数ξ的期望与方差;
(2)若遇上红灯, 则需等待30秒, 求司机总共等待时间η的期望与方差.
解:(1)易知司机遇上红灯次数ξ服从二项分布,且ξ~B,
∴E(ξ)=6×=2,D(ξ)=6××=.
(2)由已知η=30ξ,
∴E(η)=30E(ξ)=60,D(η)=900D(ξ)=1 200.
求离散型随机变量X的方差的步骤
(1)理解X的意义,写出X可能取的全部值;
(2)求X取各个值的概率,写出分布列;
(3)根据分布列,由期望的定义求出E(X);
(4)根据公式计算方差.
离散型随机变量方差的性质
[典例] 已知随机变量X的分布列是
X
0
1
2
3
4
P
0.2
0.2
0.3
0.2
0.1
试求D(X)和D(2X-1).
[解] E(X)=0×0.2+1×0.2+2×0.3+3×0.2+4×0.1=1.8.
∴D(X)=(0-1.8)2×0.2+(1-1.8)2×0.2+(2-1.8)2×0.3+(3-1.8)2×0.2+(4-1.8)2×0.1=1.56.
利用方差的性质D(aX+b)=a2D(X).
∵D(X)=1.56, ∴D(2X-1)=4D(X)=4×1.56=6.24.
求随机变量函数Y=aX+b方差的方法
求随机变量函数Y=aX+b的方差,一是先求Y的分布列,再求其均值,最后求方差;二是应用公式D(aX+b)=a2D(X)求解.
[活学活用]
已知随机变量ξ的分布列为:
ξ
0
1
x
P
p
若E(ξ)=.
(1)求D(ξ)的值;
(2)若η=3ξ-2,求的值.
解:由分布列的性质,得++p=1,解得p=,
∵E(ξ)=0×+1×+x=, ∴x=2.
(1)D(ξ)=2×+2×+2×==.
(2)∵η=3ξ-2,
∴D(η)=D(3ξ-2)=9D(ξ)=5,∴=.
方差的实际问题
[典例] 为选拔奥运会射击选手,对甲、乙两名射手进行选拔测试.已知甲、乙两名射手在一次射击中的得分为两个相互独立的随机变量ξ,η,甲、乙两名射手在每次射击中击中的环数均大于6环,且甲射中的10,9,8,7环的概率分别为0.5,3a,a,0.1,乙射中10,9,8环的概率分别为0.3,0.3,0.2.
(1)求ξ,η的分布列;
(2)求ξ,η的数学期望与方差,并以此比较甲、乙的射击技术并从中选拔一人.
[解] (1)依题意,0.5+3a+a+0.1=1,解得a=0.1.
∵乙射中10,9,8环的概率分别为0.3,0.3,0.2,
∴乙射中7环的概率为1-(0.3+0.3+0.2)=0.2.
∴ξ,η的分布列分别为
ξ
10
9
8
7
P
0.5
0.3
0.1
0.1
η
10
9
8
7
P
0.3
0.3
0.2
0.2
(2)由(1)可得
E(ξ)=10×0.5+9×0.3+8×0.1+7×0.1=9.2(环);
E(η)=10×0.3+9×0.3+8×0.2+7×0.2=8.7(环);
D(ξ)=(10-9.2)2×0.5+(9-9.2)2×0.3+(8-9.2)2×0.1+(7-9.2)2×0.1=0.96;
D(η)=(10-8.7)2×0.3+(9-8.7)2×0.3+(8-8.7)2×0.2+(7-8.7)2×0.2=1.21.
由于E(ξ)>E(η),说明甲平均射中的环数比乙高;
又因为D(ξ)
利用均值和方差的意义解决实际问题的步骤
(1)比较均值:离散型随机变量的均值反映了离散型随机变量取值的平均水平, 因此, 在实际决策问题中, 需先计算均值,看一下谁的平均水平高.
(2)在均值相等的情况下计算方差:方差反映了离散型随机变量取值的稳定与波动、集中与离散的程度. 通过计算方差,分析一下谁的水平发挥相对稳定.
(3)下结论:依据均值和方差的几何意义做出结论.
[活学活用]
甲、乙两个野生动物保护区有相同的自然环境,且野生动物的种类和数量也大致相等,而两个保护区内每个季度发现违反保护条例的事件次数的分布列分别为:
甲保护区:
X
0
1
2
3
P
0.3
0.3
0.2
0.2
乙保护区:
Y
0
1
2
P
0.1
0.5
0.4
试评定这两个保护区的管理水平.
解:甲保护区违规次数X的数学期望和方差为
E(X)=0×0.3+1×0.3+2×0.2+3×0.2=1.3,
D(X)=(0-1.3)2×0.3+(1-1.3)2×0.3+(2-1.3)2×0.2+(3-1.3)2×0.2=1.21.
乙保护区的违规次数Y的数学期望和方差为:
E(Y)=0×0.1+1×0.5+2×0.4=1.3,
D(Y)=(0-1.3)2×0.1+(1-1.3)2×0.5+(2-1.3)2×0.4=0.41.
因为E(X)=E(Y),D(X)>D(Y),所以两个保护区内每个季度发生的违规事件的平均次数相同,但甲保护区的违规事件次数相对分散和波动,乙保护区内的违规事件次数更加集中和稳定.
层级一 学业水平达标
1.有甲、乙两种水稻,测得每种水稻各10株的分蘖数据,计算出样本方差分别为D(X甲)=11,D(X乙)=3.4.由此可以估计( )
A.甲种水稻比乙种水稻分蘖整齐
B.乙种水稻比甲种水稻分蘖整齐
C.甲、乙两种水稻分蘖整齐程度相同
D.甲、乙两种水稻分蘖整齐程度不能比较
解析:选B ∵D(X甲)>D(X乙),∴乙种水稻比甲种水稻分蘖整齐.
2.若X~B(n,p),且E(X)=6,D(X)=3,则P(X=1)的值为( )
A.3·2-2 B.2-4
C.3·2-10 D.2-8
解析:选C E(X)=np=6,D(X)=np(1-p)=3,
∴p=,n=12,则P(X=1)=C××11=3·2-10.
3.设随机变量X的概率分布列为P(X=k)=pk·(1-p)1-k(k=0,1),则E(X),D(X)的值分别是( )
A.0和1 B.p和p2
C.p和1-p D.p和(1-p)p
解析:选D 由X的分布列知,P(X=0)=1-p,P(X=1)=p,故E(X)=0×(1-p)+1×p=p,易知X服从两点分布,∴D(X)=p(1-p).
4.已知随机变量X+η=8,若X~B(10,0.6),则E(η),D(η)分别是( )
A.6和2.4 B.2和2.4
C.2和5.6 D.6和5.6
解析:选B ∵X~B(10,0.6),∴E(X)=10×0.6=6,D(X)=10×0.6×(1-0.6)=2.4,
∴E(η)=8-E(X)=2,D(η)=(-1)2D(X)=2.4.
5.设10≤x1
B.D(ξ1)=D(ξ2)
C.D(ξ1)
解析:选A 由题意可知E(ξ1)=E(ξ2),又由题意可知,ξ1的波动性较大,从而有D(ξ1)>D(ξ2).
6.若事件在一次试验中发生次数的方差等于0.25,则该事件在一次试验中发生的概率为________.
解析:事件在一次试验中发生次数记为ξ,则ξ服从两点分布,则D(ξ)=p(1-p),所以p(1-p)=0.25,解得p=0.5.
答案:0.5
7已知随机变量X服从二项分布B(n,p).若E(X)=30,D(X)=20,则p=________.
解析:由E(X)=30,D(X)=20,可得
解得p=.
答案:
8.已知离散型随机变量X的分布列如下表:
X
-1
0
1
2
P
a
b
c
若E(X)=0,D(X)=1,则a=________,b=________.
解析:由题意
解得a=,b=c=.
答案:
9.A,B两个投资项目的利润率分别为随机变量X1和X2,根据市场分析,X1和X2的分布列分别为
X1
5%
10%
P
0.8
0.2
X2
2%
8%
12%
P
0.2
0.5
0.3
在A,B两个项目上各投资100万元,Y1和Y2分别表示投资项目A和B所获得的利润,求方差D(Y1),D(Y2).
解:由题设可知Y1和Y2的分布列分别为
Y1
5
10
P
0.8
0.2
Y2
2
8
12
P
0.2
0.5
0.3
E(Y1)=5×0.8+10×0.2=6,
D(Y1)=(5-6)2×0.8+(10-6)2×0.2=4;
E(Y2)=2×0.2+8×0.5+12×0.3=8,
D(Y2)=(2-8)2×0.2+(8-8)2×0.5+(12-8)2×0.3=12.
10.根据以往统计资料,某地车主购买甲种保险的概率为0.5,购买乙种保险但不购买甲种保险的概率为0.3.设各车主购买保险相互独立.
(1)求该地1位车主至少购买甲、乙两种保险中的1种的概率;
(2)X表示该地的100位车主中,甲、乙两种保险都不购买的车主数,求X的均值和方差.
解:设事件A表示“该地的1位车主购买甲种保险”,事件B表示“该地的1位车主购买乙种保险但不购买甲种保险”,事件C表示“该地的1位车主至少购买甲、乙两种保险中的1种”,事件D表示“该地的1位车主甲、乙两种保险都不购买”,则A,B相互独立.
(1)由题意知P(A)=0.5,P(B)=0.3,C=A∪B,
则P(C)=P(A∪B)=P(A)+P(B)=0.8.
(2)D=,P(D)=1-P(C)=1-0.8=0.2.
由题意知X~B(100,0.2),
所以均值E(X)=100×0.2=20,方差D(X)=100×0.2×0.8=16.
层级二 应试能力达标
1.设二项分布X~B(n,p)的随机变量X的均值与方差分别是2.4和1.44,则二项分布的参数n,p的值为( )
A.n=4,p=0.6 B.n=6,p=0.4
C.n=8,p=0.3 D.n=24,p=0.1
解析:选B 由题意得,np=2.4,np(1-p)=1.44,
∴1-p=0.6,∴p=0.4,n=6.
2.若ξ是离散型随机变量,P(ξ=x1)=,P(ξ=x2)=,且x1
C.3 D.
解析:选C
x1,x2满足
解得或∵x1
A.100,90 B.100,180
C.200,180 D.200,360
解析:选D 由题意可知播种了1 000粒,没有发芽的种子数ξ服从二项分布,即ξ~B(1 000,0.1).而每粒需再补种2粒,补种的种子数记为X,故X=2ξ,则E(X)=2E(ξ)=2×1 000×0.1=200,故方差为D(X)=D(2ξ)=22·D(ξ)=4×1 000×0.1×0.9=360.
4.若随机变量ξ的分布列为P(ξ=m)=,P(ξ=n)=a,若E(ξ)=2,则D(ξ)的最小值等于( )
A.0 B.1
C.4 D.2
解析:选A 由分布列的性质,得a+=1,a=.
∵E(ξ)=2,∴+=2.∴m=6-2n.
∴D(ξ)=×(m-2)2+×(n-2)2=×(n-2)2+×(6-2n-2)2=2n2-8n+8=2(n-2)2.
∴n=2时,D(ξ)取最小值0.
5.随机变量ξ的取值为0,1,2.若P(ξ=0)=,E(ξ)=1,则D(ξ)=________.
解析:由题意设P(ξ=1)=p,
则ξ的分布列如下:
ξ
0
1
2
P
p
-p
由E(ξ)=1,可得p=,
所以D(ξ)=12×+02×+12×=.
答案:
6.已知离散型随机变量X的可能取值为x1=-1,x2=0,x3=1,且E(X)=0.1,D(X)=0.89,则对应x1,x2,x3的概率p1,p2,p3分别为________,________,________.
解析:由题意知,-p1+p3=0.1,
1.21p1+0.01p2+0.81p3=0.89.
又p1+p2+p3=1,解得p1=0.4,p2=0.1,p3=0.5.
答案:0.4 0.1 0.5
7.有甲、乙两个建材厂,都想投标参加某重点建设项目,为了对重点建设项目负责,政府到两建材厂抽样验查,他们从中各取等量的样本检查它们的抗拉强度指数如下:
ξ
110
120
125
130
135
P
0.1
0.2
0.4
0.1
0.2
η
100
115
125
130
145
P
0.1
0.2
0.4
0.1
0.2
其中ξ和η分别表示甲、乙两厂材料的抗拉强度,比较甲、乙两厂材料哪一种稳定性好.
解:E(ξ)=110×0.1+120×0.2+125×0.4+130×0.1+135×0.2=125,
E(η)=100×0.1+115×0.2+125×0.4+130×0.1+145×0.2=125,
D(ξ)=0.1×(110-125)2+0.2×(120-125)2+0.4×(125-125)2+0.1×(130-125)2+0.2×(135-125)2=50,
D(η)=0.1×(100-125)2+0.2×(115-125)2+0.4×(125-125)2+0.1×(130-125)2+0.2×(145-125)2=165,
由于E(ξ)=E(η),D(ξ)
(1)求X的分布列、均值及方差;
(2)求Y的分布列、均值及方差.
解:(1)X的可能值为0,1,2.
若X=0,表示没有取出次品,
其概率为P(X=0)==,
同理,有P(X=1)==,
P(X=2)==.
∴X的分布列为
X
0
1
2
P
∴E(X)=0×+1×+2×=.
D(X)=2×+2×+2×=.
(2)Y的可能值为1,2,3,显然X+Y=3.
P(Y=1)=P(X=2)=,
P(Y=2)=P(X=1)=,
P(Y=3)=P(X=0)=.
∴Y的分布列为
Y
1
2
3
P
∴Y=-X+3,
∴E(Y)=E(3-X)=3-E(X)=3-=,
D(Y)=(-1)2D(X)=.
预习课本P70~74,思考并完成以下问题
1.什么是正态曲线和正态分布?
2.正态曲线有什么特点?
3.正态曲线φμ,σ(x)中参数μ,σ的意义是什么?
1.正态曲线及其性质
(1)正态曲线:
函数φμ,σ(x)=e-,x∈(-∞,+∞),其中实数μ,σ(σ>0)为参数,我们称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线.
(2)正态曲线的特点:
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图所示.
[点睛] 正态曲线φμ,σ(x)中,参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值E(X)去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计.
2.正态分布
(1)如果对于任何实数a,b(a(2)正态分布完全由参数μ和σ确定,因此正态分布常记作N(μ,σ2).如果随机变量X服从正态分布,则记为X~N(μ,σ2).
3.正态变量在三个特殊区间内取值的概率
(1)P(μ-σ
(1)函数φμ,σ(x)中参数μ,σ的意义分别是样本的均值与方差.( )
(2)正态曲线是单峰的,其与x轴围成的面积是随参数μ,σ的变化而变化的.( )
(3)正态曲线可以关于y轴对称.( )
答案:(1)× (2)× (3)√
2.若ξ~N,η=6ξ,则E(η)等于( )
A.1 B. C.6 D.36
答案:C
3.设随机变量ξ~N(μ,σ2), 且P(ξ≤c)=P(ξ>c), 则c等于( )
A.0 B.σ C.-μ D.μ
答案:D
正态曲线及其性质
[典例] 某次我市高三教学质量检测中, 甲、乙、丙三科考试成绩的直方图如图所示(由于人数众多, 成绩分布的直方图可视为正态分布), 则由如图曲线可得下列说法中正确的一项是( )
A.甲科总体的标准差最小
B.丙科总体的平均数最小
C.乙科总体的标准差及平均数都居中
D.甲、乙、丙的总体的平均数不相同
[解析] 由题中图象可知三科总体的平均数(均值)相等, 由正态密度曲线的性质,可知σ越大, 正态曲线越扁平;σ越小, 正态曲线越尖陡, 故三科总体的标准差从小到大依次为甲、乙、丙. 故选A.
[答案] A
利用正态曲线的性质可以求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此性质结合图象求μ.
(2)正态曲线在x=μ处达到峰值,由此性质结合图象可求σ.
(3)由σ的大小区分曲线的胖瘦.
[活学活用]
若一个正态分布密度函数是一个偶函数,且该函数的最大值为,求该正态分布的概率密度函数的解析式.
解:由于该正态分布的概率密度函数是一个偶函数,
所以正态曲线关于y轴对称,即μ=0,而正态分布的概率密度函数的最大值是,所以=,
解得σ=4.
故函数的解析式为φμ,σ(x)=·e-,x∈(-∞,+∞).
利用正态分布的对称性求概率
[典例] 设X~N(1,22),试求:
(1)P(-1<X≤3);(2)P(3<X≤5).
[解] 因为X~N(1,22),所以μ=1,σ=2.
(1)P(-1<X≤3)=P(1-2<X≤1+2)
=P(μ-σ<X≤μ+σ)=0.682 6.
(2)因为P(3<X≤5)=P(-3
=[P(1-4<X≤1+4)-P(1-2<X≤1+2)]
=[P(μ-2σ<X≤μ+2σ)-P(μ-σ<X≤μ+σ)]
=(0.954 4-0.682 6)=0.135 9.
正态变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和曲线与x轴之间面积为1.
(2)熟记P(μ-σ
①P(X②P(X<μ-a)=P(X≥μ+a);
③若b<μ,则P(X[活学活用]
1.已知随机变量X~N(2,σ2),若P(X解析:由正态分布图象的对称性可得:
P(a≤X<4-a)=1-2P(X答案:0.36
2.设随机变量X~N(2,9),若P(X>c+1)=P(X
(2)求P(-4
∵P(X>c+1)=P(X
[典例] 在某次数学考试中,考生的成绩X服从一个正态分布,即X~N(90,100).
(1)试求考试成绩X位于区间(70,110)上的概率是多少?
(2)若这次考试共有2 000名考生,试估计考试成绩在(80,100)间的考生大约有多少人?
[解] ∵X~N(90,100),∴μ=90,σ==10.
(1)由于X在区间(μ-2σ,μ+2σ)内取值的概率是0.954 4,而该正态分布中,μ-2σ=90-2×10=70,μ+2σ=90+2×10=110,
于是考试成绩X位于区间(70,110)内的概率就是0.954 4.
(2)由μ=90,σ=10,得μ-σ=80,μ+σ=100.
由于变量X在区间(μ-σ,μ+σ)内取值的概率是0.682 6,
所以考试成绩X位于区间(80,100)内的概率是0.682 6,一共有2 000名考生,
所以考试成绩在(80,100)间的考生大约有
2 000×0.682 6≈1 365(人).
正态曲线的应用及求解策略
解答此类题目的关键在于将待求的问题向(μ-σ,μ+σ), (μ-2σ,μ+2σ), (μ-3σ,μ+3σ)这三个区间进行转化,然后利用上述区间的概率求出相应概率,在此过程中依然会用到化归思想及数形结合思想.
[活学活用]
1.某人从某城市的南郊乘公交车前往北区火车站,由于交通拥挤,所需时间(单位:分)服从X~N(50,102),则他在时间段(30,70)内赶到火车站的概率为________.
解析:∵X~N(50,102),∴μ=50,σ=10.
∴P(30
2.某厂生产的圆柱形零件的外直径X服从正态分布N(4,0.052),质量检查人员从该厂生产的1 000个零件中随机抽查一个,测得它的外直径为3.7 cm,该厂生产的这批零件是否合格?
解:由于X服从正态分布N(4,0.052),
由正态分布的性质,可知
正态分布N(4,0.052)在(4-3×0.05,4+3×0.05)之外的取值的概率只有0.003,
3.7?(3.85,4,15),
这说明在一次试验中,出现了几乎不可能发生的小概率事件,据此可以认为该批零件是不合格的.
层级一 学业水平达标
1.关于正态分布N(μ,σ2),下列说法正确的是( )
A.随机变量落在区间长度为3σ的区间之外是一个小概率事件
B.随机变量落在区间长度为6σ的区间之外是一个小概率事件
C.随机变量落在(-3σ,3σ)之外是一个小概率事件
D.随机变量落在(μ-3σ,μ+3σ)之外是一个小概率事件
解析:选D ∵P(μ-3σ
2.设两个正态分布N(μ1,σ)(σ1>0)和N(μ2,σ)(σ2>0)的密度函数图象如图所示,则有( )
A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2
C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2
解析:选A μ反映的是正态分布的平均水平,x=μ是正态密度曲线的对称轴,由图可知μ1<μ2; σ反映的正态分布的离散程度,σ越大, 越分散, 曲线越“矮胖”,σ越小,越集中,曲线越“瘦高”, 由图可知σ1<σ2.
3.设随机变量X~N(1,22),则D=( )
A.4 B.2
C. D.1
解析:选D 因为X~N(1,22),所以D(X)=4,所以D=D(X)=1.
4.若随机变量X的密度函数为f(x)=·e-,X在区间(-2,-1)和(1,2)内取值的概率分别为p1,p2,则p1,p2的关系为( )
A.p1>p2 B.p1
解析:选C 由正态曲线的对称性及题意知:μ=0,σ=1,所以曲线关于直线x=0对称,所以p1=p2.
5.已知一次考试共有60名同学参加,考生的成绩X~N(110,52),据此估计,大约应有57人的分数在下列哪个区间内( )
A.(90,110] B.(95,125]
C.(100,120] D.(105,115]
解析:选C 由于X~N(110,52),所以μ=110,σ=5,因此考试成绩在区间(105,115],(100,120],(95,125]上的概率分别应是0.682 6,0.954 4,0.997 4,由于一共有60人参加考试,∴成绩位于上述三个区间的人数分别是:60×0.682 6≈41人,60×0.954 4≈57人,60×0.997 4≈60人.
6.已知随机变量X服从正态分布N(2,σ2),则P(X<2)=________.
解析:由题意知曲线关于x=2对称,因此P(X<2)=.
答案:
7.设随机变量X~N(3,1),若P(X>4)=p,则P(2
8.设随机变量X~N(μ,σ2),且P(X<1)=,P(X>2)=p,则P(0
∵P(X>2)=p,∴P(X<0)=p,则P(0
9.设X~N(3,42),试求:
(1)P(-1
(1)P(-1
(2)∵P(7
(3)∵P(X≥11)=P(X≤-5),
∴P(X≥11)=[1-P(-5
解:由题意X~N(0,22),
求得P(|X|≤4)=P(-4≤X≤4)=0.954 4.
设Y表示5件产品中合格品个数,
则Y~B(5,0.954 4),
所以P(Y≥5×0.8)=P(Y≥4)
=C·(0.954 4)4×0.045 6+C·(0.954 4)5
≈0.189 2+0.791 9≈0.981.
故生产的5件产品的合格率不小于80%的概率约为0.981.
层级二 应试能力达标
1.某厂生产的零件外径ξ~N(10,0.04),今从该厂上午、下午生产的零件中各取一件,测得其外径分别为9.9 cm,9.3 cm,则可认为( )
A.上午生产情况正常,下午生产情况异常
B.上午生产情况异常,下午生产情况正常
C.上午、下午生产情况均正常
D.上午、下午生产情况均异常
解析:选A 因测量值ξ为随机变量,又ξ~N(10,0.04),所以μ=10,σ=0.2,记I=(μ-3σ,μ+3σ)=(9.4,10.6),9.9∈I,9.3?I,故选A.
2.已知某批材料的个体强度X服从正态分布N(200,182),现从中任取一件,则取得的这件材料的强度高于182但不高于218的概率为( )
A.0.997 3 B.0.682 6
C.0.841 3 D.0.815 9
解析:选B 由题意知μ=200,σ=18,μ-σ=182,μ+σ=218,由P(μ-σ
C.0.271 6 D.0.271 8
解析:选B 由题意可知P(5
A.P(Y≥μ2)≥P(Y≥μ1)
B.P(X≤σ2)≤P(X≤σ1)
C.对任意正数t,P(X≥t)≥P(Y≥t)
D.对任意正数t,P(X≤t)≥P(Y≤t)
解析:选D 由图象知,μ1<μ2,σ1<σ2,P(Y≥μ2)=,P(Y≥μ1)>,故P(Y≥μ2)<P(Y≥μ1),故A错;
因为σ1<σ2,所以P(X≤σ2)>P(X≤σ1),故B错;
对任意正数t,P(X≥t)<P(Y≥t),故C错;
对任意正数t,P(X≤t)≥P(Y≤t)是正确的,故选D.
5.在某项测量中,测量结果ξ服从正态分布N(1,σ2)(σ>0).若ξ在(0,1)内取值的概率为0.4,则ξ在(2,+∞)上取值的概率为________.
解析:由正态分布的特征易得P(ξ>2)=×[1-2P(0<ξ<1)]=×(1-0.8)=0.1.
答案:0.1
6.设某城市居民私家车平均每辆车每月汽油费用为随机变量X(单位为:元),经统计得X~N(520,14 400),从该城市私家车中随机选取容量为10 000的样本,其中每月汽油费用在(400,640)之间的私家车估计有________辆.
解析:由已知得:μ=520,σ=120,∴P(400
7.某个工厂的工人月收入服从正态分布N(2 500,202),该工厂共有1 200名工人,试估计月收入在2 440元以下和2 560元以上的工人大约有多少人?
解:设该工厂工人的月收入为ξ,则ξ~N(2 500,202),
所以μ=2 500,σ=20,
所以月收入在区间(2 500-3×20,2 500+3×20)内取值的概率是0.997 4,该区间即(2 440,2 560).
因此月收入在2 440元以下和2 560元以上的工人大约有1 200×(1-0.997 4)=1 200×0.002 6≈3(人).
8.已知某种零件的尺寸X(单位:mm)服从正态分布,其正态曲线在(0,80)上是增函数,在[80,+∞)上是减函数,且f(80)= .
(1)求概率密度函数;
(2)估计尺寸在72 ~88 mm间的零件大约占总数的百分之几?
解:(1)由于正态曲线在(0,80)上是增函数,在[80,+∞)上是减函数,所以正态曲线关于直线x=80对称,且在x=80处取得最大值,因此得μ=80,
因为=,所以σ=8.
故概率密度函数解析式是φμ,σ(x)=e-.
(2)由μ=80,σ=8,得μ-σ=80-8=72,
μ+σ=80+8=88,
∴零件尺寸X位于区间(72,88)内的概率是0.682 6,因此尺寸在72~88 mm间的零件大约占总数的68.26%.
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.袋中有2个黑球6个红球, 从中任取两个, 可以作为随机变量的是( )
A.取到球的个数 B.取到红球的个数
C.至少取到一个红球 D.至少取得一个红球的概率
解析:选B 随机变量是随着实验结果变化而变化的变量 ,只有B满足.
2.4个高尔夫球中有3个合格、1个不合格,每次任取一个,不放回地取两次.若每一次取到合格的高尔夫球,则第二次取到合格高尔夫球的概率为( )
A. B.
C. D.
解析:选B 法一:记事件A={第一次取到的是合格高尔夫球},事件B={第二次取到的是合格高尔夫球}.
由题意可得P(A∩B)==,P(A)==,
所以P(B|A)===.
法二:记事件A={第一次取到的是合格高尔夫球},
事件B={第二次取到的是合格高尔夫球}.
由题意可得事件B发生所包含的基本事件数n(A∩B)=3×2=6,事件A发生所包含的基本事件数n(A)=3×3=9,
所以P(B|A)===.
3.若随机变量η~B(n,0.6),且E(η)=3,则P(η=1)的值是( )
A.2×0.44 B.3×0.44
C.2×0.45 D.3×0.64
解析:选B ∵η~B(n,0.6),∴E(η)=0.6n=3,∴n=5,
∴P(η=1)=C·0.6·(1-0.6)4=3×0.44,故选B.
4.如果随机变量ξ表示抛掷一个各面分别有1,2,3,4,5,6的均匀的正方体向上面的数字,那么随机变量ξ的均值为( )
A.2.5 B.3
C.3.5 D.4
解析:选C P(ξ=k)=(k=1,2,3,…,6),∴E(ξ)=1×+2×+…+6×=(1+2+…+6)=×=3.5.
5.若随机变量X服从正态分布,其正态曲线上的最高点的坐标是,则该随机变量的方差等于( )
A.10 B.100
C. D.
解析:选C 由正态分布密度曲线上的最高点知=,即σ=,∴D(X)=σ2=.
6.已知随机变量ξ服从正态分布N(3,4),则E(2ξ+1)与D(2ξ+1)的值分别为( )
A.13,4 B.13,8
C.7,8 D.7,16
解析:选D 由已知E(ξ)=3,D(ξ)=4,得E(2ξ+1)=2E(ξ)+1=7,D(2ξ+1)=4D(ξ)=16.
7.某人一周晚上值2次班,在已知他周日一定值班的条件下,他在周六晚上值班的概率为________.
解析:设事件A为“周日值班”,事件B为“周六值班”,则P(A)=,P(AB)=,故P(B|A)==.
答案:
8.盒中有10只螺丝钉,其中有3只是坏的,现从盒中随机地抽取4个,那么概率是的事件为( )
A.恰有1只是坏的 B.4只全是好的
C.恰有2只是好的 D.至多有2只是坏的
解析:选C X=k表示取出的螺丝钉恰有k只为好的,则P(X=k)=(k=1,2,3,4).∴P(X=1)=,P(X=2)=,P(X=3)=,P(X=4)=,故表示恰好有2个是好的.
9.设X~N(μ,σ2),当x在(1,3]内取值的概率与在(5,7]内取值的概率相等时,μ=( )
A.1 B.2
C.3 D.4
解析:选D 因为x在(1,3]内取值的概率与在(5,7]内取值的概率相等,所以得正态分布的图象关于直线x=4对称,结合正态分布的图象,故μ=4.
10.某地区高二女生的体重X(单位:kg)服从正态分布N(50,25),若该地区共有高二女生2 000人,则体重在50 kg~65 kg间的女生共有( )
A.683人 B.954人
C.997人 D.994人
解析:选C 由题意知μ=50,σ=5, ∴P(50-3×5<X<50+3×5)=0.997 4.∴P(50<X<65)=×0.997 4=0.498 7,∴体重在50 kg~65 kg的女生大约有:2 000×0.498 5≈997(人).
11.一个电路如图所示,A,B,C,D,E,F为6个开关,其闭合的概率为,且是相互独立的,则灯亮的概率是( )
A. B.
C. D.
解析:选B 设A与B中至少有一个不闭合的事件为T,E与F至少有一个不闭合的事件为R,则P(T)=P(R)=1-×=,所以灯亮的概率为P=1-P(T)·P(R)·P()·P()=.
12.一个篮球运动员投篮一次得3分的概率为a,得2分的概率为b,不得分的概率为c(a,b,c∈(0,1)),已知他投篮一次得分的均值为2(不计其他得分情况),则ab的最大值为( )
A. B.
C. D.
解析:选D 由已知,得3a+2b+0·c=2,得3a+2b=2,所以ab=×3a×2b≤2=.
二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)
13.某射手射击所得环数ξ的分布列如下:
ξ
7
8
9
10
P
x
0.1
0.3
y
已知ξ的期望E(ξ)=8.9,则y的值为________.
解析:由分布列可得x=0.6-y且7x+0.8+2.7+10y=8.9,解得y=0.4.
答案:0.4
14.某处有供水龙头5个,调查表示每个水龙头被打开的可能性均为, 3个水龙头同时被打开的概率为________.
解析:对5个水龙头的处理可视为做5次独立试验,每次试验有2种可能结果:打开或不打开,相应的概率为0.1或1-0.1=0.9,根据题意得3个水龙头同时被打开的概率为C×0.13×0.92=0.008 1.
答案:0.008 1
15.一台机器生产某种产品,如果生产一件甲等品可获得50元,生产一件乙等品可获得30元,生产一件次品,要赔20元,已知这台机器生产出甲等品、乙等品和次品的概率分别为0.6,0.3和0.1,则这台机器每生产一件产品平均预期获利________元.
解析:设生产一件该产品可获利钱数为X,则随机变量X的取值可以是-20,30,50. 依题意,X的分布列为
X
-20
30
50
P
0.1
0.3
0.6
故E(X)=-20×0.1+0.3×30+50×0.6=37(元).
答案:37
16.甲罐中有5个红球,2个白球和3个黑球,乙罐中有4个红球,3个白球和3个黑球.先从甲罐中随机取出一球放入乙罐,分别以A1,A2和A3表示由甲罐取出的球是红球,白球和黑球的事件;再从乙罐中随机取出一球,以B表示由乙罐取出的球是红球的事件,则下列结论中正确的是________________(写出所有正确结论的序号).
①P(B)=;②P(B|A1)=;
③事件B与事件A1相互独立;
④A1,A2,A3是两两互斥的事件;
⑤P(B)的值不能确定,因为它与A1,A2,A3中究竟哪一个发生有关.
解析:从甲罐中取出一球放入乙罐,则A1,A2,A3中任意两个事件不可能同时发生,即A1,A2,A3两两互斥,故④正确,易知P(A1)=,P(A2)=,P(A3)=,则P(B|A1)=,P(B|A2)=,P(B|A3)=,故②对③错;∴P(B)=P(A1B)+P(A2B)+P(A3B)=P(A1)·P(B|A1)+P(A2)P(B|A2)+P(A3)·P(B|A3)=×+×+×=,故①⑤错误.综上知,正确结论的序号为②④.
答案:②④
三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)灯泡厂生产的白炽灯泡的寿命为X(单位:小时),已知X~N(1 000,302),要使灯泡的平均寿命为1 000小时的概率为99.74%,问灯泡的最低寿命应控制在多少小时以上?
解:因为X~N(1 000,302),
所以μ=1 000,σ=30.
所以P(1 000-3×30
18.(本小题满分12分)某迷宫有三个通道,进入迷宫的每个人都要经过一扇智能门.首次到达此门,系统会随机(即等可能)为你打开一个通道.若是1号通道,则需要1小时走出迷宫;若是2号、3号通道,则分别需要2小时、3小时返回智能门,再次到达智能门时,系统会随机打开一个你未到过的通道,直至走出迷宫为止.令ξ表示走出迷宫所需的时间.
(1)求ξ的分布列;
(2)求ξ的数学期望.
解:(1)由题意知必须从1号通道走出迷宫,ξ的所有可能取值为:1,3,4,6.
P(ξ=1)=,P(ξ=3)=×=,P(ξ=4)=×=,P(ξ=6)=A×××1=,
所以ξ的分布列为:
ξ
1
3
4
6
P
(2)E(ξ)=1×+3×+4×+6×=(小时).
19.(本小题满分12分)某校从学生会宣传部6名成员(其中男生4人,女生2人)中,任选3人参加某省举办的演讲比赛活动.
(1)设所选3人中女生人数为ξ,求ξ的分布列;
(2)求男生甲或女生乙被选中的概率;
(3)设“男生甲被选中”为事件A,“女生乙被选中”为事件B,求P(B)和P(B|A).
解:(1)ξ的所有可能取值为0,1,2,依题意得P(ξ=0)==,P(ξ=1)==,P(ξ=2)==.
∴ξ的分布列为
ξ
0
1
2
P
(2)设“甲、乙都不被选中”为事件C,
则P(C)===.
∴所求概率为P()=1-P(C)=1-=.
(3)P(B)===;P(B|A)===.
20.(本小题满分12分)为向国际化大都市目标迈进,某市今年新建三大类重点工程,它们分别是30项基础设施类工程、20项民生类工程和10项产业建设类工程.现有来该市的3名工人相互独立地从60个项目中任选一个项目参与建设.
(1)求这3人选择的项目所属类别互异的概率;
(2)将此3人中选择的项目属于基础设施类工程或产业建设类工程的人数记为X,求X的分布列和数学期望.
解:记第i名工人选择的项目属于基础设施类、民生类、产业建设类分别为事件Ai,Bi,Ci(i=1,2,3).
由题意知,P(Ai)==,P(Bi)==,
P(Ci)==.
(1)3人选择的项目所属类别互异的概率
P=AP(A1B2C3)=6×××=.
(2)任一名工人选择的项目属于基础设施类或产业建设类工程的概率P=+=.
由X~B,
∴P(X=k)=Ck3-k(k=0,1,2,3),
∴X的分布列为
X
0
1
2
3
P
其数学期望为E(X)=3×=2.
21.(本小题满分12分)红队队员甲、乙、丙与蓝队队员A,B,C进行围棋比赛,甲对A、乙对B、丙对C各一盘,已知甲胜A、乙胜B、丙胜C的概率分别为0.6,0.5,0.5,假设各盘比赛结果相互独立.
(1)求红队至少两名队员获胜的概率;
(2)用ξ表示红队队员获胜的总盘数,求ξ的分布列和数学期望E(ξ).
解:(1)设甲胜A的事件为D,乙胜B的事件为E,丙胜C的事件为F,
则,,分别表示甲不胜A、乙不胜B、丙不胜C的事件.
因为P(D)=0.6,P(E)=0.5,P(F)=0.5,
由对立事件的概率公式知P()=0.4,P()=0.5,P()=0.5.
红队至少两人获胜的事件有:DE,DF,EF,DEF.
由于以上四个事件两两互斥且各盘比赛的结果相互独立,
因此红队至少两人获胜的概率为
P=P(DE)+P(DF)+P(EF)+P(DEF)=0.6×0.5×0.5+0.6×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=0.55.
(2)由题意知ξ可能的取值为0,1,2,3.
又由(1)知DEF,E,DEF是两两互斥事件,且各盘比赛的结果相互独立,
因此P(ξ=0)=P(DEF)=0.4×0.5×0.5=0.1,
P(ξ=1)=P(DEF)+P(E)+P(DEF)=0.4×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=0.35.
P(ξ=3)=P(DEF)=0.6×0.5×0.5=0.15.
由对立事件的概率公式得
P(ξ=2)=1-P(ξ=0)-P(ξ=1)-P(ξ=3)=0.4.
所以ξ的分布列为:
ξ
0
1
2
3
P
0.1
0.35
0.4
0.15
因此E(ξ)=0×0.1+1×0.35+2×0.4+3×0.15=1.6.
22.(本小题满分12分)某银行柜台设有一个服务窗口,假设顾客办理业务所需的时间互相独立,且都是整数分钟,对以往顾客办理业务所需的时间统计结果如下:
办理业务所需的时间(分)
1
2
3
4
5
频率
0.1
0.4
0.3
0.1
0.1
从第一个顾客开始办理业务时计时.
(1)估计第三个顾客恰好等待4分钟开始办理业务的概率;
(2)X表示至第2分钟末已办理完业务的顾客人数,求X的分布列及数学期望.
解:设Y表示顾客办理业务所需的时间,用频率估计概率,得Y的分布列如下:
Y
1
2
3
4
5
P
0.1
0.4
0.3
0.1
0.1
(1)A表示事件“第三个顾客恰好等待4分钟开始办理业务”,则事件A对应三种情形:
①第一个顾客办理业务所需的时间为1分钟,且第二个顾客办理业务所需的时间为3分钟;
②第一个顾客办理业务所需的时间为3分钟,且第二个顾客办理业务所需的时间为1分钟;
③第一个和第二个顾客办理业务所需的时间均为2分钟.
所以P(A)=P(Y=1)P(Y=3)+P(Y=3)P(Y=1)+P(Y=2)P(Y=2)=0.1×0.3+0.3×0.1+0.4×0.4=0.22.
(2)X所有可能的取值为0,1,2.
X=0对应第一个顾客办理业务所需的时间超过2分钟,
所以P(X=0)=P(Y>2)=0.5;
X=1对应第一个顾客办理业务所需的时间为1分钟且第二个顾客办理业务所需的时间超过1分钟,或第一个顾客办理业务所需的时间为2分钟,
所以P(X=1)=P(Y=1)P(Y>1)+P(Y=2)
=0.1×0.9+0.4=0.49;
X=2对应两个顾客办理业务所需的时间均为1分钟,
所以P(X=2)=P(Y=1)P(Y=1)=0.1×0.1=0.01.
所以X的分布列为
X
0
1
2
P
0.5
0.49
0.01
E(X)=0×0.5+1×0.49+2×0.01=0.51.
预习课本P80~89,思考并完成以下问题
1.什么是回归分析?
2.什么是线性回归模型?
3.求线性回归方程的步骤是什么?
1.回归分析
(1)回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)回归方程的相关计算
对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn).设其回归直线方程为=x+,其中,是待定参数,由最小二乘法得
==,
=-.
(3)线性回归模型
线性回归模型,其中a,b为模型的未知参数,通常e为随机变量,称为随机误差.x称为解释变量,y称为预报变量.
[点睛] 对线性回归模型的三点说明
(1)非确定性关系:线性回归模型y=bx+a+e与确定性函数y=a+bx相比,它表示y与x之间是统计相关关系(非确定性关系),其中的随机误差e提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具.
(2)线性回归方程=x+中,的意义是:以为基数,x每增加1个单位,y相应地平均增加个单位.
2.线性回归分析
(1)残差:对于样本点(xi,yi)(i=1,2,…,n)的随机误差的估计值 i=yi-i称为相应于点(xi,yi)的残差,(yi-i)2称为残差平方和.
(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差, 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.
(3)R2=1-越接近1,表示回归的效果越好.
1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)
(1)残差平方和越小, 线性回归方程的拟合效果越好.( )
(2)在画两个变量的散点图时, 预报变量在x轴上,解释变量在y轴上.( )
(3)R2越小, 线性回归方程的拟合效果越好.( )
答案:(1)√ (2)× (3)×
2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为________.
答案:正相关
3.在残差分析中, 残差图的纵坐标为________.
答案:残差
4.如果发现散点图中所有的样本点都在一条直线上, 则残差平方和等于________, 解释变量和预报变量之间的相关系数等于________.
答案:0 1或-1
求线性回归方程
[典例] 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据
x
6
8
10
12
y
2
3
5
6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 =x+;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
[解] (1)散点图如图:
(2)iyi=6×2+8×3+10×5+12×6=158,
==9,==4,
=62+82+102+122=344.
===0.7,=-=4-0.7×9=-2.3,
故线性回归方程为=0.7x-2.3.
(3)由(2)中线性回归方程知,当x=9时,=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.
求线性回归方程的三个步骤
(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.
(2)求回归系数:若存在线性相关关系,则求回归系数.
(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.
[活学活用]
某工厂1~8月份某种产品的产量与成本的统计数据见下表:
月份
1
2
3
4
5
6
7
8
产量(吨)
5.6
6.0
6.1
6.4
7.0
7.5
8.0
8.2
成本(万元)
130
136
143
149
157
172
183
188
以产量为x,成本为y.
(1)画出散点图;
(2)y与x是否具有线性相关关系?若有,求出其回归方程.
解:(1)由表画出散点图,如图所示.
(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.
xi
yi
x
xiyi
1
5.6
130
31.36
728.0
2
6.0
136
36.00
816.0
3
6.1
143
37.21
872.3
4
6.4
149
40.96
953.6
5
7.0
157
49.00
1 099.0
6
7.5
172
56.25
1 290.0
7
8.0
183
64.00
1 464.0
8
8.2
188
67.24
1 541.6
∑
54.8
1 258
382.02
8 764.5
计算得=6.85,=157.25.
∴=
=≈22.17,
=-=157.25-22.17×6.85≈5.39,
故线性回归方程为=22.17x+5.39.
回归分析
题点一:线性回归分析
1.在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:
x
14
16
18
20
22
y
12
10
7
5
3
求出y对x的回归直线方程,并说明拟合效果的程度.
解:=(14+16+18+20+22)=18,
=(12+10+7+5+3)=7.4.
=142+162+182+202+222=1 660,
iyi=14×12+16×10+18×7+20×5+22×3=620,
可得回归系数===-1.15.
所以=7.4+1.15×18=28.1
所以回归直线方程:=-1.15x+28.1.
列出残差表:
yi-i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
则(yi-i)2=0.3,(yi-)2=53.2.
R2=1-≈0.994.
所以回归模型的拟合效果很好.
题点二:非线性回归分析
2.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下
时间x/天
1
2
3
4
5
6
繁殖个数y
6
12
25
49
95
190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;
(2)求y与x之间的回归方程.
解:(1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数函数y1=c1ec2x的周围,于是令z=ln y,则
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器算得,=0.69x+1.112,则有=e0.69x+1.112.
(1)当两个变量已明显呈线性相关关系时,则无需作散点图,就可直接求回归直线方程,否则要先判定相关性再求回归方程.判断拟合效果的好坏需要利用R2确定,R2越接近1,说明拟合效果越好.
(2)非线性回归方程的求法
①根据原始数据(x,y)作出散点图;
②根据散点图,选择恰当的拟合函数;
③作恰当的变换,将其转化成线性函数,求线性回归方程;
④在③的基础上通过相应的变换,即可得非线性回归方程.
层级一 学业水平达标
1.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:选D 对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①, 故选D.
2.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
②R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.
其中正确命题的个数是( )
A.0 B.1
C.2 D.3
解析:选D ①选用的模型是否合适与残差点的分布有关; 对于②③, R2的值越大, 说明残差平方和越小, 随机误差越小,则模型的拟合效果越好.
3.下图是根据变量x,y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )
A.①② B.①④
C.②③ D.③④
解析:选D 根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系.
4.(重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.
5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:选B 由题意知,==10,
==8,
∴=8-0.76×10=0.4,
∴当x=15时,=0.76×15+0.4=11.8(万元).
6.以下是某地区的降雨量与年平均气温的一组数据:
年平均气温(℃)
12.51
12.84
12.84
13.69
13.33
12.74
13.05
年降雨量(mm)
542
507
813
574
701
432
464
根据这组数据可以推断,该地区的降雨量与年平均气温________相关关系.(填“具有”或“不具有”)
解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.
答案:不具有
7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1.
答案:1
8.下列说法正确的命题是________(填序号).
①回归直线过样本点的中心(,);
②线性回归方程对应的直线=x+至少经过其样本数据点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;
③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;
④在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好.
解析:由回归分析的概念知①④正确,②③错误.
答案:①④
9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)=(8+8.2+8.4+8.6+8.8+9)=8.5,=(90+84+83+80+75+68)=80,
从而=+20=80+20×8.5=250,
故=-20x+250.
(2)由题意知, 工厂获得利润
z=(x-4)y=-20x2+330x-1 000=-202+361.25,所以当x==8.25时,zmax=361.25(元).
即当该产品的单价定为8.25元时,工厂获得最大利润.
10.关于x与y有以下数据:
x
2
4
5
6
8
y
30
40
60
50
70
已知x与y线性相关,由最小二乘法得=6.5,
(1)求y与x的线性回归方程;
(2)现有第二个线性模型:=7x+17,且R2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.
解:(1)依题意设y与x的线性回归方程为=6.5x+.
==5,
==50,
∵=6.5x+经过(,),
∴50=6.5×5+,∴=17.5,
∴y与x的线性回归方程为=6.5x+17.5.
(2)由(1)的线性模型得yi-i与yi-的关系如下表:
yi-i
-0.5
-3.5
10
-6.5
0.5
yi-
-20
-10
10
0
20
所以(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.
(yi-)2=(-20)2+(-10)2+102+02+202=1 000.
所以R=1-=1-=0.845.
由于R=0.845,R2=0.82知R>R2,
所以(1)的线性模型拟合效果比较好.
层级二 应试能力达标
1.在建立两个变量y与x的回归模型中,分别选择4个不同模型,求出它们相对应的R2如表,则其中拟合效果最好的模型是( )
模型
1
2
3
4
R2
0.67
0.85
0.49
0.23
A.模型1 B.模型2
C.模型3 D.模型4
解析:选B 线性回归分析中,相关系数为r,|r|越接近于1, 相关程度越大; |r|越小, 相关程度越小,故其拟合效果最好. 故选B.
2.如果某地的财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )
A.10亿 B.9亿
C.10.5亿 D.9.5亿
解析:选C ∵x=10时,y=0.8×10+2+e=10+e,
又∵|e|≤0.5,∴y≤10.5.
3.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:
气温(℃)
18
13
10
-1
销售量(个)
24
34
38
64
由表中数据,得线性回归方程=-2x+a.当气温为-4 ℃时,预测销售量约为( )
A.68 B.66
C.72 D.70
解析:选A ∵=(18+13+10-1)=10,=(24+34+38+64)=40,∴40=-2×10+a,∴a=60,当x=-4时,y=-2×(-4)+60=68.
4.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和(yi-i)2如下表:
甲
乙
丙
丁
散点图
残差平方和
115
106
124
103
哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高( )
A.甲 B.乙
C.丙 D.丁
解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中(yi-)2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D.
5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令=ln y,求得回归直线方程为=0.25x-2.58,则该模型的回归方程为________.
解析:因为=0.25x-2.58,=ln y,所以y=e0.25x-2.58.
答案:y=e0.25x-2.58
6.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:以x+1代x,得=0.254(x+1)+0.321,与=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.
答案:0.254
7.下表是某年美国旧轿车价格的调查资料.
使用年数
1
2
3
4
5
6
7
8
9
10
平均价格(美元)
2 651
1 943
1 494
1 087
765
538
484
290
226
204
观察表中的数据,试问平均价格与使用年数间存在什么样的关系?
解:设x表示轿车的使用年数,y表示相应的平均价格,作出散点图.
由散点图可以看出y与x具有指数关系,
令z=ln y,变换得
x
1
2
3
4
5
6
7
8
9
10
z
7.883
7.572
7.309
6.991
6.640
6.288
6.182
5.670
5.421
5.318
作出散点图:
由图可知各点基本上处于一直线,由表中数据可求出线性回归方程:
=8.166-0.298x.
因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为=e8.166-0.298x.
8.某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:
x
10
15
17
20
25
28
32
y
1
1.3
1.8
2
2.6
2.7
3.3
(1)画出散点图;
(2)求回归直线方程;
(3)估计销售总额为24千万元时的利润.
解:(1)散点图如图:
(2)列下表,并利用科学计算器进行有关计算.
i
1
2
3
4
5
6
7
xi
10
15
17
20
25
28
32
yi
1
1.3
1.8
2
2.6
2.7
3.3
=21,=2.1
=3 447,iyi=346.3
于是=≈0.104.
=2.1-0.104×21=-0.084,
因此回归直线方程为=0.104x-0.084.
(3)当x=24时,y=0.104×24-0.084=2.412(千万元).
预习课本P91~96,思考并完成以下问题
1.分类变量与列联表分别是如何定义的?
2.独立性检验的基本思想是怎样的?
3.独立性检验的常用方法有哪些?
1.与列联表相关的概念
(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量.
(2)列联表:
①列出的两个分类变量的频数表, 称为列联表.
②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0, 因此|ad-bc|越小, 关系越弱; |ad-bc|越大, 关系越强.
2.等高条形图
等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响, 常用等高条形图展示列表数据的频率特征.
3.独立性检验的基本思想
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)公式:K2=,其中n=a+b+c+d为样本容量.
1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)
(1)分类变量中的变量与函数中的变量是同一概念.( )
(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系, 而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( )
(3)独立性检验的方法就是反证法.( )
答案:(1)× (2)√ (3)×
2.与表格相比,能更直观地反映出相关数据总体状况的是( )
A.列联表 B.散点图
C.残差图 D.等高条形图
答案:D
3.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足( )
附表:
P(K2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
A.k>6.635 B.k>5.024
C.k>7.879 D.k>3.841
答案:A
4.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
100
则表中a,b的值分别为________.
答案:52, 54
等高条形图的应用
[典例] 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别
阳性数
阴性数
总计
铅中毒病人
29
7
36
对照组
9
28
37
总计
38
35
73
试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
[解] 等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例.两个比例的值相差越大,X与Y有关系成立的可能性就越大.
[活学活用]
某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.
解:作列联表如下:
性格内向
性格外向
总计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
总计
426
594
1 020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.
两个变量的独立性检验
[典例] 为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?
[解] 根据题目所给的数据得到如下列联表:
理科
文科
总计
有兴趣
138
73
211
无兴趣
98
52
150
总计
236
125
361
根据列联表中数据由公式计算得随机变量K2的观测值
k=≈1.871×10-4.
因为1.871×10-4<2.706,
所以在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.
独立性检验的步骤
(1)确定分类变量,获取样本频数,得到列联表.
(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.
(3)利用公式K2=计算随机变量K2的观测值k0.
(4)作出判断.
如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y的关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
[活学活用]
在对人们的休闲方式的一次调查中, 共调查了124人, 其中女性70人, 男性54人.女性中有43人主要的休闲方式是看电视, 另外27人主要的休闲方式是运动; 男性中有21人主要的休闲方式是看电视, 另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2的列联表; 并估计, 以运动为主的休闲方式的人的比例;
(2)能否在犯错误的概率不超过0.025的前提下, 认为性别与休闲方式有关系?
附表:
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
K2=.
解:(1)由所给的数据得到列联表
休闲方式
性别
看电视
运动
总计
女
43
27
70
男
21
33
54
总计
64
60
124
所以以运动为主要的休闲方式的人的比例为15∶31.
(2)根据列联表中的数据计算得随机变量K2的观测值,
k=≈6.201,
因为k>5.024,
所以在犯错误的概率不超过0.025的前提下认为休闲方式与性别有关.
独立性检验的综合应用
[典例] 某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A,B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如图.记成绩不低于90分者为“成绩优秀”.
(1)在乙班样本的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;
(2)由以上统计数据作出列联表,并判断能否在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.
[解] (1)由题意知本题是一个等可能事件的概率,试验发生包含的事件是从不低于86分的成绩中随机抽取两个包含的基本事件是:(86,93), (86,96), (86,97), (86,99), (86,99), (93,96),(93,97), (93,99), (93,99), (96,97), (96,99), (96,99),(97,99),(97,99),(99,99),共有15种结果,
符合条件的事件数(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有10种结果,
根据等可能事件的概率得到P==.
(2)由已知数据得
甲班
乙班
总计
成绩优秀
1
5
6
成绩不优秀
19
15
34
总计
20
20
40
根据列联表中的数据,计算得随机变量K2的观测值
k=≈3.137,
由于3.137>2.706,所以在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.
(1)独立性检验问题是常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系.
(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.
[活学活用]
某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的180节课分为三类课堂教学模式,教师主讲的为A模式,少数学生参与的为B模式,多数学生参与的为C模式,A,B,C三类课的节数比例为3∶2∶1.
(1)为便于研究分析,教育专家将A模式称为传统课堂模式,B,C统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下2×2列联表(单位:节)
高效
非高效
总计
新课堂模式
60
30
90
传统课堂模式
40
50
90
总计
100
80
180
请根据统计数据回答:有没有99%的把握认为课堂教学效率与教学模式有关?并说明理由.
(2)教育专家采用分层抽样的方法从收集到的180节课中选出12节课作为样本进行研究,并从样本中的B模式和C模式课堂中随机抽取2节课,求至少有一节课为C模式课堂的概率.
参考临界值有:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:K2=,
其中n=a+b+c+d.
解:(1)由列联表中的统计数据计算随机变量K2的观测值为:
∵k==9>6.635,
由临界值表P(K2≥6.635)≈0.010,
∴有99%的把握认为课堂效率与教学模式有关.
(2)样本中的B模式课堂和C模式课堂分别是4节和2节.
从中任取两节有C=15种取法,其中至少有一节课为C模式课堂取法有C-C=9种,
∴至少有一节课为C模式课堂的概率为=.
层级一 学业水平达标
1.以下关于独立性检验的说法中, 错误的是( )
A.独立性检验依赖于小概率原理
B.独立性检验得到的结论一定准确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判断两事物是否相关的唯一方法
解析:选B 根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但并不一定是准确的.
2.观察下列各图,其中两个分类变量之间关系最强的是( )
解析:选D 在四幅图中,D图中两个阴影条的高相差最明显,说明两个分类变量之间关系最强,故选D.
3.在列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( )
A.与 B.与
C.与 D.与
解析:选C 由等高条形图可知与的值相差越大,|ad-bc|就越大,相关性就越强.
4.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )
A.k越大,“X与Y有关系”的可信程度越小
B.k越小,“X与Y有关系”的可信程度越小
C.k越接近于0,“X与Y没有关系”的可信程度越小
D.k越大,“X与Y没有关系”的可信程度越大
解析:选B K2的观测值k越大,“X与Y有关系”的可信程度越大.因此,A、C、D都不正确.
5.考察棉花种子经过处理跟生病之间的关系得到下表数据:
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
根据以上数据,可得出( )
A.种子是否经过处理跟是否生病有关
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理决定是否生病
D.以上都是错误的
解析:选B 由K2=≈0.164<2.706,即没有把握认为是否经过处理跟是否生病有关.
6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”)
解析:∵K2的观测值k=27.63,∴k>10.828,∴在犯错误的概率不超过0.001的前提下认为打鼾与患心脏病是有关的.
答案:有关
7.如果根据性别与是否爱好运动的列联表得到K2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.
解析:∵P(K2≥3.841)≈0.05.
∴判断性别与是否爱好运动有关,出错的可能性不超过5%.
答案:5%
8.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B有关;当________时,认为没有充分的证据显示事件A与B是有关的.
解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B有关,当k≤2.706时认为没有充分的证据显示事件A与B是有关的.
答案:k>3.841 k≤2.706
9.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.
(1)根据以上数据列出2×2列联表;
(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关系吗?为什么?
解:(1)由已知可列2×2列联表:
患胃病
未患胃病
总计
生活规律
20
200
220
生活不规律
60
260
320
总计
80
460
540
(2)根据列联表中的数据,由计算公式得K2的观测值
k=≈9.638.
∵9.638>6.635,
因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.
10.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
a
b=5
女生
c=10
d
合计
50
已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为.
(1)请将上面的列联表补充完整;
(2)是否有99.5%的把握认为喜爱打篮球与性别有关;请说明理由.
附参考公式:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解:(1)列联表补充如下:
喜爱打篮球
不喜爱打篮球
合计
男生
20
5
25
女生
10
15
25
合计
30
20
50
(2)∵K2=≈8.333>7.879,
∴有99.5%的把握认为喜爱打篮球与性别有关.
层级二 应试能力达标
1.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力( )
A.平均数与方差 B.回归直线方程
C.独立性检验 D.概率
解析:选C 由于参加调查的人按性别被分成了两组,而且每一组又被分成了两种情况,判断有关与无关,符合2×2列联表的要求,故用独立性检验最有说服力.
2.对于独立性检验,下列说法正确的是( )
A.K2>3.841时,有95%的把握说事件A与B无关
B.K2>6.635时,有99%的把握说事件A与B有关
C.K2≤3.841时,有95%的把握说事件A与B有关
D.K2>6.635时,有99%的把握说事件A与B无关
解析:选B 由独立性检验的知识知:K2>3.841时,有95%的把握认为“变量X与Y有关系”;K2>6.635时,有99%的把握认为“变量X与Y有关系”.故选项B正确.
3.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )
A.H0:男性喜欢参加体育活动
B.H0:女性不喜欢参加体育活动
C.H0:喜欢参加体育活动与性别有关
D.H0:喜欢参加体育活动与性别无关
解析:选D 独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的K2应该很小,如果K2很大,则可以否定假设,如果K2很小,则不能够肯定或者否定假设.
4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
由此表得到的正确结论是( )
A.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”
D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”
解析:选C 由2×2列联表得到a=45,b=10,c=30,d=15.
则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.
代入K2=,得K2的观测值k=≈3.030.因为2.706<3.030<3.841.
所以在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”.
5.若两个分类变量X与Y的列联表为:
y1
y2
x1
10
15
x2
40
16
则“X与Y之间有关系”这个结论出错的可能性为________.
解析:由题意可得K2的观测值
k=≈7.227,
∵P(K2≥6.635)≈1%, 所以“x与y之间有关系”出错的可能性为1%.
答案:1%
6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
又发作过心脏病
未发作过心脏病
合计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
合计
68
324
392
试根据上述数据计算K2≈________,能否作出这两种手术对病人又发作心脏病的影响有差别的结论________(填“能”或“不能”).
解析:根据列联表中的数据,可以求得K2的观测值k=≈1.779.
K2<2.072的概率为0.85.作出这两种手术对病人又发作心脏病的影响有差别的结论.
答案:1.779 不能
7.甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:
零件尺寸x
1.01
1.02
1.03
1.04
1.05
零件个数y
甲
3
7
8
9
3
乙
7
4
4
4
a
由表中数据得y关于x的线性回归方程为=-91+100x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01(cm).完成下面列联表,并判断是否有99%的把握认为加工零件的质量与甲、乙有关?
合格零件数
不合格零件数
总计
甲
乙
总计
解:=1.03,=,由=-91+100x知,=-91+100×1.03,所以a=11,由于合格零件尺寸为1.03±0.01 cm,故甲、乙加工的合格与不合格零件的数据表为:
合格零件数
不合格零件数
总计
甲
24
6
30
乙
12
18
30
总计
36
24
60
所以K2=
==10,
因K2=10>6.635,故有99%的把握认为加工零件的质量与甲、乙有关.
8.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品
不喜欢甜品
总计
南方学生
60
20
80
北方学生
10
10
20
总计
70
30
100
(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;
(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.
P(K2≥k0)
0.100
0.050
0.010
k0
2.706
3.841
6.635
解:(1)将2×2列联表中的数据代入公式计算,得
K2==≈4.762.
由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}.
(其中ai表示喜欢甜品的学生,i=1,2.bj表示不喜欢甜品的学生,j=1,2,3)Ω由10个基本事件组成,且这些基本事件的出现是等可能的.
用A表示“3人中至多有1人喜欢甜品”这一事件,则
A={(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}.
事件A是由7个基本事件组成,因而P(A)=.
(时间120分钟 满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数( )
A.可以小于0 B.大于0
C.能等于0 D.只能小于0
解析:选A ∵=0时,则r=0,这时不具有线性相关关系,但可以大于0也可以小于0.
2.每一吨铸铁成本y(元)与铸件废品率x%建立的回归方程=56+8x,下列说法正确的是( )
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
解析:选C 根据回归方程知y是关于x的单调增函数,并且由系数知x每增加一个单位,y平均增加8个单位.
3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是( )
x
4
5
6
7
8
9
10
y
14
18
19
20
23
25
28
A.线性函数模型 B.二次函数模型
C.指数函数模型 D.对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
4.试验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( )
A.=x+1 B. =x+2
C.=2x+1 D.=x-1
解析:选A 由题意发现,(x,y)的四组值均满足=x+1,故=x+1为回归直线方程.
5.下列关于等高条形图说法正确的是( )
A.等高条形图表示高度相对的条形图
B.等高条形图表示的是分类变量的频数
C.等高条形图表示的是分类变量的百分比
D.等高条形图表示的是分类变量的实际高度
解析:选C 由等高条形图的特点及性质进行判断.
6.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析存在线性相关关系,求得其回归方程=0.85x-85.7,则在样本点(165,57)处的残差为( )
A.54.55 B.2.45
C.3.45 D.111.55
解析:选B 把x=165代入=0.85x-85.7,得y=0.85×165-85.7=54.55,由57-54.55=2.45,故选B.
7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到K2=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确.
8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72%
C.67% D.66%
解析:选A 将y=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.
9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:
年龄
总计
不超过40岁
超过40岁
吸烟量不多于
20支/天
50
15
65
吸烟量多于
20支/天
10
25
35
总计
60
40
100
则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关( )
A.0.001 B.0.01
C.0.05 D.没有理由
解析:选A K2=≈22.16>10.828,
所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.
10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是( )
A.直线l1和直线l2有交点(s,t)
B.直线l1和直线l2相交,但交点未必是点(s,t)
C.直线l1和直线l2由于斜率相等,所以必定平行
D.直线l1和直线l2必定重合
解析:选A l1与l2都过样本中心(,).
11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为( )
A.a=9,b=8,c=7,d=6
B.a=9,b=7,c=6,d=8
C.a=8,b=6,c=9,d=7
D.a=6,b=7,c=8,d=9
解析:选B 对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad-bc|越大, 故检验知选B.
12.两个分类变量X和Y, 值域分别为{x1,x2}和{y1,y2}, 其样本频数分别是a=10, b=21, c+d=35. 若X与Y有关系的可信程度不小于97.5%, 则c等于( )
A.3 B.4
C.5 D.6
解析:选A 列2×2列联表如下:
x1
x2
总计
y1
10
21
31
y2
c
d
35
总计
10+c
21+d
66
故K2的观测值k=≥5.024. 把选项A, B, C, D代入验证可知选A.
二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)
13.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要________h.
解析:当x=600时,=0.01×600+0.5=6.5.
答案:6.5
14.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2为________.
解析:ei恒为0,说明随机误差总为0,于是yi=,故R2=1.
答案:1
15.下列是关于出生男婴与女婴调查的列联表
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
那么A=______,B=______,C______,D=________,E=________.
解析:∵45+E=98,∴E=53,
∵E+35=C,∴C=88,∵98+D=180,∴D=82,
∵A+35=D,∴A=47,∵45+A=B,∴B=92.
答案:47 92 88 82 53
16.已知x,y之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=x+1与l2:y=x+,利用最小二乘法判断拟合程度更好的直线是________.
x
1
3
6
7
8
y
1
2
3
4
5
解析:用y=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=2+(2-2)2+(3-3)2+2+2=.用y=x+作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2+2+(4-4)2+2=.
因为S2
三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
试说明在这三种心理障碍中哪一种与性别关系最大?
解:对于上述三种心理障碍分别构造三个随机变量K,K,K,由表中数据可得
K=≈0.863,
K=≈6.366,
K=≈1.410.
因为K的值最大,所以说谎与性别关系最大.
18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x和这一年各城市患白血病的儿童数量y,其数据如下表所示:
人均GDP x/万元
10
8
6
4
3
1
患白血病的儿童数量y/人
351
312
207
175
132
180
(1)画出散点图,并判断是否线性相关;
(2)求y与x之间的回归方程.
解:(1)作散点图(如下图所示).
由散点图可知y与x具有线性相关关系.
(2)将数据代入公式,可得≈23.253,≈102.151.
故y与x之间的线性回归方程是=23.253x+102.151.
19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):
80及80分以上
80分以下
总计
试验班
35
15
50
对照班
20
m
50
总计
55
45
n
(1)求m,n;
(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系?
解:(1)m=45-15=30,n=50+50=100.
(2)由表中的数据,得K2的观测值为
k=≈9.091.
因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.
20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:
(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?
甲工艺
乙工艺
总计
一等品
非一等品
总计
附:
P(K2≥k0)
0.10
0.05
0.01
k0
2.706
3.841
6.635
K2=
(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.
解:(1)2×2列联表如下
甲工艺
乙工艺
总计
一等品
50
60
110
非一等品
50
40
90
总计
100
100
200
K2=≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.
(2)由题知运用甲工艺生产单件产品的利润X的分布列为
X
30
20
15
P
0.5
0.3
0.2
X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.
乙工艺生产单件产品的利润Y的分布列为
Y
30
20
15
P
0.6
0.1
0.3
Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,
Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.
由上述结果可以看出D(X)
性别
是否需要志愿者
男
女
需要
40
30
不需要
160
270
P(K2≥k0)
0.05
0.01
0.001
k0
3.841
6.635
10.828
附:K2的观测值k=.
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.
解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为=14%.
(2)随机变量K2的观测值
k=≈9.967.
由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.
(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.
22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:
等级得分
(0,1]
(1,2]
(2,3]
(3,4]
(4,5]
(5,6]
人数
3
17
30
30
17
3
(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.
(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:
①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1);
②若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)范围内的人数.
(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:
x(数学学习能力)
2
3
4
5
6
y(物理学习能力)
1.5
3
4.5
5
6
①请画出上表数据的散点图;
②请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+(附参考数据:≈11.4).
解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为=.
(2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,
标准差σ=[(0.5-3)2×0.03+(1.5-3)2×0.17+(2.5-3)2×0.3+(3.5-3)2×0.3+(4.5-3)2×0.17+(5.5-3)2×0.03]=≈1.1,
②由于μ=3,σ=1.1
当x∈(1.9,4.1)时,即x∈(μ-σ,μ+σ),
故数理学习能力等级分数在(1.9,4.1)范围中的概率为0.682 6.
数理习能力等级分数在(1.9,4.1)范围中的学生的人数约为10 000×0.682 6=6 826人.
(3)①数据的散点图如图:
②设线性回归方程为=x+,则
==1.1,=-=-0.4.
故回归直线方程为=1.1x-0.4.
复习课(一) 计数原理
两个计数原理
(1)两个计数原理是学习排列与组合的基础,高考中一般以选择题、填空题的形式出现,难度中等.
(2)运用两个计数原理解题的关键在于正确区分“分类”与“分步”.分类就是能“一步到位”——任何一类中任何一种方法都能完成这件事情,而分步则只能“局部到位”——任何一步中任何一种方法都不能完成这件事情,只能完成事件的某一部分,只有当各步全部完成时,这件事情才完成.
计数原理
(1)分类加法计数原理:N=n1+n2+n3+…+nm;
(2)分步乘法计数原理:N=n1·n2·n3·…·nm.
[典例] 如图所示,花坛内有五个花池,有五种不同颜色的花卉可供栽种,每个花池内只能种同种颜色的花卉,相邻两池的花色不同,则最多的栽种方案有( )
A.180种 B.240种
C.360种 D.420种
[解析] 由题意知,最少用三种颜色的花卉,按照花卉选种的颜色可分为三类方案,即用三种颜色,四种颜色,五种颜色.
①当用三种颜色时,花池2,4同色和花池3,5同色,此时共有A种方案.
②当用四种颜色时,花池2,4同色或花池3,5同色,故共有2A种方案.
③当用五种颜色时有A种方案.
因此所有栽种方案为A+2A+A=420(种).
[答案] D
[类题通法]
使用两个原理解决问题时应注意的问题
(1)对于一些比较复杂的既要运用分类加法计数原理又要运用分步乘法计数原理的问题,我们可以恰当地画出示意图或列出表格,使问题更加直观、清晰.
(2)当两个原理混合使用时,一般是先分类,在每类方法里再分步.
1.从黄瓜、白菜、油菜、扁豆4种蔬菜品种中选出3种,分别种在不同土质的三块土地上,其中黄瓜必须种植,不同的种植方法有( )
A.24种 B.18种
C.12种 D.6种
解析:选B 法一:(直接法)若黄瓜种在第一块土地上,则有3×2=6种不同的种植方法.同理,黄瓜种在第二块、第三块土地上均有3×2=6种不同的种植方法.故不同的种植方法共有6×3=18种.
法二:(间接法)从4种蔬菜中选出3种种在三块地上,有4×3×2=24种方法,其中不种黄瓜有3×2×1=6种方法,故共有不同的种植方法24-6=18种.
2.有红、黄、蓝旗各3面,每次升一面、二面或三面在旗杆上纵向排列表示不同的信号,顺序不同则表示不同的信号,共可以组成的信号有________种.
解析:每次升1面旗可组成3种不同的信号;每次升2面旗可组成3×3=9种不同的信号;每次升3面旗可组成3×3×3=27种不同的信号.根据分类加法计数原理,共可组成3+9+27=39种不同的信号.
答案:39
排列与组合应用问题
(1)高考中往往以实际问题为背景,考查排列与组合的综合应用,同时考查分类讨论的思想方法,常以选择题、填空题形式出现,有时与概率结合考查.
(2)解决排列组合问题的关键是掌握四项基本原则
①特殊优先原则:如果问题中有特殊元素或特殊位置,优先考虑这些特殊元素或特殊位置的解题原则.
②先取后排原则:在既有取出又需要对取出的元素进行排列中,要先取后排,即完整地把需要排列的元素取出后,再进行排列.
③正难则反原则:当直接求解困难时,采用间接法解决问题的原则.
④先分组后分配原则:在分配问题中如果被分配的元素多于位置,这时要先进行分组,再进行分配.
1.排列与组合的概念
名称
定义
排列
从n个不同元素中取出m(m≤n)个元素
按照一定的顺序排成一列
组合
合成一组
2.排列数与组合数的概念
名称
定义
排列数
从n个不同元素中取出m(m≤n)个元素的所有不同
排列的个数
组合数
组合的个数
3.排列数与组合数公式
(1)排列数公式
①A=n(n-1)…(n-m+1)=;②A=n!.
(2)组合数公式
C===.
4.组合数的性质
(1)C=C;(2)C+C=C.
[典例] (1)一排9个座位坐了3个三口之家,若每家人坐在一起,则不同的坐法种数为( )
A.3×3! B.3×(3!)3
C.(3!)4 D.9!
(2)(重庆高考)某次联欢会要安排3个歌舞类节目、2个小品类节目和1个相声类节目的演出顺序,则同类节目不相邻的排法种数是( )
A.72 B.120
C.144 D.168
(3)从6位同学中选出4位参加一个座谈会,要求张、王两同学中至多有一个人参加,则不同选法的种数为( )
A.9 B.14
C.12 D.15
[解析] (1)把一家三口看作一个排列,然后再排列这3家,所以有(3!)4种.
(2)依题意,先仅考虑3个歌舞类节目互不相邻的排法种数为AA=144,其中3个歌舞类节目互不相邻但2个小品类节目相邻的排法种数为AAA=24,因此满足题意的排法种数为144-24=120,选B.
(3)法一:(直接法)分两类,第一类张、王两同学都不参加,有C种选法;第二类张、王两同学中只有1人参加,有CC种选法.故共有C+CC=9种选法.
法二:(间接法)C-C=9种.
[答案] (1)C (2)B (3)A
[类题通法]
排列与组合综合问题的常见类型及解题策略
(1)相邻问题捆绑法.在特定条件下,将几个相关元素视为一个元素来考虑,待整个问题排好之后,再考虑它们“内部”的排列.
(2)相间问题插空法.先把一般元素排好,然后把特定元素插在它们之间或两端的空当中,它与捆绑法有同等作用.
(3)特殊元素(位置)优先安排法.优先考虑问题中的特殊元素或位置,然后再排列其他一般元素或位置.
1.有5盆各不相同的菊花,其中黄菊花2盆、白菊花2盆、红菊花1盆,现把它们摆放成一排,要求2盆黄菊花必须相邻,2盆白菊花不能相邻,则这5盆花的不同摆放种数是( )
A.12 B.24
C.36 D.48
解析:选B 2盆黄菊花捆绑作为一个元素与一盆红菊花排列,2盆白菊花采用插空法,所以这5盆花的不同摆放共有AAA=24种.
2.某班准备从含甲、乙的7名男生中选取4人参加4×100米接力赛,要求甲、乙两人至少有一人参加,且若甲、乙同时参加,则他们在赛道上顺序不能相邻,那么不同的排法种数为( )
A.720 B.520
C.600 D.360
解析:选C 根据题意,分2种情况讨论.①只有甲乙其中一人参加,有CCA=480种情况;②若甲乙两人都参加,有CCA=240种情况,其中甲乙相邻的有CCAA=120种情况,不同的排法种数为480+240-120=600种,故选C.
二项式定理及应用
(1)求二项展开式中的项或项的系数是高考的热点,通常以选择题、填空题形式考查,难度中低档.
(2)解决此类问题常遵循“知四求一”的原则
在二项式的通项公式中共含有a, b,n,k,Tk+1这五个元素,只要知道其中的4个元素,便可求第5个元素的值,在有关二项式定理的问题中,常常会遇到这样的问题:知道这5个元素中的若干个(或它们之间的关系),求另外几个元素. 这类问题一般是利用通项公式,把问题归结为解方程(组)或不等式(组). 这里要注意n为正整数,k为自然数,且k≤n.
1.二项式定理
二项式定理
(a+b)n=Can+Can-1b+…+
Can-kbk+…+Cbn(n∈N*)
二项式系数
二项展开式中各项系数C(r=0,1,…,n)
二项式通项
Tr+1=Can-rbr,它表示第r+1项
2.二项式系数的性质
[典例] (1)已知(1+ax)(1+x)5的展开式中x2的系数为5,则a=( )
A.-4 B.-3
C.-2 D.-1
(2)设m为正整数,(x+y)2m展开式的二项式系数的最大值为a,(x+y)2m+1展开式的二项式系数的最大值为b,若13a=7b,则m=( )
A.5 B.6
C.7 D.8
(3)若(1-2x)4=a0+a1x+a2x2+a3x3+a4x4,则a1+a2+a3+a4=________.
[解析] (1)展开式中含x2的系数为C+aC=5,解得a=-1,故选D.
(2)由题意得:a=C,b=C,
所以13C=7C,
∴=,
∴=13,解得m=6,经检验为原方程的解,选B.
(3)令x=1可得a0+a1+a2+a3+a4=1,令x=0,可得a0=1,所以a1+a2+a3+a4=0.
[答案] (1)D (2)B (3)0
[类题通法]
求二项式展开式有关问题的常见类型及解题策略
(1)求展开式中的特定项.可依据条件写出第r+1项,再由特定项的特点求出r值即可.
(2)已知展开式的某项,求特定项的系数.可由某项得出参数项,再由通项公式写出第r+1项,由特定项得出r值,最后求出其参数.
(3)与二项式各项系数的和有关的问题一般用赋值法求解.
1.在x(1+x)6的展开式中,含x3项的系数为( )
A.30 B.20
C.15 D.10
解析:选C 只需求(1+x)6的展开式中含x2项的系数即可,而含x2项的系数为C=15,故选C.
2.若(x-1)4=a0+a1x+a2x2+a3x3+a4x4,则a0+a2+a4的值为( )
A.9 B.8
C.6 D.5
解析:选B 令x=1,则a0+a1+a2+a3+a4=0,令x=-1,则a0-a1+a2-a3+a4=16,∴a0+a2+a4=8.
1.设二项式n的展开式各项系数的和为a,所有二项式系数的和为b,若a+2b=80,则n的值为( )
A.8 B.4
C.3 D.2
解析:选C 由题意a=4n,b=2n,∵a+2b=80,
∴4n+2×2n-80=0,
即(2n)2+2×2n-80=0,解得n=3.
2.教室里有6盏灯,由3个开关控制,每个开关控制2盏灯,则不同的照明方法有( )
A.63种 B.31种
C.8种 D.7种
解析:选D 由题意知,可以开2盏、4盏、6盏灯照明,不同方法有C+C+C=7(种).
3.分配4名水暖工去3户不同的居民家里检查暖气管道.要求4名水暖工都分配出去,且每户居民家都要有人去检查,那么分配的方案共有( )
A.A种 B.AA种
C.CA种 D.CCA种
解析:选C 先将4名水暖工选出2人分成一组,然后将三组水暖工分配到3户不同的居民家,故有CA种.
4.(x+2)2(1-x)5中x7的系数与常数项之差的绝对值为( )
A.5 B.3
C.2 D.0
解析:选A 常数项为C·22·C=4,x7系数为C·C(-1)5=-1,因此x7系数与常数项之差的绝对值为5.
5.6的展开式中,常数项是( )
A.- B.
C.- D.
解析:选D Tr+1=C(x2)6-rr=rCx12-13r,令12-3r=0,解得r=4.
∴常数项为4C=.故选D.
6.将4个颜色互不相同的球全部放入编号为1和2的两个盒子里,使得放入每个盒子里球的个数不小于该盒子的编号,则不同的放球方法有( )
A.10种 B.20种
C.36种 D.52种
解析:选A 分为两类:①1号盒子放入1个球,2号盒子放入3个球,有C=4种放球方法;②1号盒子放入2个球,2号盒子放入2个球,有C=6种放球方法.
∴共有C+C=10种不同的放球方法.
7.若将函数f(x)=x5表示为f(x)=a0+a1(1+x)+a2(1+x)2+…+a5(1+x)5,其中a0,a1,a2,…,a5为实数,则a3=________.
解析:不妨设1+x=t,则x=t-1,因此有(t-1)5=a0+a1t+a2t2+a3t3+a4t4+a5t5,则a3=C(-1)2=10.
答案:10
8.农科院小李在做某项试验中,计划从花生、大白菜、大豆、玉米、小麦、高粱这6种种子中选出4种,分别种植在4块不同的空地上(1块空地只能种1种作物),若小李已决定在第1块空地上种玉米或高粱,则不同的种植方案有________种.(用数字作答)
解析:由已知条件可得第1块地有C种种植方法,则第2~4块地共有A种种植方法,由分步乘法计数原理可得,不同的种植方案有CA=120种.
答案:120
9.(北京高考)把5件不同产品摆成一排,若产品A与产品B相邻,且产品A与产品C不相邻,则不同的摆法有________种.
解析:将A,B捆绑在一起,有A种摆法,再将它们与其他3件产品全排列,有A种摆法,共有AA=48种摆法,而A,B,C 3件在一起,且A,B相邻,A,C相邻有CAB,BAC两种情况,将这3件与剩下2件全排列,有2×A=12种摆法,故A,B相邻,A,C不相邻的摆法有48-12=36种.
答案:36
10.若(2x+3)3=a0+a1(x+2)+a2(x+2)2+a3(x+2)3,求a0+a1+2a2+3a3的值.
解:由(2x+3)3=[2(x+2)-1]3
=C[2(x+2)]3(-1)0+C[2(x+2)]2(-1)1+C[2·(x+2)]1(-1)2+C[2(x+2)]0(-1)3
=8(x+2)3-12(x+2)2+6(x+2)-1
=a0+a1(x+2)+a2(x+2)2+a3(x+2)3.
则a0=-1,a1=6,a2=-12,a3=8.
则a0+a1+2a2+3a3=5.
11.将7个相同的小球放入4个不同的盒子中.
(1)不出现空盒时的放入方式共有多少种?
(2)可出现空盒时的放入方式共有多少种?
解:(1)将7个相同的小球排成一排,在中间形成的6个空当中插入无区别的3个“隔板”将球分成4份,每一种插入隔板的方式对应一种球的放入方式,则共有C=20种不同的放入方式.
(2)每种放入方式对应于将7个相同的小球与3个相同的“隔板”进行一次排列,即从10个位置中选3个位置安排隔板,故共有C=120种放入方式.
12.已知(+3x2)n展开式中各项的系数和比各项的二项式系数和大992.
(1)求展开式中二项式系数的最大项;
(2)求展开式中系数最大的项.
解:(1)令x=1,则二项式各项系数和为(1+3)n=4n,
展开式中各项的二项式系数之和为2n.
由题意,知4n-2n=992.
∴(2n)2-2n-992=0.∴(2n+31)(2n-32)=0.
∴2n=-31(舍)或2n=32,∴n=5.
由于n=5为奇数,
∴展开式中二项式系数最大项为中间两项,它们是
T3=C(x)3(3x2)2=90x6,T4=C(x)2(3x2)3=270x.
(2)展开式通项公式为Tr+1=C3r·(x)5-r(x2)r=C·3r·x+.
假设Tr+1项系数最大,则有
∴
∴∴≤r≤.
∵r∈N*,∴r=4.
∴展开式中系数最大项为T5=C·34·x+=405x.
复习课(三) 统计案例
回归分析
(1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现.
(2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题.
1.一个重要方程
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其线性回归直线方程为=x+.
其中=,=-.
2.重要参数
相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好.
3.两种重要图形
(1)散点图:
散点图是进行线性回归分析的主要手段,其作用如下:
一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;
二是判断样本中是否存在异常.
(2)残差图:
残差图可以用来判断模型的拟合效果,其作用如下:
一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.
二是确认样本点在采集中是否有人为的错误.
[典例] (全国卷Ⅲ)如图是我国2008年到2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:i=9.32,iyi=40.17, =0.55,≈2.646.
参考公式:相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=-.
[解] (1)由折线图中数据和附注中参考数据得
=4,(ti-)2=28, =0.55,
(ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得
==≈0.103,
=-≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得
=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.
[类题通法]
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出散点图,并对样本点进行相关性检验,在此基础上选择适合的函数模型去拟合样本数据,从而建立较好的回归方程,并且用该方程对变量值进行分析;有时回归模型可能会有多种选择(如非线性回归模型),此时可通过残差分析或利用相关指数R2来检查模型的拟合效果,从而得到最佳模型.
1.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2
2.寒假中, 某同学为组织一次爱心捐款, 在网上给网友发了张帖子, 并号召网友转发,下表是发帖后一段时间收到帖子的人数统计:
天数x
1
2
3
4
5
6
7
人数y
7
11
21
24
66
115
325
(1)作出散点图,并猜测x与y之间的关系.
(2)建立x与y的关系, 预报回归模型.
(3)如果此人打算在帖子传播10天时进行募捐活动, 根据上述回归模型, 估计可去多少人.
解:(1)画出散点图如图所示.
从散点图可以看出x与y不具有线性相关关系, 同时可发现样本点分布在某一个函数曲线y=kemx的周围, 其中k, m是参数.
(2)对y=kemx两边取对数,把指数关系变成线性关系. 令z=ln y,则变换后的样本点分布在直线z=bx+a(a=ln k, b=m)的周围, 这样就可以利用线性回归模型来建立x与y之间的非线性回归方程了, 数据可以转化为:
天数x
1
2
3
4
5
6
7
人数的
对数z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
求得回归直线方程为=0.620x+1.133,
所以=e0.620x+1.133.
(3)当x=10, 此时=e0.620×10+1.133≈1 530(人).
所以估计可去1 530人.
独立性检验
(1)近几年高考中对独立性检验的考查频率有所降低,题目多以解答题形式出现,一般为容易题,多与概率、统计等内容综合命题.
(2)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系” 成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过概率P(K2≥6.635)≈0.01来评价该假设不合理的程度,由实际计算出的k>6.635,说明该假设不合理的程度约为99%,即“两个分类变量有关系” 这一结论成立的可信程度约为99%.
在实际问题中常用的几个数值
(1)K2≥6.635表示认为“X与Y有关系”犯错误的概率不超过0.01.
(2)K2≥3.841表示认为“X与Y有关系”犯错误的概率不超过0.05.
(3)K2≥2.706表示认为“X与Y有关系”犯错误的概率不超过0.1.
[典例] 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食为肉类为主.)
(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯.
(2)根据以上数据完成如表所示的2×2列联表.
主食蔬菜
主食肉类
总计
50岁以下
50岁以上
总计
(3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?
[解] (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主.
(2)2×2列联表如表所示:
主食蔬菜
主食肉类
总计
50岁以下
4
8
12
50岁以上
16
2
18
总计
20
10
30
(3)随机变量K2的观测值k===10>6.635,
故在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”.
[类题通法]
独立性检验问题的求解策略
(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性.
(2)K2统计量法:通过公式
K2=
先计算观测值k,再与临界值表作比较,最后得出结论.
1.下表是某地区的一种传染病与饮用水的调查表:
得病
不得病
总计
干净水
52
466
518
不干净水
94
218
312
总计
146
684
830
(1)能否在犯错误概率不超过0.01的前提下认为这种传染病与饮用水的卫生程度有关,请说明理由.
(2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析能否在犯错误概率不超过0.025的前提下认为这种疾病与饮用水有关.
解:(1)把表中的数据代入公式得
K2的观测值k=≈54.21.
∵54.21>6.635,
所以在犯错误的概率不超过0.01的前提下,认为该地区这种传染病与饮用水不干净有关.
(2)依题意得2×2列联表:
得病
不得病
总计
干净水
5
50
55
不干净水
9
22
31
总计
14
72
86
此时,K2的观测值k=≈5.785.
因为5.785>5.024,
所以能在犯错误概率不超过0.025的前提下认为该种疾病与饮用水不干净有关.
2.2016年第三十一届奥运会在巴西首都里约热内卢举行,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:
是否愿意提供志愿者服务性别
愿意
不愿意
男生
20
10
女生
10
20
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人, 其中男生抽取多少人?
(2)在(1)中抽取的6人中任选2人, 求恰有一名女生的概率.
(3)你能否在犯错误的概率不超过0.01的前提下认为该校高中生是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
独立性检验统计量K2=,其中n=a+b+c+d.
解:(1)由题意,男生抽取6×=4(人),女生抽取6×=2(人).
(2)在(1)中抽取的6人中任选2人,恰有一名女生的概率P==.
(3)K2=≈6.667,由于6.667>6.635,所以能在犯错误的概率不超过0.01的前提下认为该校高中生是否愿意提供志愿者服务与性别有关.
1.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )
优、良、中
差
总计
实验班
48
2
50
对比班
38
12
50
总计
86
14
100
A.有关 B.无关
C.关系不明确 D.以上都不正确
解析:选A 随机变量K2的观测值k=≈8.306>6.635,则有99%的把握认为“实验效果与教学措施有关”.
2.下列说法中正确的有:( )
①若r>0,则x增大时,y也相应增大;
②若r<0,则x增大时,y也相应增大;
③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.
A.①② B.②③
C.①③ D.①②③
解析:选C 若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故①正确.r<0,表示两个变量负相关,x增大时,y相应减小,故②错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.
3.有下列数据( )
x
1
2
3
y
3
5.99
12.01
下列四个函数中,模拟效果最好的为( )
A.y=3×2x-1 B.y=log2x
C.y=3x D.y=x2
解析:选A 分别把x=1,2,3,代入求值,求最接近y的值.即为模拟效果最好,故选A.
4.若两个变量的残差平方和是325,(yi-)2=923,则随机误差对预报变量的贡献率约为( )
A.64.8% B.60%
C.35.2% D.40%
解析:选C 由题意可知随机误差对预报变量的贡献率约为≈0.352.
5.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,C.< b′,>a′ D.解析:选C 过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然a′. 故选C.
6.收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y与x之间的回归方程,并算出了对应相关指数R2如下表:
拟合曲线
直线
指数曲线
抛物线
二次曲线
y与x回归方程
=19.8x-
463.7
=e0.27x-3.84
=0.367x2-
202
=
相关指数R2
0.746
0.996
0.902
0.002
则这组数据模型的回归方程的最好选择应是( )
A.=19.8x-463.7 B.=e0.27x-3.84
C.=0.367x2-202 D.=
解析:选B 用相关指数R2来刻画回归效果,R2的值越大,说明模型的拟合效果越好.
7.某学校对课程《人与自然》的选修情况进行了统计,得到如下数据:
选
未选
总计
男
405
45
450
女
230
220
450
总计
635
265
900
那么,认为选修《人与自然》与性别有关的把握是________.
解析:K2=
=163.794>10.828,即有99.9%的把握认为选修《人与自然》与性别有关.
答案:99.9%
8.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个)
10
20
30
40
50
加工时间y(min)
62
75
81
89
现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.
解析:由表知=30,设模糊不清的数据为m,则=(62+m+75+81+89)=,因为=0.67+54.9,
即=0.67×30+54.9,解得m=68.
答案:68
9.变量U与V相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到U与V的线性回归分析,R2表示解释变量对于预报变量变化的贡献率,则R2=______.
解析:在线性回归中,相关指数R2等于相关系数,由x1=1,x2=2,x3=3,x4=4得:=2.5,y1=1.4,y2=2.2,y3=3,y4=3.8得:=2.6,
所以相关系数r=
=
===1.
故R2=1.
答案:1
10.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据,试问:文科学生总成绩不好与数学成绩不好有关系吗?
总成绩情况
数学成绩情况
总成绩好
总成绩不好
总计
数学成绩好
478
12
490
数学成绩不好
399
24
423
总计
877
36
913
解:根据题意,计算随机变量的观测值:
K2=≈6.233>5.024,
因此有97.5%的把握认为“文科学生总成绩不好与数学成绩不好有关系”.
11.某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如表所示:
积极参加
班级工作
不太主动
参加班级工作
总计
学习积极性高
18
学习积极性一般
19
总计
50
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是,请完成上面的2×2列联表.
(2)在(1)的条件下,试运用独立性检验的思想方法分析:在犯错误概率不超过0.1%的情况下判断学生的学习积极性与对待班级工作的态度是否有关?并说明理由.
P(K2≥k0)
0.010
0.005
0.001
k0
6.635
7.879
10.828
解:(1)如果随机抽查这个班的一名学生,抽到积极参加班级工作的学生的概率是,所以积极参加班级工作的学生有24人,由此可以算出学习积极性一般且积极参加班级工作的人数为6,不太主动参加班级工作的人数为26,学习积极性高但不太主动参加班级工作的人数为7,学习积极性高的人数为25,学习积极性一般的人数为25,得到:
积极参加
班级工作
不太主动
参加班级工作
总计
学习积极性高
18
7
25
学习积极性一般
6
19
25
总计
24
26
50
(2)K2=≈11.538,
因为11.538>10.828,所以在犯错误的概率不超过0.001的前提下可以认为学习积极性与对待班级工作的态度有关系.
12.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷
体育迷
总计
男
女
10
55
总计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:K2=.
P(K2≥k0)
0.05
0.01
k0
3.841
6.635
解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:
非体育迷
体育迷
总计
男
30
15
45
女
45
10
55
总计
75
25
100
将2×2列联表中的数据代入公式计算,得
K2=
==≈3.030.
因为3.030<3.841,所以没有理由认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为
Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}.
其中ai表示男性,i=1,2,3.bj表示女性,j=1,2.
Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.
用A表示“任选2人中,至少有1人是女性”这一事件,则
A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},
事件A由7个基本事件组成,因而P(A)=.
(时间120分钟 满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法正确的有( )
①回归方程适用于一切样本和总体.
②回归方程一般都有时间性.
③样本取值的范围会影响回归方程的适用范围.
④回归方程得到的预报值是预报变量的精确值.
A.①② B.②③
C.③④ D.①③
解析:选B 回归方程只适用于所研究样本的总体,所以①不正确;而“回归方程一般都有时间性”正确,③也正确;而回归方程得到的预报值是预报变量的近似值,故选B.
2.某校教学大楼共有5层,每层均有2个楼梯,则由一楼至五楼的不同走法共有( )
A.24种 B.52种
C.10种 D.7种
解析:选A 因为每层均有2个楼梯,所以每层有两种不同的走法,由分步计数原理可知:从一楼至五楼共有24种不同走法.
3.设随机变量X服从二项分布X~B(n,p),则等于( )
A.p2 B.(1-p)2
C.1-p D.以上都不对
解析:选B 因为X~B(n,p),(D(X))2=[np(1-p)]2,(E(X))2=(np)2,所以==(1-p)2.故选B.
4.若(2x+)4=a0+a1x+a2x2+a3x3+a4x4,则(a0+a2+a4)2-(a1+a3)2的值是( )
A.1 B.-1
C.0 D.2
解析:选A 令x=1,得a0+a1+…+a4=(2+)4,令x=-1,a0-a1+a2-a3+a4=(-2+)4. 所以(a0+a2+a4)2-(a1+a3)2=(2+)4(-2+)4=1.
5.给出以下四个说法:
①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;
②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;
③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=;
④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.
其中正确的说法是( )
A.①④ B.②③
C.①③ D.②④
解析:选B ①中各小长方形的面积等于相应各组的频率;②正确,相关指数R2越大,拟合效果越好,R2越小,拟合效果越差;③随机变量ξ服从正态分布N(4,22),正态曲线对称轴为x=4,所以P(ξ>4)=;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则说明“X与Y有关系”的犯错误的概率越大.
6.若随机变量ξ~N(-2,4),则ξ在区间(-4,-2]上取值的概率等于ξ在下列哪个区间上取值的概率( )
A.(2,4] B.(0,2]
C.[-2,0) D.(-4,4]
解析:选C 此正态曲线关于直线x=-2对称,∴ξ在区间(-4,-2]上取值的概率等于ξ在[-2,0)上取值的概率.
7.如图所示,A,B,C表示3种开关,若在某段时间内它们正常工作的概率分别为0.9,0.8,0.7,那么此系统的可靠性为( )
A.0.504 B.0.994
C.0.496 D.0.06
解析:选B A、B、C三个开关相互独立,三个中只要至少有一个正常工作即可,由间接法知P=1-(1-0.9)×(1-0.8)(1-0.7)=1-0.1×0.2×0.3=0.994.
8.一牧场有10头牛,因误食含有病毒的饲料而被感染,已知该病的发病率为0.02.设发病的牛的头数为ξ,则D(ξ)等于( )
A.0.2 B.0.8
C.0.196 D.0.804
解析:选C 因为由题意知该病的发病率为0.02,且每次试验结果都是相互独立的,所以ξ~B(10,0.02),
所以由二项分布的方差公式得到D(ξ)=10×0.02×0.98=0.196.故选C.
9.学校小卖部为了研究气温对饮料销售的影响,经过统计,得到一个卖出饮料数与当天气温的对比表:
摄氏温度
-1
3
8
12
17
饮料瓶数
3
40
52
72
122
根据上表可得回归方程=x+中的为6,据此模型预测气温为30 ℃时销售饮料瓶数为( )
A.141 B.191
C.211 D.241
解析:选B 由题意,==7.8,
==57.8,
因为回归方程=x+中的为6,所以57.8=6×7.8+,
所以=11,所以=6x+11,所以x=30时,=6×30+11=191,故选B.
10.如图,用4种不同颜色对图中5个区域涂色(4种颜色全部使用),要求每个区域涂一种颜色,相邻的区域不能涂相同的颜色,则不同的涂色种数有( )
A.72 B.96
C.108 D.120
解析:选B 颜色都用上时,必定有两块同色,在图中,同色的可能是1,3或1,5或2,5或3,5.对每种情况涂色有A=24种,所以一共有96种.
11.假设每一架飞机的引擎在飞行中出现故障的概率为1-p,且各引擎是否有故障是独立的,已知4引擎飞机中至少有3个引擎正常运行,飞机就可成功飞行;2个引擎飞机要2个引擎全部正常运行,飞机才可成功飞行.要使4个引擎飞机更安全,则p的取值范围是( )
A. B.
C. D.
解析:选B 4个引擎飞机成功飞行的概率为Cp3(1-p)+p4,2个引擎飞机成功飞行的概率为p2,要使Cp3(1-p)+p4>p2,必有
A.18个 B.16个
C.14个 D.12个
解析:选C 由题意知:当m=4时,“规范01数列”共含有8项,其中4项为0,4项为1,且必有a1=0,a8=1.不考虑限制条件“对任意k≤2m,a1,a2,…,ak中0的个数不少于1的个数”,则中间6个数的情况共有C=20(种),其中存在k≤2m,a1,a2,…,ak中0的个数少于1的个数的情况有:①若a2=a3=1,则有C=4(种);②若a2=1,a3=0,则a4=1,a5=1,只有1种;③若a2=0,则a3=a4=a5=1,只有1种.综上,不同的“规范01数列”共有20-6=14(种).故共有14个.故选C.
二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)
13.(四川高考)同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,则在2次试验中成功次数X的均值是__________.
解析:法一:由题意可知每次试验不成功的概率为,成功的概率为,在2次试验中成功次数X的可能取值为0,1,2,则P(X=0)=,P(X=1)=C××=,P(X=2)=2=.
所以在2次试验中成功次数X的分布列为
X
0
1
2
P
则在2次试验中成功次数X的均值为
E(X)=0×+1×+2×=.
法二:此试验满足二项分布,其中p=,所以在2次试验中成功次数X的均值为E(X)=np=2×=.
答案:
14.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如表
患慢性气管炎
未患慢性气管炎
总计
吸烟
43
162
205
不吸烟
13
121
134
总计
56
283
339
根据列联表数据,求得K2≈__________.
解析:由计算公式K2=,
得K2≈7.469.
答案:7.469
15.从0,1,2,3,4,5,6,7,8,9中任取七个不同的数,则这七个数的中位数是6的概率为________.
解析:十个数中任取七个不同的数共有C种情况,七个数的中位数为6,那么6只有处在中间位置,有C种情况,于是所求概率P==.
答案:
16.某射手射击1次,击中目标的概率是0.9,他连续射击4次,且各次射击是否击中目标相互之间没有影响,有下列结论:
①他第3次击中目标的概率是0.9;
②他恰好击中目标3次的概率是0.93×0.1;
③他至少击中目标1次的概率是1-0.14.
其中正确结论的序号是________(写出所有正确结论的序号).
解析:①因为各次射击是否击中目标相互之间没有影响,所以第3次击中目标的概率是0.9,正确;
②恰好击中目标3次的概率应为C×0.93×0.1;
③4次射击都未击中的概率为0.14;
所以至少击中目标1次的概率为1-0.14.
答案:①③
三、简答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)已知(a2+1)n展开式中的各项系数之和等于5的展开式的常数项,而(a2+1)n的展开式的系数最大的项等于54,求a的值.
解:5的展开式的通项为
Tr+1=C5-rr
=5-rCx,
令20-5r=0,得r=4,
故常数项T5=C×=16.
又(a2+1)n展开式的各项系数之和等于2n,
由题意知2n=16,得n=4.
由二项式系数的性质知,(a2+1)n展开式中系数最大的项是中间项T3,
故有Ca4=54,解得a=±.
18.(本小题满分12分)(全国甲卷)某险种的基本保费为a(单元:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概率
0.30
0.15
0.20
0.20
0.10
0.05
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
解:(1)设A表示事件“一续保人本年度的保费高于基本保费”,则事件A发生当且仅当一年内出险次数大于1,故P(A)=1-(0.30+0.15)=0.55.
(2)设B表示事件“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)=0.1+0.05=0.15.
又P(AB)=P(B),
故P(B|A)====.
因此所求概率为.
(3)记续保人本年度的保费为X,则X的分布列为
X
0.85a
a
1.25a
1.5a
1.75a
2a
P
0.30
0.15
0.20
0.20
0.10
0.05
EX=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.
因此续保人本年度的平均保费与基本保费的比值为1.23.
19.(本小题满分12分)退休年龄延迟是平均预期寿命延长和人口老龄化背景下的一种趋势.某机构为了解某城市市民的年龄构成,按1%的比例从年龄在20~80岁(含20岁和80岁)之间的市民中随机抽取600人进行调查,并将年龄按[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]进行分组,绘制成频率分布直方图,如图所示.规定年龄在[20,40)岁的人为“青年人”,[40,60)岁的人为“中年人”,[60,80]岁的人为“老年人”.
(1)根据频率分布直方图估计该城市60岁以上(含60岁)的人数,若每一组中的数据用该组区间的中点值来代表,试估算所调查的600人的平均年龄;
(2)将上述人口分布的频率视为该城市年龄在20~80岁的人口分布的概率,从该城市年龄在20~80岁的市民中随机抽取3人,记抽到“老年人”的人数为X,求随机变量X的分布列和数学期望.
解:(1)由频率分布直方图可知60岁以上(含60岁)的频率为(0.01+0.01)×10=0.2,
故样本中60岁以上(含60岁)的人数为600×0.2=120,故该城市60岁以上(含60岁)的人数为120÷1%=12 000.
所调查的600人的平均年龄为
25×0.1+35×0.2+45×0.3+55×0.2+65×0.1+75×0.1=48(岁).
(2)由频率分布直方图知,“老年人”所占的频率为,
所以从该城市年龄在20~80岁的市民中随机抽取1人,抽到“老年人”的概率为,
分析可知X的所有可能取值为0,1,2,3,
P(X=0)=C03=,
P(X=1)=C12=,
P(X=2)=C21=,
P(X=3)=C30=.
所以X的分布列为
X
0
1
2
3
P
EX=0×+1×+2×+3×=.
20.(本小题满分12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,=i.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为=,=- .
解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程.
由于===68,
=-=563-68×6.8=100.6,
所以y关于w的线性回归方程=100.6+68w,
因此y关于x的回归方程为=100.6+68.
(3)①由(2)知,当x=49时,
年销售量y的预报值=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
21.(本小题满分12分)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可吸入肺颗粒物.我国PM2.5标准采用世卫组织设定的最宽限值,即PM2.5日均值在35微克/立方米以下空气质量为一级;在35微克/立方米~75微克/立方米之间空气质量为二级;在75微克/立方米以上空气质量为超标.
某试点城市环保局从该市市区2015年全年每天的PM2.5监测数据中随机抽取15天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶)
(1)从这15天的PM2.5日均监测数据中,随机抽出三天,求恰有一天空气质量达到一级的概率.
(2)从这15天的数据中任取三天数据,记ξ表示抽到PM2.5监测数据超标的天数,求ξ的分布列及数学期望.
(3)以这15天的PM2.5日均值来估计一年的空气质量情况,则一年(按360天计算)中平均有多少天的空气质量达到一级或二级.
解:(1)记“从15天的PM2.5日均监测数据中,随机抽出三天,恰有一天空气质量达到一级”为事件A,P(A)==.
(2)依据条件,ξ服从超几何分布:ξ的可能值为0,1,2,3,
其分布列为:
P(ξ=k)=(k=0,1,2,3).
ξ
0
1
2
3
P
则E(X)=0×+1×+2×+3×=1,
(3)依题意可知,一年中每天空气质量达到一级或二级的概率为P==,
一年中空气质量达到一级或二级的天数为η,
则η~B,
所以E(η)=360×=240,
所以一年中平均有240天的空气质量达到一级或二级.
22.(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少位女生样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4个小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
附:K2=
解:(1)由分层抽样得收集的女生样本数据为300×=90,
所以应收集90位女生的样本数据.
(2)由频率分布直方图得2×(0.150+0.125+0.075+0.025)=0.75,
所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由(2)知,300名学生中有300×0.75=225人的每周平均体育运动时间超过4个小时.75人的每周平均体育运动时间不超过4个小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别的列联表如下:
平均体育运动时间与性别列联表
男生
女生
总计
不超过4个小时
45
30
75
超过4个小时
165
60
225
总计
210
90
300
结合列联表可算得K2的观测值k=≈4.762>3.841.
在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
复习课(二) 随机变量及其分布
条件概率
(1)在近几年的高考中对条件概率的考查有所体现,一般以选择题或填空题形式考查,难度中低档.
(2)条件概率是学习相互独立事件的前提和基础,计算条件概率时,必须搞清欲求的条件概率是在什么条件下发生的概率.
条件概率的性质
(1)非负性:0≤P(B|A)≤1.
(2)可加性:如果是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A).
[典例] 口袋中有2个白球和4个红球, 现从中随机地不放回连续抽取两次, 每次抽取1个, 则:
(1)第一次取出的是红球的概率是多少?
(2)第一次和第二次都取出的是红球的概率是多少?
(3)在第一次取出红球的条件下, 第二次取出的是红球的概率是多少?
[解] 记事件A:第一次取出的是红球; 事件B:第二次取出的是红球.
(1)从中随机地不放回连续抽取两次,每次抽取1个, 所有基本事件共6×5个; 第一次取出的是红球, 第二次是其余5个球中的任一个, 符合条件的有4×5个, 所以
P(A)==.
(2)从中随机地不放回连续抽取两次,每次抽取1个,所有基本事件共6×5个;第一次和第二次都取出的是红球,相当于取两个球,都是红球,符合条件的有4×3个,所以P(AB)==.
(3)利用条件概率的计算公式,可得P(B|A)===.
[类题通法]
条件概率的两个求解策略
(1)定义法:计算P(A),P(B),P(AB),利用P(A|B)=或P(B|A)=求解.
(2)缩小样本空间法:利用P(B|A)=求解.
其中(2)常用于古典概型的概率计算问题.
1.从编号为1,2,…,10的10个大小相同的球中任取4个,已知选出4号球的条件下,选出球的最大号码为6的概率为________.
解析:令事件A={选出的4个球中含4号球},B={选出的4个球中最大号码为6}.依题意知n(A)=C=84,n(AB)=C=6,∴P(B|A)===.
答案:
2.已知男人中有5%患色盲,女人中有0.25%患色盲,从100个男人和100个女人中任选一人.
(1)求此人患色盲的概率.
(2)如果此人是色盲,求此人是男人的概率.(以上各问结果写成最简分式形式).
解:设“任选一人是男人”为事件A,“任选一人是女人”为事件B,“任选一人是色盲”为事件C.
(1)此人患色盲的概率
P=P(AC)+P(BC)=P(A)P(C|A)+P(B)P(C|B)
=×+×=.
(2)由(1)得P(AC)=,又因为P(C)=,
所以P(A|C)===.
相互独立事件的概率与二项分布
(1)相互独立事件一般与互斥事件、对立事件结合在一起进行考查,高考经常考查,各种题型均有可能出现,难度中低档. 而二项分布也是高考考查的重点,高考以大题为主,有时也以选择、填空题形式考查.
(2)解答此类问题时应分清事件间的内部联系,在此基础上用基本事件之间的交、并、补运算表示出有关事件,并运用相应公式求解.
(1)若事件A与B相互独立, 则事件与B,A与,与分别相互独立, 且有P(B)=P()P(B),P(A)=P(A)P(),P(AB)=P()P().
(2)若事件A1,A2,…,An相互独立,则有P(A1A2A3…An)=P(A1)P(A2)…P(An).
(3)在n次独立重复试验中,事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为P(X=k)=Cpk(1-p)n-k,k=0,1,2,…,n.
(4)二项分布满足的条件
与二项分布有关的问题关键是二项分布的判定,可从以下几个方面判定:
①每次试验中,事件发生的概率是相同的.
②各次试验中的事件是相互独立的.
③每次试验只有两种结果:事件要么发生,要么不发生.
④随机变量是这n次独立重复试验中某事件发生的次数.
[典例] 某班甲、乙、丙三名同学竞选班委,甲当选的概率为,乙当选的概率为,丙当选的概率为.
(1)求恰有一名同学当选的概率;
(2)求至多有两人当选的概率.
[解] 设甲、乙、丙当选的事件分别为A,B,C,
则有P(A)=,P(B)=,P(C)=.
(1)∵A,B,C相互独立,
∴ 恰有一名同学当选的概率为
P(A··)+P(·B·)+P(··C)
=P(A)·P()·P()+P()·P(B)·P()+P()·P()·P(C)
=××+××+××=.
(2)至多有两人当选的概率为1-P(ABC)
=1-P(A)·P(B)·P(C)=1-××=.
[类题通法]
求相互独立事件同时发生的概率需注意的三个问题
(1)“P(AB)=P(A)P(B)”是判断事件是否相互独立的充要条件,也是解答相互独立事件概率问题的唯一工具.
(2)涉及“至多”“至少”“恰有”等字眼的概率问题,务必分清事件间的相互关系.
(3)公式“P(A+B)=1-P() ”常应用于求相互独立事件至少有一个发生的概率.
1.投掷一枚均匀硬币和一枚均匀骰子各一次,记“硬币正面向上”为事件A,“骰子向上的点数是3”为事件B,则事件A,B中至少有一件发生的概率是________.
解析:用间接法考虑,事件A,B一个都不发生的概率为P(AB)=P()·P()=×=,
则事件A,B中至少有一件发生的概率
P=1-P(AB)=.
答案:
2.在一次抗洪抢险中,准备用射击的办法引爆从上游漂流而下的一个巨大汽油罐,已知只有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击是相互独立的,且命中的概率都是.
(1)求油罐被引爆的概率;
(2)如果引爆或子弹打光则停止射击,设射击次数为ξ,求ξ不小于4的概率.
解:(1)油罐引爆的对立事件为油罐没有引爆,没有引爆的可能情况是:射击5次只击中一次或一次也没有击中,故该事件的概率为:
P=C··4+5,
所以所求的概率为
1-P=1-=.
(2)当ξ=4时记事件A,
则P(A)=C··2·=.
当ξ=5时,意味着前4次射击只击中一次或一次也未击中,记为事件B.
则P(B)=C··3+4=,
所以所求概率为:
P(A∪B)=P(A)+P(B)=+=.
离散型随机变量的期望与方差
(1)离散型随机变量的期望和方差是随机变量中两种最重要的特征数,它们反映了随机变量取值的平均值及其稳定性,是高考的一个热点问题,多与概率统计结合考查,难度中高档.
(2)期望与方差在实际优化问题中有大量的应用,关键要将实际问题数学化,然后求出它们的概率分布列,同时,要注意运用两点分布、二项分布等特殊分布的期望、方差公式以及期望与方差的线性性质,如E(aX+b)=aE(X)+b,D(aX+b)=a2D(X).
(1)求离散型随机变量的期望与方差,一般先列出分布列,再按期望与方差的计算公式计算.
(2)要熟记特殊分布的期望与方差公式(如两点分布、二项分布、超几何分布).
(3)注意期望与方差的性质.
(4)实际应用问题,要注意分析实际问题用哪种数学模型来表达.
[典例] (全国乙卷)某公司计划购买2 台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200 元.在机器使用期间,如果备件不足再购买,则每个500 元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100 台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100 台机器更换的易损零件数的频率代替1 台机器更换的易损零件数发生的概率,记X表示2 台机器三年内共需更换的易损零件数,n表示购买2 台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
[解] (1)由柱状图及以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.
从而P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04.
所以X的分布列为
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,
故n的最小值为19.
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时,
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040;
当n=20时,
E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19.
[类题通法]
求离散型随机变量X的期望与方差的步骤
(1)理解X的意义,写出X可能的全部取值;
(2)求X取每个值的概率或求出函数P(X=k);
(3)写出X的分布列;
(4)由分布列和期望的定义求出E(X);
(5)由方差的定义, 求D(X), 若X~B(n,p), 则可直接利用公式求,E(X)=np,D(X)=np(1-p).
1.一袋中装有分别标记着1,2,3数字的3个小球,每次从袋中取出一个球(每只小球被取到的可能性相同),现连续取3次球,若每次取出一个球后放回袋中,记3次取出的球中标号最小的数字与最大的数字分别为X,Y,设ξ=Y-X,则E(ξ)=________.
解析:由题意知ξ的取值为0,1,2,ξ=0,表示X=Y,ξ=1表示X=1,Y=2或X=2,Y=3;ξ=2表示X=1,Y=3. ∴P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,∴E(ξ)=0×+1×+2×=.
答案:
2.一次同时投掷两枚相同的正方体骰子(骰子质地均匀,且各面分别刻有1,2,2,3,3,3六个数字).
(1)设随机变量η表示一次掷得的点数和,求η的分布列.
(2)若连续投掷10次,设随机变量ξ表示一次掷得的点数和大于5的次数,求E(ξ),D(ξ).
解:(1)由已知,随机变量η的取值为:2,3,4,5,6.
投掷一次正方体骰子所得点数为X,则
P(X=1)=,P(X=2)=,P(X=3)=,
即P(η=2)=×=,
P(η=3)=2××=,
P(η=4)=2××+×=,
P(η=5)=2××=,
P(η=6)=×=.
故η的分布列为
P
2
3
4
5
6
η
(2)由已知,满足条件的一次投掷的点数和取值为6,设其发生的概率为p,由(1)知,p=,
因为随机变量ξ~B,
所以E(ξ)=np=10×=,D(ξ)=np(1-p)=10××=.
正态分布
(1)高考主要以选择、填空题形式考查正态曲线的形状特征与性质,在大题中主要以条件或一问呈现,难度中档.
(2)注意数形结合.由于正态分布密度曲线具有完美的对称性,体现了数形结合的重要思想,因此运用对称性结合图象解决某一区间内的概率问题成为热点问题.
正态变量在三个特殊区间内取值的概率
(1)P(μ-σ
A.0.447 B.0.628
C.0.954 D.0.977
[解析] ∵随机变量ξ服从标准正态分布N(0,σ2),
∴正态曲线关于x=0对称.又P(ξ>2)=0.023,
∴P(ξ<-2)=0.023.∴P(-2≤ξ≤2)=1-2×0.023=0.954.
[答案] C
[类题通法]
根据正态曲线的对称性求解概率的三个关键点
(1)正态曲线与x轴围成的图形面积为1;
(2)正态曲线关于直线x=μ对称,则正态曲线在对称轴x=μ的左右两侧与x轴围成的面积都为0.5;
(3)可以利用等式P(X≥μ+c)=P(X≤μ-c)(c>0)对目标概率进行转化求解.
1.设随机变量ξ服从正态分布N(0,1),P(ξ>1)=p,则P(-1<ξ<0)等于( )
A.p B.1-p
C.1-2p D.-p
解析:选D 由于随机变量服从正态分布N(0,1),由标准正态分布图象可得P(-1<ξ<1)=1-2P(ξ>1)=1-2p. 故P(-1<ξ<0)=P(-1<ξ<1)=-p.
2.已知X~N(μ,σ2),且P(X>0)+P(X≥-4)=1,则μ=________.
解析:∵P(X>0)+P(X≥-4)=1,又∵P(X<-4)+P(X≥-4)=1,∴P(X>0)=P(X<-4),又0与-4关于x=-2对称,∴曲线关于x=-2对称,即μ=-2.
答案:-2
1.某人进行射击,共有5发子弹,击中目标或子弹打完就停止射击,射击次数为ξ,则 “ξ=5” 表示的试验结果是( )
A.第5次击中目标 B.第5次未击中目标
C.前4次未击中目标 D.第4次击中目标
解析:选C 击中目标或子弹打完就停止射击,射击次数为ξ=5,则说明前4次均未击中目标,故选C.
2.甲击中目标的概率是,如果击中赢10分,否则输11分,用X表示他的得分,计算X的均值为( )
A.0.5分 B.-0.5分
C.1分 D.5分
解析:选B E(X)=10×+(-11)×=-.
3.甲、乙两个工人在同样的条件下生产,日产量相等,每天出废品的情况如下表所列,则有结论( )
工人
甲
乙
废品数
0
1
2
3
0
1
2
3
概率
0.4
0.3
0.2
0.1
0.3
0.5
0.2
0
A.甲的产品质量比乙的产品质量好一些
B.乙的产品质量比甲的质量好一些
C.两人的产品质量一样好
D.无法判断谁的质量好一些
解析:选B ∵E(X甲)=0×0.4+1×0.3+2×0.2+3×0.1=1,E(X乙)=0×0.3+1×0.5+2×0.2+3×0=0.9.∵E(X甲)>E(X乙),∴乙的产品质量比甲的产品质量好一些.
4.抛掷红、蓝两颗骰子,若已知蓝骰子的点数为3或6时,则两颗骰子点数之和大于8的概率为( )
A. B.
C. D.
解析:选D 记事件A为“ 蓝骰子的点数为3或6”,A发生时红骰子的点数可以为1到6中任意一个,n(A)=12,记B:“两颗骰子点数之和大于8”,则AB包含(3,6),(6,3),(6,4),(6,5),(6,6)5种情况,所以P(B|A)==.
5.已知随机变量X和Y,其中Y=12X+7,且E(Y)=34,若X的分布列如下表,则m的值为( )
X
1
2
3
4
P
m
n
A. B.
C. D.
解析:选A 由Y=12X+7,得E(Y)=12E(X)+7=34,从而E(X)=.∴E(X)=1×+2m+3n+4×=,即2m+3n=,m+n=1--=,解得m=.
6.甲、乙两人独立地对同一目标各射击一次,其命中率分别为0.6,0.5,现已知目标被击中,则它是被甲击中的概率是( )
A.0.45 B.0.6
C.0.65 D.0.75
解析:选D 令事件A,B分别表示甲、乙两人各射击一次击中目标,由题意可知P(A)=0.6,P(B)=0.5,令事件C表示目标被击中,则C=A∪B,则P(C)=1-P()P()=1-0.4×0.5=0.8,所以P(A|C)===0.75.
7.袋中有4只红球3只黑球,从袋中任取4只球,取到1只红球得1分,取到1只黑球得3分,设得分为随机变量X,则P(X≤6)=________.
解析:P(X≤6)=P(X=4)+P(X=6)==.
答案:
8.某人参加驾照考试,共考6个科目,假设他通过各科考试的事件是相互独立的,并且概率都是p.若此人未能通过的科目数ξ的均值是2,则p=________.
解析:因为通过各科考试的概率为p,所以不能通过考试的概率为1-p,易知ξ~B(6,1-p),所以E(ξ)=6(1-p)=2,解得p=.
答案:
9.从某地区的儿童中挑选体操学员,已知儿童体型合格的概率为,身体关节构造合格的概率为,从中任挑一儿童,这两项至少有一项合格的概率是(假定体型与身体关节构造合格与否相互之间没有影响)________.
解析:设“儿童体型合格”为事件A,“身体关节构造合格”为事件B,则P(A)=,P(B)=.又A,B相互独立,则,也相互独立,则P( )=P()P()=×=,故至少有一项合格的概率为P=1-P( )=.
答案:
10.某公司招聘员工,指定三门考试课程,有两种考试方案:
方案一:考三门课程至少有两门及格为考试通过;
方案二:在三门课程中,随机选取两门,这两门都及格为考试通过.
假设某应聘者对三门指定课程考试及格的概率分别为0.5,0.6,0.9,且三门课程考试是否及格相互之间没有影响.
(1)求该应聘者用方案一通过的概率;
(2)求该应聘者用方案二通过的概率.
解:记“应聘者对三门考试及格的事件”分别为A,B,C.P(A)=0.5,P(B)=0.6,P(C)=0.9.
(1)该应聘者用方案一通过的概率是P1=P(AB)+P(BC)+P(AC)+P(ABC)
=0.5×0.6×0.1+0.5×0.6×0.9+0.5×0.4×0.9+0.5×0.6×0.9
=0.03+0.27+0.18+0.27=0.75.
(2)应聘者用方案二通过的概率
P2=P(AB)+P(BC)+P(AC)
=(0.5×0.6+0.6×0.9+0.5×0.9)=×1.29=0.43.
11.为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,;两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ,求ξ的分布列与数学期望E(ξ).
解:(1)若两人所付费用相同,则相同的费用可能为0元,40元,80元,
两人都付0元的概率为P1=×=,
两人都付40元的概率为P2=×=,
两人都付80元的概率为P3=×=×=,
则两人所付费用相同的概率为P=P1+P2+P3=++=.
(2)由题意得,ξ所有可能的取值为0,40,80,120,160.
P(ξ=0)=×=,
P(ξ=40)=×+×=,
P(ξ=80)=×+×+×=,
P(ξ=120)=×+×=,
P(ξ=160)=×=,
ξ的分布列为
ξ
0
40
80
120
160
P
E(ξ)=0×+40×+80×+120×+160×=80.
12.从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(187.8
附:≈12.2.
若Z~N(μ,σ2),则P(μ-σ
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(2)①由(1)知,Z~N(200,150),从而P(187.8