高中数学北师大版选修1-2教案:第一章统计案例(含解析)(4份)

文档属性

名称 高中数学北师大版选修1-2教案:第一章统计案例(含解析)(4份)
格式 zip
文件大小 1.3MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2019-06-23 17:29:39

文档简介

1回归分析
回归分析
1.线性回归方程
设样本点为(x1,y1),(x2,y2),…,(xn,yn),线性回归方程为y=a+bx.
则lxx=(xi-)2=-n2,
lxy=(xi-)(yi-)=iyi-n ,
lyy=(yi-)2=-n2,
b===,
a=-b.
2.相关系数
计算
  r==
=


范围
r∈[-1,1]
线性
相关
程度
(1)|r|越大,线性相关程度越高;
(2)|r|越接近于0,线性相关程度越低;
(3)当r>0时,两个变量正相关;
(4)当r<0时,两个变量负相关;
(5)当r=0时,两个变量线性不相关
1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
2.回归直线y=a+bx过点(,),其中=i,=i.
3.相关系数的绝对值越接近于1,相关性越强;相关系数越接近于0,相关性越弱.
线性回归方程
[例1] 假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
使用年限x/年
2
3
4
5
6
维修费用y/万元
2.2
3.8
5.5
6.5
7.0
若y对x呈线性相关关系.
(1)请画出上表数据的散点图;
(2)请根据最小二乘法求出线性回归方程;
(3)预测使用年限为10年时,维修费用是多少.
[思路点拨] 先利用散点图分析设备使用年限与所支出的维修费用是否线性相关,若相关再利用线性回归模型求解.
[精解详析] (1)作出散点图如图所示.
(2)由表知,==4,
==5,
iyi=2×2.2+3×3.8+4×5.5+5×6.5+6×7=112.3,
=22+32+42+52+62=90,
所以b===1.23,
a=-b=5-1.23×4=0.08.
所以线性回归方程为y=1.23x+0.08.
(3)根据(2)中的线性回归方程,可预测使用年限为10年时,维修费用约为y=1.23×10+0.08=12.38万元.
[一点通] 求回归直线方程的基本步骤:
1.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为(  )
A.y=0.4x+2.3     B.y=2x-2.4
C.y=-2x+9.5 D.y=-0.3x+4.4
解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.
2.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y=0.254x+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.
答案:0.254
3.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据
x
6
8
10
12
y
2
3
5
6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
解:(1)散点图如图:
(2)iyi=6×2+8×3+10×5+12×6=158,
==9,==4,
=62+82+102+122=344.
b===0.7,a=-=4-0.7×9=-2.3,
故线性回归方程为y=0.7x-2.3.
(3)由(2)中线性回归方程知,当x=9时,y=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.
相关系数
[例2] 关于两个变量x和y的7组数据如下表所示:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
试判断x与y之间是否有线性相关关系.
[思路点拨] 首先求出r的值,再判断相关关系.
[精解详析] =×(21+23+25+27+29+32+35)≈27.4,
=×(7+11+21+24+66+115+325)≈81.3,
=212+232+252+272+292+322+352=5 414,
iyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,
=72+112+212+242+662+1152+3252=124 393,
∴r=
=
≈0.837 5.
由于r≈0.837 5与1比较接近,
∴x与y具有线性相关关系.
[一点通] 回归分析是定义在具有相关关系的两个变量的基础上的,对于相关关系不明确的两个变量,可先作散点图,由图粗略地分析它们是否具有相关关系,在此基础上,求其回归方程,并作回归分析.
4.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:
①n=7,r=0.953 3;②n=15,r=0.301 2;
③n=17,r=0.499 1;④n=3,r=0.995 0.
则变量y和x线性相关程度最高的两组是(  )
A.①和② B.①和④
C.②和④ D.③和④
解析:选B 相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B.
5.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是(  )
A.r2C.r4解析:选A 观察散点图可知r1>0,r3>0,r2<0,r4<0,根据散点的分散程度反映出的相关性的强弱,可知r26.在研究硝酸钠的可溶性程度时,在不同的温度(单位:℃)下观测它在水中的溶解度,得观测结果如下:
温度x
0
10
20
50
70
溶解度y
66.7
76.0
85.0
112.3
128.0
求两变量间的线性相关系数.
解:xi=150,yi=468,x=7 900,y=46 445.18,
=30,=93.6,xiyi=17 035,
r=
=≈0.999 6.
可线性化的回归分析问题
[例3] 为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:
时间x/天
1
2
3
4
5
6
繁殖个数y
6
12
25
49
95
190
(1)作出这些数据的散点图;
(2)求y与x之间的回归方程.
[思路点拨] 作出数据的散点图,选择合适的函数模型转化为线性模型.
[精解详析] (1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数函数y=c1e图像的周围,于是令z=ln y,则
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器算得z=0.69x+1.112,
则有y=e0.69x+1.112.
[一点通] 可线性化的回归方程的求解步骤:
7.下列数据x,y符合哪一种函数模型(  )
x
1
2
3
4
5
6
7
8
9
10
y
2
2.69
3
3.38
3.6
3.8
4
4.08
4.2
4.3
A.y=2+x      B.y=2ex
C.y=2e D.y=2+ln x
解析:选D 选项A中当x=8,9,10时,函数值与所给数值偏差较大,不合题意;选项B中当x=10时,y=2·e10,远远大于4.3,不合题意;选项C中的函数在(0,+∞)上为减函数,不合题意.故选D.
8.在一次抽样调查中测得5个样本点,数值如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
解:作出变量y与x之间的散点图如图1所示.
由图可知变量y与x近似地呈反比例函数关系,
设y=,令t=,则y=kt.
由y与x的数据表可得y与t的数据表如下:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
作出y与t的散点图如图2所示.
由图可知y与t呈近似的线性相关关系.
又=1.55,=7.2,iyi=94.25,=21.312 5.
∴b==≈4.134 4.
a=-b ≈7.2-4.134 4×1.55≈0.791 7,
∴y=4.134 4t+0.791 7.
∴y与x的回归方程是y=+0.791 7.
1.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.
2.相关系数r可以定量地反映出变量间的相关程度,明确地给出有无必要建立两变量间的线性回归方程.
1.已知两个有线性相关关系的变量的相关系数为 r,则r取下列何值时,两个变量的线性相关关系最强(  )
A.-0.91       B.0.25
C.0.6 D.0.86
解析:选A 在四个r值中,|-0.91|最接近1,故此时,两个变量的线性相关关系最强.
2.根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为y=bx+a,则(  )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析:选B 由表中数据画出散点图,如图.
由散点图可知b<0,a>0,选B.
3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是(  )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:选D 由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项A中的结论正确;回归直线过样本点的中心,选项B中的结论正确;根据回归直线斜率的意义易知选项C中的结论正确;由于回归分析得出的是估计值,故选项D中的结论不正确.
4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程y=bx+a,其中b=0.76,a=-b.据此估计,该社区一户年收入为15万元家庭的年支出为(  )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:选B 由题意知,==10,==8,
∴a=8-0.76×10=0.4,
∴当x=15时,y=0.76×15+0.4=11.8(万元).
5.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1.
答案:1
6.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:
气温(℃)
18
13
10
-1
销售量(个)
24
34
38
64
由表中数据,得线性回归方程y=-2x+a.当气温为-4 ℃时,预测销售量约为________.
解析:∵=(18+13+10-1)=10,=(24+34+38+64)=40,∴40=-2×10+a,∴a=60,当x=-4时,y=-2×(-4)+60=68.
答案:68
7.某种产品的广告费用支出x与销售额y之间有如下的对应数据(单位:万元).
x(万元)
2
4
5
6
8
y(万元)
30
40
60
50
70
(1)画出散点图;
(2)求回归方程;
(3)据此估计广告费用支出为10万元时,销售额y的值.
解:(1)作出散点图如下图.
(2)由散点图可知,样本点近似地分布在一条直线附近,因此,x,y之间具有线性相关关系.
由表中的数据可知,
=×(2+4+5+6+8)=5,
=×(30+40+60+50+70)=50.
所以b==6.5,
a=-b=50-6.5×5=17.5,
因此线性回归方程为y=17.5+6.5x.
(3)x=10时,y=17.5+10×6.5=82.5(万元).
即当支出广告费用10万元时,销售额为82.5万元.
8.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程y=bx+a,其中b=-20,a=-b;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)=(8+8.2+8.4+8.6+8.8+9)=8.5,=(90+84+83+80+75+68)=80,
从而a=+20=80+20×8.5=250,
故y=-20x+250.
(2)由题意知, 工厂获得利润
z=(x-4)y=-20x2+330x-1 000=-202+361.25,所以当x==8.25时,zmax=361.25(元).
即当该产品的单价定为8.25元时,工厂获得最大利润.
9.在钢铁碳含量对于电阻的效应研究中,得到如下数据表:
碳含量x(%)
0.10
0.30
0.40
0.55
0.70
0.80
0.95
20 ℃时电阻(Ω)
15
18
19
21
22.6
23.6
26
求y与x的线性回归方程,并检验回归方程中的显著性.
解:由已知数据得=×i≈0.543,
=×145.2≈20.74,
=2.595,=3 094.72,iyi=85.45.
∴b≈≈12.46,
a=20.74-12.46×0.543≈13.97.
线性回归方程为y=13.97+12.46x.
下面利用相关系数检验是否显著.
iyi-7 =85.45-7×0.543×20.74≈6.62,
-72=2.595-7×(0.543)2≈0.531,
-72=3 094.72-7×(20.74)2=83.687.
∴r=≈0.993.
由于r接近于1,故钢铁碳含量对电阻的效应线性相关关系显著.
2.1 条件概率与独立事件
条件概率
100件产品中有93件产品的长度合格,90件产品的质量合格,85件产品的长度、质量都合格.
令A={产品的长度合格},B={产品的质量合格},A∩B={产品的长度、质量都合格}.
问题1:试求P(A),P(B),P(A∩B).
提示:P(A)=,P(B)=,P(A∩B)=.
问题2:任取一件产品,已知其质量合格(即B发生),求它的长度(即A发生)也合格的概率.
提示:若用A|B表示上述事件,则A|B发生相当于从90件产品中任取1件长度合格,其概率为
P(A|B)=.
问题3:如何理解问题2?
提示:在质量合格的情况下,长度又合格,即事件B发生的条件下事件A发生.
问题4:试探求P(B),P(A∩B),P(A|B)间的关系.
提示:P(A|B)=.
条件概率
(1)概念
事件B发生的条件下,A发生的概率,称为B发生时A发生的条件概率,记为P(A|B).
(2)公式
P(A|B)=(其中,A∩B也可记成AB).
(3)当P(A)>0时,A发生时B发生的条件概率为P(B|A)=.
独立事件
有这样一项活动:甲箱里装有3个白球、2个黑球,乙箱里装有2个白球、2个黑球,从这两个箱子里分别摸出1个球,记事件A={从甲箱里摸出白球},B={从乙箱里摸出白球}.
问题1:事件A发生会影响事件B发生的概率吗?
提示:不影响.
问题2:试求P(A),P(B),P(AB).
提示:P(A)=,P(B)=,P(AB)==.
问题3:P(AB)与P(A),P(B)有什么关系?
提示:P(AB)=P(A)P(B)=×=.
问题4:P(B|A)与P(B)相等吗?
提示:相等,由P(B|A)==,
可得P(B|A)=P(B).
独立事件
(1)概念:对两个事件A,B,如果P(AB)=P(A)P(B),则称A,B相互独立.
(2)推广:若A与B相互独立,则A与,与B,与也相互独立.
(3)拓展:若A1,A2,…,An相互独立,则有
P(A1A2…An)=P(A1)P(A2)…P(An).
1.由条件概率的定义知,P(B|A)与P(A|B)是不同的;另外,在事件A发生的前提下,事件B发生的概率为P(B|A),其值不一定等于P(B).
2.事件A与B相互独立就是事件A的发生不影响事件B发生的概率,事件B的发生不影响事件A发生的概率.
条件概率
[例1] 一只口袋内装有2个白球和2个黑球,那么:
(1)先摸出1个白球不放回,再摸出1个白球的概率是多少?
(2)先摸出1个白球后放回,再摸出1个白球的概率是多少?
[思路点拨] 先摸出1个白球后放回或不放回,影响到后面取到白球的概率,应注意两个事件同时发生的概率的不同.
[精解详析] (1)设“先摸出1个白球不放回”为事件A,“再摸出1个白球”为事件B,则“先后两次摸到白球”为AB,先摸1球不放回,再摸1球共有4×3种结果.
∴P(A)==,P(AB)==.
∴P(B|A)==.
(2)设“先摸出1个白球放回”为事件A1,“再摸出1个白球”为事件B1,两次都摸到白球为事件A1B1.
∴P(A1)==,P(A1B1)==.
∴P(B1|A1)===.
故先摸1个白球不放回,再摸出1个白球的概率为;先摸1个白球后放回,再摸出1个白球的概率为.
[一点通] 求条件概率一般有两种方法:
一是对于古典概型类题目,可采用缩减基本事件总数的办法来计算,P(B|A)=,其中n(AB)表示事件AB包含的基本事件个数,n(A)表示事件A包含的基本事件个数.
二是直接根据定义计算,P(B|A)=,特别要注意P(AB)的求法.
1.袋中装有标号为1,2,3的三个小球,从中任取一个,记下它的号码,放回袋中,这样连续做三次.若抽到各球的机会均等,事件A为“三次抽到的号码之和为6”,事件B为“三次抽到的号码都是2”,则P(B|A)=(  )
A.          B.
C. D.
解析:选A 用列举法将所有情况全部列出(略),可知共有27种情况,其中事件A有(1,2,3),(1,3,2),(2,1,3),(2,2,2),(2,3,1),(3,1,2),(3,2,1),共7种情况,事件B有(2,2,2),共1种情况,所以P(A)=,P(AB)=P(B)=,根据条件概率公式P(B|A)===.
2.甲、乙二人参加一项测试,已知甲通过该项测试的概率为,他们同时通过该项测试的概率为.若甲先参加并顺利通过测试,则乙也通过测试的概率是________.
解析:设“甲通过测试”为事件A,“乙通过测试”为事件B.则所求概率为P(B|A)===.
答案:
3.甲、乙两地都位于长江下游,根据一百多年的气象记录,知道甲、乙两地一年中雨天所占的比例分别为20%和18%,两地同时下雨的比例为12%,问:
(1)乙地为雨天时甲地也为雨天的概率是多少?
(2)甲地为雨天时乙地也为雨天的概率是多少?
解:设“甲地为雨天”为事件A,“乙地为雨天”为事件B,由题意,得P(A)=0.20,P(B)=0.18,P(AB)=0.12.
(1)乙地为雨天时甲地也为雨天的概率是
P(A|B)==≈0.67.
(2)甲地为雨天时乙地也为雨天的概率是
P(B|A)===0.60.
独立事件的判断
[例2] 分别掷甲、乙两枚均匀的硬币,令A={硬币甲出现正面},B={硬币乙出现正面},验证事件A,B是相互独立的.
[思路点拨] 判定两个复杂事件是否独立应借助定义判断,即判断P(AB)=P(A)P(B)是否成立,再作出结论.
[精解详析] 掷甲、乙两枚硬币的所有可能情形为
Ω={(正,正),(正,反),(反,正),(反,反)}.
事件A中含2个基本事件,事件B中含2个基本事件,事件AB中含1个基本事件.
∴P(A)==,P(B)==,
P(AB)=.∴P(AB)=P(A)P(B).
∴事件A,B是相互独立的.
[一点通] (1)利用相互独立事件的定义(即P(AB)=P(A)·P(B))可以准确地判定两个事件是否相互独立,这是用定量计算方法判断,因此我们必须熟练掌握.
(2)判别两个事件是否为相互独立事件也可以从定性的角度进行分析,也就是看一个事件的发生对另一个事件的发生是否有影响.没有影响就是相互独立事件,有影响就不是相互独立事件.
4.甲、乙二人分别对一目标进行一次射击,记“甲击中目标为事件A,乙击中目标为事件B,则A与B,与B,A与,与”中,满足相互独立的有(  )
A.1对 B.2对
C.3对 D.4对
解析:选D 由于A与B是两个相互独立事件,所以根据相互独立事件的性质可知,A与,与B,与也是相互独立事件,故有4对相互独立事件.
5.从一副扑克牌(52张)中任抽一张,设A=“抽得老K”,B=“抽得红牌”,判断事件A与B是否相互独立.
解:抽到老K的概率为P(A)==,抽到红牌的概率P(B)==,故P(A)P(B)=×=,事件AB即为“既抽得老K又抽得红牌”,亦即“抽得红桃老K或方块老K”,故P(AB)==,从而有P(A)P(B)=P(AB),因此A与B互为独立事件.
独立事件的概率
[例3] 某田径队有三名短跑运动员,根据平时训练情况统计甲、乙、丙三人100 m跑(互不影响)的成绩在13 s内(称为合格)的概率分别为,,,若对这三名短跑运动员的100 m 跑的成绩进行一次检测,求:
(1)三人都合格的概率;
(2)三人都不合格的概率;
(3)出现几人合格的概率最大?
[思路点拨] 若用A,B,C表示甲、乙、丙三人100米跑的成绩合格,则事件A,B,C相互独立.
[精解详析] 记“甲、乙、丙三人100米跑成绩合格”分别为事件A,B,C,显然事件A,B,C相互独立,
则P(A)=,P(B)=,P(C)=.
设恰有k人合格的概率为Pk(k=0,1,2,3).
(1)三人都合格的概率:
P3=P(ABC)=P(A)P(B)P(C)
=××=.
(2)三人都不合格的概率:
P0=P()=P()P()P()
=××=.
(3)恰有两人合格的概率:
P2=P(AB)+P(AC)+P(BC)
=××+××+××
=.
恰有一人合格的概率:
P1=1-P0-P2-P3
=1---==.
结合(1)(2)可知P1最大.
所以出现恰有1人合格的概率最大.
[一点通] (1)公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,An相互独立,那么这n 个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2…An)=P(A1)P(A2)…P(An).
(2)求相互独立事件同时发生的概率的程序:①首先确定各事件之间是相互独立的;②确定这些事件可以同时发生;③求出每个事件发生的概率,再求其积.
6.甲、乙两个篮球运动员互不影响地在同一位置投球,命中率分别为和P,且乙投球2次均未命中的概率为.求:
(1)乙投球的命中率P;
(2)甲投球2次,至少命中1次的概率.
解:设“甲投球一次命中”为事件A,“乙投球一次命中”为事件B,则A,B相互独立.
(1)法一:由题意,得(1-P(B))2=(1-P)2=.
解得P=或P=(舍去).
∴乙投球的命中率为.
法二:由题意,得P()·P()=.
∴P()=或P()=-(舍去),
∴P(B)=1-P()=1-=.
即乙投球的命中率为.
(2)由题意知,P(A)=,P()=.
法一:甲投球两次,至少命中一次的概率为
1-P(·)=1-P()P()=1-×=.
法二:甲投球两次,至少命中一次的概率为
P(A+A+AA)=P(A)+P(A)+P(AA)
=×+×+×=.
7.某选修课的考试按A级、B级依次进行,只有当A级成绩合格时,才可继续参加B级的考试.已知每级考试允许有一次补考机会,两个级别的成绩均合格方可获得该选修课的合格证书.现某人参加这个选修课的考试,他A级考试成绩合格的概率为,B级考试合格的概率为.假设各级考试成绩合格与否均互不影响.
(1)求他不需要补考就可获得该选修课的合格证书的概率;
(2)在这个考试过程中,假设他不放弃所有的考试机会,求他一共参加3次考试的概率.
解:设“A级第一次考试合格”为事件A1,“A级补考合格”为事件A2;“B级第一次考试合格”为事件B1,“B级补考合格”为事件B2.
(1)不需要补考就获得合格证书的事件为A1B1,注意到A1与B1相互独立,
则P(A1B1)=P(A1)×P(B1)=×=.
即该考生不需要补考就获得合格证书的概率为.
(2)设“该考生一共参加3次考试”为事件C,则C=A1B2+A1 +A2B2,
注意到各事件之间的独立性与互斥性,可得
P(C)=P(A1B2+A1+A2B2)
=P(A1B2)+P(A1 )+P(A2B2)
=××+××+××
=++=.
即该考生一共参加3次考试的概率为.
1.计算条件概率要明确:
(1)准确理解条件概率的概念,条件概率中的两个事件是互相影响的,其结果受两个条件的概率的制约;
(2)要正确求出条件概率,必须首先弄清楚“事件A发生”“事件A发生并且事件B也发生”“事件B在事件A发生的条件下发生”的概率之间的关系.
2.互斥事件、对立事件、相互独立事件的区别与联系:
名称
区别
联系
定义
事件个数
互斥
事件
在一次试验中不能同时发生的事件
两个或两个以上
①两事件互斥,但不一定对立;反之一定成立;
②两事件独立,则不一定互斥(或对立);
③两事件互斥(或对立),则不相互独立
对立事件
在一次试验中不能同时发生但必有一个发生的事件
两个
独立事件
一个事件的发生与否对另一个事件发生的概率没有影响
两个或两个以上
1.抛掷一颗骰子一次,A表示事件:“出现偶数点”,B表示事件:“出现3点或6点”,则事件A与B的关系是(  )
A.相互互斥事件
B.相互独立事件
C.既相互互斥又相互独立事件
D.既不互斥又不独立事件
解析:选B A={2,4,6},B={3,6},A∩B={6},所以P(A)=,P(B)=,P(AB)==×,所以A与B是相互独立事件.
2.把一枚硬币抛掷两次,事件A=“第一次出现正面”,事件B=“第二次出现反面”,则P(B|A)的值为(  )
A.         B.
C. D.1
解析:选A P(B)=P(A)=,P(AB)=,P(B|A)===.
3.某农业科技站对一批新水稻种子进行试验,已知这批水稻种子的发芽率为0.8,出芽后的幼苗成活率为0.9,在这批水稻种子中,随机地取出一粒,则这粒水稻种子发芽能成长为幼苗的概率为(  )
A.0.02         B.0.08
C.0.18 D.0.72
解析:选D 设“这粒水稻种子发芽”为事件A,“这粒水稻种子发芽又成长为幼苗”为事件AB,“这粒种子能成长为幼苗”为事件B|A,则P(A)=0.8,P(B|A)=0.9,由条件概率公式,得
P(AB)=P(B|A)·P(A)=0.9×0.8=0.72.
4.甲射手击中靶心的概率为,乙射手击中靶心的概率为,甲、乙两人各射击一次,那么等于(  )
A.甲、乙都击中靶心的概率
B.甲、乙恰好有一人击中靶心的概率
C.甲、乙至少有一人击中靶心的概率
D.甲、乙不全击中靶心的概率
解析:选D 设“甲、乙都击中靶心”为事件A,则P(A)=×=,甲、乙不全击中靶心的概率为P()=1-P(A)=1-=.
5.有一个数学难题,在半小时内,甲能解决的概率是,乙能解决的概率是,两人试图独立地在半小时内解决它,则两人都未解决的概率为________,问题得到解决的概率为________.
解析:甲、乙两人都未能解决为
=×=,
问题得到解决就是至少有1 人能解决问题.
∴P=1-=.
答案: 
6.盒中装有10只乒乓球,其中6只新球,4只旧球,不放回地依次取出2个球使用,在第一次摸出新球的条件下,第二次也取到新球的概率为________.
解析:法一:设A={第一次取到新球},B={第二次取到新球},则n(A)=6×9=54,n(AB)=6×5=30,
∴P(B|A)===.
法二:在第一次取到新球的条件下,盒中装有9只乒乓球,其中5只新球,则第二次也取到新球的概率为P=.
答案:
7.红队队员甲、乙、丙与蓝队队员A,B,C进行围棋比赛,甲对A、乙对B、丙对C各一盘.已知甲胜A、乙胜B、丙胜C的概率分别为0.6,0.5,0.5.假设各盘比赛结果相互独立.求红队至少两名队员获胜的概率.
解:设甲胜A的事件为D,乙胜B的事件为E,丙胜C的事件为F,则,,分别表示甲不胜A、乙不胜B、丙不胜C的事件.
因为P(D)=0.6,P(E)=0.5,P(F)=0.5,
由对立事件的概率公式知,
P()=0.4,P()=0.5,P()=0.5.
红队至少两人获胜的事件有DE,DF,EF,DEF.
由于以上四个事件两两互斥且各盘比赛的结果相互独立,因此红队至少两人获胜的概率为
P=P(DE)+P(DF)+P(EF)+P(DEF)=0.6×0.5×0.5+0.6×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=0.55.
8.设进入某商场的每一位顾客购买甲种商品的概率为0.5,购买乙种商品的概率为0.6,且购买甲种商品与购买乙种商品相互独立,各顾客之间购买商品也是相互独立的.
(1)求进入商场的1位顾客购买甲、乙两种商品中的一种的概率;
(2)求进入商场的1位顾客至少购买甲、乙两种商品中的一种的概率.
解:设“只购买甲种商品”为事件A,“只购买乙种商品”为事件B,“购买甲、乙两种商品中的一种”为事件C,“至少购买甲、乙两种商品中的一种”为事件D.
(1)因为C=(A)+(B),所以P(C)=P(A)+P(B)=P(A)P()+P()P(B)
=0.5×(1-0.6)+(1-0.5)×0.6=0.5.
(2)因为= ,
所以P()=P( )=P()P()=0.5×0.4=0.2.
所以P(D)=1-P()=1-0.2=0.8.
9.2018年某中学对参加“社会实践活动”的全体志愿者进行学分考核,因该批志愿者表现良好,学校决定考核只有合格和优秀两个等次.若某志愿者考核为合格,授予1个学分;考核为优秀,授予2个学分,假设该校志愿者甲、乙、丙考核为优秀的概率分别为,,,他们考核所得的等次相互独立.
(1)求在这次考核中,志愿者甲、乙、丙三人中至少有一名考核为优秀的概率;
(2)求在这次考核中甲、乙、丙三名志愿者所得学分之和至多为4分的概率.
解:(1)记“甲考核为优秀”为事件A,“乙考核为优秀”为事件B,“丙考核为优秀”为事件C,“甲、乙、丙至少有一名考核为优秀”为事件D.
则P(D)=1-P(  )=1-P()P()P()
=1-××=.
(2)由题意,得在这次考核中甲、乙、丙三名志愿者所得学分之和为3分的概率为P()=P()P()P()=××=,
在这次考核中甲、乙、丙三名志愿者所得学分之和为4分的概率为P(A )+P(B)+P(C)=××+××+××=.
所以在这次考核中甲、乙、丙三名志愿者所得学分之和至多为4分的概率为+=.
2.2~2.4 独立性检验 独立性检验的基本思想及应用
独立性检验
1.2×2列联表
设A,B为两个变量,每个变量都可以取两个值,变量A:A1,A2=1;变量B:B1,B2=1,用下表表示抽样数据.
B
A  
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
n=a+b+c+d
并将此表称为2×2列联表.
2.χ2的计算公式
χ2=.
3.独立性判断的方法
(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;
(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;
(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;
(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.
(1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断.
(2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性.
2×2列联表
[例1] 在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.
[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后算出相应的数据,列表即可.
[精解详析] 根据题目所给的数据作出如下的列联表:
色盲
性别   
患色盲
不患色盲
总计

38
442
480

6
514
520
总计
44
956
1 000
[一点通] 分清类别是作列联表的关键步骤,对所给数据要明确属于哪一类.
1.下面是一个2×2列联表,则表中a,b处的值分别为(  )
y
x  
y1
y2
总计
x1
a
21
53
x2
8
25
33
总计
b
46
A.32,40      B.42,50
C.74,82 D.64,72
解析:选A a=53-21=32,b=a+8=40.
2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表.
解:列联表如下:
性格情况
考前心情
是否紧张      
性格内向
性格外向
总计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
总计
426
594
1 020
独立性检验的应用
[例2] 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者     


需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
[思路点拨] 解答本题先分析列联表,后计算χ2,再与临界值比较,判断两个变量是否相互独立.
[精解详析] (1)调查的500位老年人中有70位需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例的估计值为×100%=14%.
(2)χ2=≈9.967.
因为9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.
[一点通] 这类问题的解决方法为先确定a,b,c,d,n的值并求出χ2的值,再与临界值相比较,作出判断,解题时注意正确运用公式,代入数据准确计算.
3.统计推断,当________时,有95%的把握认为事件A与B有关;当________时,认为没有充分的证据显示事件A与B是有关的.
解析:当χ2>3.841时,就有95%的把握认为事件A与B有关,当χ2≤2.706时认为没有充分的证据显示事件A与B是有关的.
答案:χ2>3.841 χ2≤2.706
4.某高校《统计初步》课程的教师随机调查了选该课的学生的一些情况,具体数据如下表:
是否统计专业
性别    
非统计专业
统计专业

13
10

7
20
则χ2≈________,有________的把握判定主修统计专业与性别有关.
解析:χ2=≈4.844>3.841,故有95%的把握认为主修统计专业与性别有关.
答案:4.844 95%
5.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:
喜爱打篮球
不喜爱打篮球
总计
男生
5
女生
10
总计
50
已知在全班50人中随机抽取1人抽到喜爱打篮球的学生的概率为.
(1)请将上面的列联表补充完整;
(2)试问:喜爱打篮球是否与性别有关?说明你的理由.
解:设“喜爱打篮球”为事件A,由P(A)=,得喜爱打篮球的人数为50×=30.所以喜爱打篮球的男生有20人,据此可求得不喜爱打篮球的女生有15人.
(1)列联表补充如下:
喜爱打篮球
不喜爱打篮球
总计
男生
20
5
25
女生
10
15
25
总计
30
20
50
(2)∵χ2=≈8.333>6.635,
∴有99%的把握认为喜爱打篮球与性别有关.
独立性检验的基本步骤:
1.列出2×2列联表.
2.求出χ2=.
3.判断是否有关联,得出事件有关的可能性大小.
1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到下表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由χ2=算得,
χ2=≈7.8.
附表:
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是(  )
A.有99.9%以上的把握认为“爱好该项运动与性别有关”
B.有99.9%以上的把握认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动和性别有关”
D.有99%以上的把握认为“爱好该项运动和性别无关”
解析:选C 因为χ2≈7.8>6.635,所以有99%以上的把握认为有关.
2.两个分类变量X和Y, 值域分别为{x1,x2}和{y1,y2}, 其样本频数分别是a=10, b=21, c+d=35. 若X与Y有关系的可信程度不小于95%, 则c等于(  )
A.3          B.7
C.5 D.6
解析:选A 列表如下:
x1
x2
总计
y1
10
21
31
y2
c
d
35
总计
10+c
21+d
66
故χ2=≥3.841. 把选项A、B、C、D代入验证可知选A.
3.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(  )
表1        
成绩
性别
不及格
及格
总计

6
14
20

10
22
32
总计
16
36
52
表2
视力
性别


总计

4
16
20

12
20
32
总计
16
36
52
表3    
智商
性别
偏高
正常
总计

8
12
20

8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计

14
6
20

2
30
32
总计
16
36
52
A.成绩 B.视力
C.智商 D.阅读量
解析:选D 因为χ==,
χ==,
χ==,
χ==,
则有χ>χ>χ>χ,所以阅读量与性别关联的可能性最大.
4.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的序号是________.
①若χ2>6.635,则我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知,在有99%的把握认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知,在有99%的把握认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
解析:χ2是指确定有多大的把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知,当有99%的把握认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.
答案:③
5.下列是关于出生男婴与女婴调查的列联表:
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
那么A=________,B=________,C=________,
D=________,E=________.
解析:由45+E=98得E=53,
由98+D=180可知D=82.
由A+35=D知A=47.
所以B=45+47=92.
C=E+35=88.
答案:47 92 88 82 53
6.为探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示.
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
在研究小白鼠的死亡与剂量是否有关时,根据以上数据求得χ2≈________.
解析:χ2=≈5.333.
答案:5.333
7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外的27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外的33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)能否有95%的把握认为性别与休闲方式有关系.
解:(1)2×2列联表为:
   休闲方式
性别
看电视
运动
总计

43
27
70

21
33
54
总计
64
60
124
(2)由列联表中的数据,
计算χ2=≈6.201.
因为6.201>3.841,所以有95%的把握认为“性别与休闲方式有关”.
8.某地区甲校高二年级有1 100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如表.(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
10
25
35
30
x
乙校高二年级数学成绩:
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
15
30
25
y
5
(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分);
(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面2×2列联表,并回答能否有95%的把握认为“两个学校的数学成绩有差异”?
分类
甲校
乙校
总计
优秀
非优秀
总计
解:(1)依题意,知甲校应抽取110人,乙应抽取90人,
所以x=10,y=15.
甲校的平均分为×(55×10+65×25+75×35+85×30+95×10)≈75.
乙校的平均分为×(55×15+65×30+75×25+85×15+95×5)≈71.
(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到列联表如下:
分类
甲校
乙校
总计
优秀
40
20
60
非优秀
70
70
140
总计
110
90
200
所以χ2=≈4.714,
又因为4.714>3.841,
故有95%的把握认为“两个学校的数学成绩有差异”.
9.某学生对其30位亲属的饮食习惯进行了一次调查,并用如图所示的茎叶图表示他们的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).
(1)根据茎叶图,帮助这位同学说明其30位亲属的饮食习惯;
(2)根据以上数据完成如下2×2列联表;
主食蔬菜
主食肉类
总计
50岁以下
50岁以上
总计
(3)试问:其亲属的饮食与年龄有关吗?
解:(1)由茎叶图,可知30位亲属中50岁以上的人饮食多以蔬菜为主,50岁以下的人饮食多以肉类为主.
(2)2×2列联表如下所示:
主食蔬菜
主食肉类
总计
50岁以下
4
8
12
50岁以上
16
2
18
总计
20
10
30
(3)由题意,知χ2==10>6.635,故有99%以上的把握认为其亲属的饮食习惯与年龄有关系.
 第一章 统计案例
章末小结  
一、回归分析
1.线性回归分析
设样本点(x1,y1),(x2,y2),…,(xn,yn),其线性回归直线方程为
y=a+bx,
其中b===,
a=-b.
2.相关系数
r==
=.
|r|值越大,变量之间的线性相关程度越高;|r|值越接近0,变量之间的线性相关程度越低.
二、条件概率
1.条件概率的计算公式
P(B|A)==.
2.计算条件概率时,必须搞清楚欲求的条件概率是在哪一个事件发生的条件下的概率,从而选择合适的条件概率公式.
三、独立事件
1.独立事件的判断方法
(1)定义法:对两个事件A,B,如果P(AB)=P(A)P(B),则称A,B相互独立.若A,B相互独立,则A与,与B,与也相互独立.
(2)事件A是否发生对事件B发生的概率无影响.
2.相互独立事件同时发生的概率的求法
P(AB)=P(A)P(B).
3.相互独立事件往往与互斥事件、对立事件在题目中综合考查,要注意正确运用公式.
四、独立性检验
独立性检验的一般步骤
(1)列出2×2列联表;
(2)代入公式计算χ2=;
(3)根据χ2的值的大小作出判断.
同课章节目录