2019年高一高二数学同步学案人教A版选修2-3 第三章 章末小结与测评(课件+讲义)

文档属性

名称 2019年高一高二数学同步学案人教A版选修2-3 第三章 章末小结与测评(课件+讲义)
格式 zip
文件大小 1.2MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-05-06 08:17:42

文档简介



考点一
线性回归方程
在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研究,可近似地利用回归直线方程=x+来预报,利用公式求出回归系数,,即可写出回归直线方程,并用回归直线方程进行预测说明.
[典例1] 以下是某地收集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积x/m2
115
110
80
135
105
销售价格y/万元
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)若线性相关,求线性回归方程;
(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.
解:(1)数据对应的散点图如图所示.
(2)由散点图知y与x具有线性相关关系.由表中数据知=i=109,=i=23.2,=60 975,iyi=12 952.设所求回归直线方程为=x+,则=≈0.196 2,=-≈1.814 2,
故所求回归直线方程为=0.196 2x+1.814 2.
(3)根据(2),当x=150时,销售价格的估计值为=0.1962×150+1.814 2=31.244 2(万元).
[对点训练]
1.连锁经营公司所属5个零售店某月的销售额利润资料如表:
商品名称
A
B
C
D
E
销售额x/千万元
3
5
6
7
9
利润额y/百万元
2
3
3
4
5
(1)画出销售额和利润额的散点图;
(2)若销售额和利润额具有相关关系,试计算利润额y对销售额x的回归直线方程;
(3)估计要达到1 000万元的利润额,销售额约为多少万元.
解:(1)根据表中所给的5对数据,在平面直角坐标系中画出散点图,如图所示.
(2)∵==6,==,
∴n=5×6×=102,
iyi=3×2+5×3+6×3+7×4+9×5=112,
=32+52+62+72+92=200,
n2=5×62=180,
===0.5,
=-=-0.5×6==0.4,
∴利润额y对销售额x的回归直线方程是=0.5x+0.4.
(3)根据题意,令=0.5x+0.4=10,
解得x=19.2(千万元),
故销售额约为19.2千万元.
考点二
回归模型分析
对于建立的回归模型,我们必须对模型的拟合效果进行分析,也就是对利用回归模型解决实际问题的效果进行评价.一方面可以对比残差或残差平方和的大小,同时观察残差图,进行残差分析;另一方面也可以研究数据的R2(相关系数r).对模型拟合效果的分析能够帮助我们利用最优化的模型来解决实际问题.
[典例2] 在研究弹簧伸长长度y(cm)与拉力x(N)的关系时,对不同拉力的6根弹簧进行测量,测得如下表中的数据:
x/N
5
10
15
20
25
30
y/cm
7.25
8.12
8.95
9.90
10.9
11.8
若依据散点图及最小二乘法求出的回归直线方程为=0.18x+6.34,求R2,并结合残差说明拟合效果.
解:列表求值如下:
xi
5
10
15
20
25
30
yi
7.25
8.12
8.95
9.90
10.9
11.8
xiyi
36.25
81.2
134.25
198
272.5
354
x
25
100
225
400
625
900
yi-i
0.01
-0.02
-0.09
-0.04
0.06
0.06
yi-
-2.24
-1.37
-0.54
0.41
1.41
2.31
=17.5,≈9.49,iyi=1 076.2,=2 275,(yi-i)2=0.017 4,(yi-)2=14.678 4.
∴R2=1-≈0.998 81,回归模型拟合效果较好.由表中数据可以看出残差比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高.
[对点训练]
2.从某大学中随机选取5名女大学生,其身高和体重数据如下表所示:
编号
1
2
3
4
5
身高x/cm
165
165
157
170
175
体重y/kg
48
57
50
54
64
甲、乙两位同学在计算根据女大学生的身高预报体重的回归方程时,分别得到以下回归模型:甲:=0.75x-70;乙:=0.76x-71.试依据R2判定哪一个模型的拟合效果较好?
解:对甲模型,yi-i与yi-的值如下表:
yi-i
-5.75
3.25
2.25
-3.5
2.75
yi-
-6.6
2.4
-4.6
-0.6
9.4
所以(yi-i)2=(-5.75)2+3.252+2.252+(-3.5)2+2.752=68.5,
(yi-)2=(-6.6)2+2.42+(-4.6)2+(-0.6)2+9.42=159.2.
此时R2=1-≈0.57.
对乙模型,yi-i与yi-的值如下表:
yi-i
-6.4
2.6
1.68
-4.2
2
yi-
-6.6
2.4
-4.6
-0.6
9.4
所以(yi-i)2=(-6.4)2+2.62+1.682+(-4.2)2+22≈72.2,
(yi-)2=(-6.6)2+2.42+(-4.6)2+(-0.6)2+9.42=159.2.
此时R2=1-≈0.55.
因为0.57>0.55,所以甲模型的拟合效果较好.
考点三
独立性检验
独立性检验就是根据采集的样本数据,利用公式求出随机变量K2的观测值k,通过比较k与临界值k0的大小来确定两个分类变量是否有关系的方法.
[典例3] 户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:
喜欢户外运动
不喜欢户外运动
总计
男性5
女性
10
总计50
已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是.
(1)请将上面的列联表补充完整;
(2)求该公司男、女员工各多少人;
(3)在犯错误的概率不超过0.005的前提下能否认为喜欢户外运动与性别有关?并说明你的理由.
下面的临界值表仅供参考:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:K2=,其中n=a+b+c+d
解:(1)因为在全部50人中随机抽取1人抽到喜欢户外运动的员工的概率是,所以喜欢户外运动的男女员工共30人,其中男员工20人,列联表补充如下:
喜欢户外运动
不喜欢户外运动
总计
男性
20
5
25
女性
10
15
25
总计
30
20
50
(2)该公司男员工人数为25÷50×650=325(人),则女员工有325人.
(3)K2的观测值k=≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为喜欢户外运动与性别有关.
[对点训练]
3.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断在犯错误的概率不超过0.1的前提下能否认为“生产能手与工人所在的年龄组有关”.
解:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人).“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
生产能手
非生产能手
总计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
总计
30
70
100
所以由公式得K2的观测值
k==≈1.79,
因为1.79<2.706,
所以不能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”.
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.对于回归直线方程=x+,下列说法不正确的是(  )
A.直线必经过点(,)
B.x增加1个单位时,y平均增加个单位
C.样本数据中x=0时,可能有y=
D.样本数据中x=0时,一定有y=
解析:选D 回归直线方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.
2.根据如下样本数据:
x
3
4
5
6
7
8
y
4
2.5
-0.5
0.5
-2
-3
得到的回归直线方程为=x+,则(  )
                
A.>0,<0 B.>0,>0
C.<0,>0 D.<0,<0
解析:选A 根据题意,画出散点图.根据散点图,知两个变量为负相关,且回归直线与y轴的交点在y轴正半轴,所以>0,<0.
3.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则(  )
A.两个分类变量关系较弱
B.两个分类变量无关系
C.两个分类变量关系较强
D.无法判断
解析:选C 从条形图中可以看出,在x1中y1比重明显大于x2中y1的比重,所以两个分类变量的关系较强.
4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有(  )
A.b与r的符号相同
B.a与r的符号相同
C.b与r的符号相反
D.a与r的符号相反
解析:选A 因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.
5.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是(  )
x
4
5
6
7
8
9
10
y
14
18
19
20
23
25
28
A.线性函数模型 B.二次函数模型
C.指数函数模型 D.对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
6.某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:
x
16
17
18
19
y
50
44
41
31
由上表可得回归直线方程=x+中的=-6,据此模型预计零售价定为15元时,每天的销售量为(  )
A.48个 B.56个
C.60个 D.65个
解析:选B 由题意知=17.5,=41.5,代入回归直线方程得=146.5,所以回归直线方程为=-6x+146.5,当x=15时,=146.5-15×6=56.5,故选B.
7.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
做不到“光盘”
能做到“光盘”
总计

45
10
55

30
15
45
总计
75
25
100
附:
P(K2≥k0)
0.10
0.05
0.025
k0
2.706
3.841
5.024
参照附表,得到的正确结论是(  )
A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
解析:选C 由公式可计算K2的观测值
k=≈3.03>2.706,
所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.
8.根据下面的2×2列联表得到如下4个判断:
①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.
嗜酒
不嗜酒
总计
患肝病
700
60
760
未患肝病
200
32
232
总计
900
92
992
其中正确判断的个数为(  )
A.0 B.1
C.2 D.3
解析:选C 由2×2列联表中数据可求得K2的观测值k=≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”,即至少有99%的把握认为“患肝病与嗜酒有关”.因此②③正确,故选C.
9.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是(  )
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
解析:选B 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
10.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)的统计调查,已知y与x之间具有线性相关关系,且回归方程为=0.66x+1.562.若某城市的居民人均消费水平为7.675千元,试估计该城市的人均消费额占人均工资收入的百分比约为(  )
A.83% B.72%
C.67% D.66%
解析:选A 将=7.675代入回归方程,可计算得x≈9.26,所以该城市的人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.
11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是(  )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关
解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.
12.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于(  )
A.3 B.4 C.5 D.6
解析:选A 列2×2列联表如下:
x1
x2
总计
y1
10
21
31
y2
c
d
35
总计
10+c
21+d
66
故K2的观测值k=≥5.024.
把选项A,B,C,D代入验证可知选A.
二、填空题(本大题共4个小题,每小题5分,共20分,把答案填在题中横线上)
13.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
8
25
33
总计
b
46
则表中b-a=________.
解析:b-a=8.
答案:8
14.已知样本容量为11,计算得i=510,i=214,回归方程为=0.3x+,则≈________,≈________.(精确到0.01)
解析:由题意得=i=≈46.36,=i=,因为=0.3+,所以=0.3×+,可得≈5.55.
答案:46.36 5.55
15.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分的含量x之间的关系,现取8对观测值,计算得i=52,i=228,=478,iyi=1 849,则y对x的回归直线方程是______________.(精确到0.01)
解析:由回归系数的计算公式,得b=≈2.62,=-b=11.47,故所求的回归直线方程为=2.62x+11.47.
答案:=2.62x+11.47
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
读书
健身
总计

24
31
55

8
26
34
总计
32
57
89
在犯错误的概率不超过________的前提下性别与休闲方式有关系.
解析:由列联表中的数据,得K2的观测值为
k=≈3.689>2.706,
因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.
答案:0.10
三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明证明过程或演算步骤)
17.(本小题满分10分)x与y有如下五组数据,
x
1
2
3
5
10
y
10
5
4
2
2
试分析x与y之间是否具有线性相关关系.若有,求出回归直线方程;若没有,说明理由.
解:作出散点图,如图所示:
由散点图可以看出,x与y不具有线性相关关系.
18.(本小题满分12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:
y1
y2
x1
a
20-a
x2
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?
解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k≥2.706,而
k===.
由k≥2.706得a≥7.19或a≤2.04.
又a>5且15-a>5,a∈Z,解得a=8或9,
故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系.
19.(本小题满分12分)有甲、乙两个班进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下列联表:

优秀
非优秀
总计
甲班
10
乙班
30
合计
105
已知在全部105人中随机抽取1人为优秀的概率为.
(1)请完成上面的列联表;
(2)根据列联表的数据,能否在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”?
解:(1)列联表如下:
优秀
非优秀
总计
甲班
10
45
55
乙班
20
30
50
合计
30
75
105
(2)根据列联表中的数据,得到
K2=≈6.109>3.841,
因此能在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”.
20.(本小题满分12分)为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:
患心肺疾病
不患心肺疾病
总计
大于40岁
16
小于等于40岁
12
总计
40
已知在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为.
(1)请将2×2列联表补充完整;
(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议重症患者住院治疗,现从这16名患者中选出2人,记需住院治疗的人数为ξ,求ξ的分布列和数学期望;
(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?
解:(1)将2×2列联表补充完整如下:
患心肺疾病
不患心肺疾病
总计
大于40岁
16
4
20
小于等于40岁
8
12
20
总计
24
16
40
(2)ξ的可能取值为0,1,2.
P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,
所以随机变量ξ的分布列为
ξ
0
1
2
P



故ξ的数学期望E(ξ)=0×+1×+2×=.
(3)K2==>6.635,
所以能在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关.
21.(本小题满分12分)PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如下表:
时间
周一
周二
周三
周四
周五
车流量x(万辆)
50
51
54
57
58
PM2.5的浓度y
(微克/立方米)
69
70
74
78
79
(1)请根据上表数据,在如图所示的平面直角坐标系中画出散点图;
(2)根据上表数据,用最小二乘法求出y关于x的回归直线方程=x+;
(3)若周六同一时间的车流量是25万辆,试根据(2)中求出的回归直线方程预测此时PM2.5的浓度为多少(保留整数).
解:(1)散点图如图.
(2)∵==54,
==74.
xi-)(yi-)=4×5+3×4+3×4+4×5=64,
xi-)2=(-4)2+(-3)2+32+42=50,
∴===1.28,
=-=74-1.28×54=4.88,
故y关于x的回归直线方程为=1.28x+4.88.
(3)当x=25时,y=1.28×25+4.88=36.88≈37,
所以可以预测此时PM2.5的浓度约为37微克/立方米.
22.(本小题满分12分)在一段时间内,某种商品价格x(万元)和需求量y(t)之间的一组数据如下表:
价格x
1.4
1.6
1.8
2
2.2
需求量
12
10
7
5
3
(1)画出散点图;
(2)求出y对x的线性回归方程,并在(1)的图形上画出它的图象;
(3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t).
解:(1)散点图如图所示.
(2)=1.8,=7.4,iyi=62,=16.6,
====-11.5,=-=7.4+11.5×1.8=28.1.
所以y对x的线性回归方程为=-11.5x+28.1.画出图象如图.
(3)当价格定为1.9万元,即x=1.9时,y=-11.5×1.9+28.1=6.25.所以商品价格定为1.9万元时,需求量大约是6.25 t.
模块综合检测
(时间:120分钟 满分:150分)
一、选择题(本大题共12个小题,每小题5分,共60分.在每小题给出的四个选项中,只有一个项是符合题目要求的)
1.设随机变量X的分布列为(  )
X
-1
0
1
P


p
则p等于(  )
                
A.0 B. C. D.不确定
解析:选B 根据所给的分布列,由离散型随机变量的性质得++p=1,解得p=,故选B.
2.在5的展开式中x的系数为(  )
A.5 B.10
C.20 D.40
解析:选B 因为Tr+1=C(x2)5-rr=Cx10-3r,所以x的系数为C=10,故选B.
3.已知离散型随机变量X等可能取值1,2,3,…,n,若P(1≤X≤3)=,则n的值为(  )
A.3 B.5
C.10 D.15
解析:选D 由已知X的分布列为P(X=k)=,k=1,2,3,…,n,所以P(1≤X≤3)=P(X=1)+P(X=2)+P(X=3)==,n=15.
4.抛掷一枚质地均匀的硬币两次,在第一次正面向上的条件下,第二次反面向上的概率为(  )
A. B.
C. D.
解析:选C 记事件A表示“第一次正面向上”,事件B表示“第二次反面向上”,则P(AB)=,P(A)=,
∴P(B|A)==.
5.设事件A在每次试验中发生的概率相同,且在三次独立重复试验中,若事件A至少发生一次的概率为,则事件A恰好发生一次的概率为(  )
A. B.
C. D.
解析:选C 假设事件A在每次试验中发生说明试验成功,设每次试验成功的概率为p,由题意得,事件A发生的次数X~B(3,p),则有1-(1-p)3=,得p=,则事件A恰好发生一次的概率为C××2=.故选C.
6.某班有的学生数学成绩优秀,如果从班中随机地找出5名学生,那么其中数学成绩优秀的学生数X~B,则E(-X)的值为(  )
A. B.-
C. D.-
解析:选D ∵E(X)=5×=,∴E(-X)=-E(X)=-,故选D.
7.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,统计数据如下表:




r
0.82
0.78
0.69
0.85
m
106
115
124
103
由数据可知能体现A,B两变量有更强的线性相关性的试验的操作者是(  )
A.甲 B.乙 C.丙 D.丁
解析:选D 丁同学所得相关系数0.85最大,残差平方和m最小,所以A,B两变量的线性相关性更强.故选D.
8.将2名教师,4名学生分成2个小组,分别安排到甲、乙两地参加社会实践活动,每个小组由1名教师和2名学生组成,不同的安排方案共有(  )
A.12种 B.10种
C.9种 D.8种
解析:选A 先安排1名教师和2名学生到甲地,再将剩下的1名教师和2名学生安排到乙地,共有CC=12种安排方案.
9.已知随机变量X服从正态分布N(μ,σ2),且P(μ-2σA.0.135 8 B.0.135 9
C.0.271 6 D.0.271 8
解析:选B 由题意知,P(510.若(1-5x)9=a0+a1x+a2x2+…+a9x9,那么|a0|+|a1|+|a2|+…+|a9|的值是(  )
A.1 B.49
C.59 D.69
解析:选D 由(1+5x)9与(1-5x)9展开式系数可知|a0|+|a1|+|a2|+…+|a9|=(1+5×1)9=69.故选D.
11.为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表如下所示:
优秀
非优秀
总计
A班
14
6
20
B班
7
13
20
总计
21
19
40
则下列说法正确的是(  )
A.有99%的把握认为环保知识测试成绩与专业有关
B.有99%的把握认为环保知识测试成绩与专业无关
C.有95%的把握认为环保知识测试成绩与专业有关
D.有95%的把握认为环保知识测试成绩与专业无关
解析:选C 由表中数据及公式得K2的观测值k=≈4.912 3,根据临界值表可知有95%的把握认为环保知识测试成绩与专业有关.
12.如图,三行三列的方阵中有9个数aij(i=1,2,3;j=1,2,3),从中任取三个数,则至少有两个数位于同行或同列的概率是(  )

A. B. C. D.
解析:选D “至少有两个数位于同行或同列”的对立事件为“三个数既不同行也不同列”,所以所求概率为P=1-=1-=1-=.
二、填空题(本大题共4个小题,每小题5分,共20分.把答案填在题中横线上)
13.设6的展开式中x3的系数为A,二项式系数为B,则等于________.
解析:Tk+1=Cx6-kk=C(-2)kx6-,令6-=3,即k=2,所以T3=C(-2)2x3=60x3,所以x3的系数为A=60,二项式系数为B=C=15,所以==4.
答案:4
14.已知随机变量X的分布列如下,若E(X)=3,则D(X)=________.
X
1
2
3
4
P
n
0.2
0.3
m
解析:根据题意,得
解得∴D(X)=(1-3)2×0.1+(2-3)2×0.2+(3-3)2×0.3+(4-3)2×0.4=1.
答案:1
15.某数学老师的身高为176 cm,他爷爷、父亲和儿子的身高分别为173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,所以该老师用线性回归分析的方法预测他孙子的身高为________cm.
解析:记从爷爷起向下各代依次为1,2,3,4,5用变量x表示,其中5代表孙子.各代人的身高为变量y,则有
x
1
2
3
4
y
173
170
176
182
计算知=2.5,=175.25.由回归系数公式得=3.3,
=-=175.25-3.3×2.5=167,∴线性回归方程为=3.3x+167,当x=5时,y=3.3×5+167=183.5,故预测其孙子的身高为183.5 cm.
答案:183.5
16.航空母舰“辽宁舰”将进行一次编队配置科学实验,若要求2艘攻击型核潜艇一前一后,2艘驱逐舰和2艘护卫舰分列左、右,同侧不能都是同种舰艇,则舰艇分配方案的方法数为________.
解析:先将2艘驱逐舰和2艘护卫舰平均分成两组,然后再排,有CCAA种方法,然后排2艘攻击型核潜艇,有A种方法,故舰艇分配方案的总方法数为CCAAA=32.
答案:32
三、解答题(本大题共6小题,共70分.解答应写出必要的文字说明或演算步骤)
17.(本小题满分10分)为了调查某生产线上质量监督员甲是否在现场对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,1 000件产品中合格品有990件,次品有10件,甲不在现场时,500件产品中有合格品490件,次品有10件.
(1)补充下面列联表,并初步判断甲在不在现场与产品质量是否有关:
合格品数/件
次品数/件
总数/件
甲在现场
990
甲不在现场
10
总数/件
(2)用独立性检验的方法判断能否在犯错误的概率不超过0.15的前提下认为“甲在不在现场与产品质量有关”?
解:(1)
合格品数/件
次品数/件
总数/件
甲在现场
990
10
1 000
甲不在现场
490
10
500
总数/件
1 480
20
1 500
由列联表可知|ad-bc|=|990×10-490×10|=5 000,相差较大,可在某种程度上认为“甲在不在现场与产品质量有关”.
(2)由(1)中2×2列联表中数据,得K2=≈2.53>2.072,
又P(k≥2.072)的临界值为0.15,
所以,能在犯错误的概率不超过0.15的前提下认为“甲在不在现场与产品质量有关”.
18.(本小题满分12分)某课外活动小组共13人,其中男生8人,女生5人,并且男、女生各指定一名队长,现从中选5人主持某种活动,则依下列条件各有多少种选法:
(1)只有一名女生;
(2)至少有一名队长当选;
(3)即要有队长,又要有女生当选.
解:(1)一名女生,四名男生,故选法共有C·C=350(种).
(2)至少有一名队长含有两类情况:只有一名队长和两名队长.故选法共有:C·C+C·C=825(种);
(3)分两类:第一类女队长当选:选法共有C(种);
第二类女队长不当选:选法共有C·C+C·C+C·C+C(种).故选法共有:C+C·C+C·C 27+C·C+C=790(种).
19.(本小题满分12分)为了解甲、乙两厂的产品质量,分别从两厂生产的产品中各随机抽取10件,测量产品中某种元素的含量(单位:毫克),其测量数据的茎叶图如图所示:
规定:当产品中此种元素的含量大于18毫克时,认定该产品为优等品.
(1)试比较甲、乙两厂生产的产品中该种元素含量的平均值的大小;
(2)从乙厂抽出的上述10件产品中随机抽取3件,求抽到的3件产品中优等品数X的分布列及数学期望.
解:(1)由题可知甲厂产品中该种元素含量的平均值为
(9+18+15+16+19+13+23+20+25+21)=17.9,
乙厂产品中该种元素含量的平均值为
(18+14+15+16+19+10+13+21+20+23)=16.9,
所以甲厂产品中该种元素含量的平均值大于乙厂的平均值.
(2)由题知从乙厂抽出的10件产品中有4件优等品.X的可能取值为0,1,2,3,对应的概率分别为
P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==.
所以X的分布列为
X
0
1
2
3
P




故X的数学期望
E(X)=0×+1×+2×+3×=1.2.
20.(本小题满分12分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月
10日
2月
10日
3月
10日
4月
10日
5月
10日
6月
10日
昼夜温差
x(℃)
10
11
13
12
8
6
就诊人数
y
22
25
29
26
16
12
该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻两个月数据的概率;
(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据求出y关于x的线性回归方程=x+;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
参考公式:=,=-.
解:(1)设抽到相邻两个月的数据为事件A.
从6组数据中选取2组数据,共有15种情况,每种情况都是等可能出现的.其中,抽到相邻两个月的数据的情况有5种.所以P(A)==.
(2)由数据求得=11,=24,
由公式求得=,=-=-,所以y关于x的线性回归方程为=x-.
(3)当x=10时,=,<2;
当x=6时,=,<2,
所以该小组所得线性回归方程是理想的.
21.(本小题满分12分)甲、乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语.在一轮活动中,如果两人都猜对,则“星队”得3分;如果只有一人猜对,则“星队”得1分;如果两人都没猜对,则“星队”得0分.已知甲每轮猜对的概率是,乙每轮猜对的概率是;每轮活动中甲、乙猜对与否互不影响,各轮结果亦互不影响.假设“星队”参加两轮活动,求:
(1)“星队”至少猜对3个成语的概率;
(2)“星队”两轮得分之和X的分布列和均值E(X).
解:(1)记事件A:“甲第一轮猜对”,
记事件B:“乙第一轮猜对”,
记事件C:“甲第二轮猜对”,
记事件D:“乙第二轮猜对”,
记事件E:“‘星队’至少猜对3个成语”.
由题意,E=ABCD+BCD+ACD+ABD+ABC,由事件的独立性与互斥性,
得P(E)=P(ABCD)+P(BCD)+P(ACD)+P(ABD)+P(ABC)=P(A)P(B)P(C)P(D)+P()P(B)P(C)P(D)+P(A)P()P(C)P(D)+P(A)·P(B)P()P(D)+P(A)P(B)P(C)P()=×××+2×=,
所以“星队”至少猜对3个成语的概率为.
(2)由题意,随机变量X可能的取值为0,1,2,3,4,6.由事件的独立性与互斥性,得
P(X=0)=×××=,
P(X=1)=2×==,
P(X=2)=×××+×××+×××+×××=,
P(X=3)=×××+×××==,
P(X=4)=2×==,
P(X=6)=×××==.
可得随机变量X的分布列为
X
0
1
2
3
4
6
P






所以均值E(X)=0×+1×+2×+3×+4×+6×=.
22.(本小题满分12分)已知一个口袋中装有n个红球(n≥1且n∈N+)和2个白球,从中有放回地连续摸三次,每次摸出2个球,若2个球颜色不同则为中奖,否则不中奖.
(1)当n=3时,设三次摸球中中奖的次数为X,求随机变量X的分布列;
(2)记三次摸球中恰有两次中奖的概率为P,求当n取多少时,P的值最大.
解:(1)当n=3时,根据题意,每次摸出2个球,中奖的概率P1==.
中奖次数X的可能取值为0,1,2,3.
P(X=0)=C×3=;P(X=1)=C××2=;
P(X=2)=C×2×=;P(X=3)=C×3=.
所以随机变量X的分布列为
0
1
2
3
X
P




(2)设每次摸球中奖的概率为p,则三次摸球中恰有两次中奖的概率
P=P(X=2)=C·p2·(1-p)=-3p3+3p2(0由P′=-9p2+6p=-3p(3p-2),知在区间上P为关于p的增函数,在区间上P为关于p的减函数,所以当p=时,P取得最大值.
又因为p===,即n2-3n+2=0,解得n=1或n=2,所以当n=1或n=2时,P的值最大.
课件26张PPT。谢谢!阶段质量检测三
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.对于回归直线方程=x+,下列说法不正确的是(  )
A.直线必经过点(,)
B.x增加1个单位时,y平均增加个单位
C.样本数据中x=0时,可能有y=
D.样本数据中x=0时,一定有y=
解析:选D 回归直线方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.
2.根据如下样本数据:
x
3
4
5
6
7
8
y
4
2.5
-0.5
0.5
-2
-3
得到的回归直线方程为=x+,则(  )
                
A.>0,<0 B.>0,>0
C.<0,>0 D.<0,<0
解析:选A 根据题意,画出散点图.根据散点图,知两个变量为负相关,且回归直线与y轴的交点在y轴正半轴,所以>0,<0.
3.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则(  )
A.两个分类变量关系较弱
B.两个分类变量无关系
C.两个分类变量关系较强
D.无法判断
解析:选C 从条形图中可以看出,在x1中y1比重明显大于x2中y1的比重,所以两个分类变量的关系较强.
4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有(  )
A.b与r的符号相同
B.a与r的符号相同
C.b与r的符号相反
D.a与r的符号相反
解析:选A 因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.
5.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是(  )
x
4
5
6
7
8
9
10
y
14
18
19
20
23
25
28
A.线性函数模型 B.二次函数模型
C.指数函数模型 D.对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
6.某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:
x
16
17
18
19
y
50
44
41
31
由上表可得回归直线方程=x+中的=-6,据此模型预计零售价定为15元时,每天的销售量为(  )
A.48个 B.56个
C.60个 D.65个
解析:选B 由题意知=17.5,=41.5,代入回归直线方程得=146.5,所以回归直线方程为=-6x+146.5,当x=15时,=146.5-15×6=56.5,故选B.
7.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
做不到“光盘”
能做到“光盘”
总计

45
10
55

30
15
45
总计
75
25
100
附:
P(K2≥k0)
0.10
0.05
0.025
k0
2.706
3.841
5.024
参照附表,得到的正确结论是(  )
A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
解析:选C 由公式可计算K2的观测值
k=≈3.03>2.706,
所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.
8.根据下面的2×2列联表得到如下4个判断:
①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.
嗜酒
不嗜酒
总计
患肝病
700
60
760
未患肝病
200
32
232
总计
900
92
992
其中正确判断的个数为(  )
A.0 B.1
C.2 D.3
解析:选C 由2×2列联表中数据可求得K2的观测值k=≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”,即至少有99%的把握认为“患肝病与嗜酒有关”.因此②③正确,故选C.
9.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是(  )
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
解析:选B 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
10.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)的统计调查,已知y与x之间具有线性相关关系,且回归方程为=0.66x+1.562.若某城市的居民人均消费水平为7.675千元,试估计该城市的人均消费额占人均工资收入的百分比约为(  )
A.83% B.72%
C.67% D.66%
解析:选A 将=7.675代入回归方程,可计算得x≈9.26,所以该城市的人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.
11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是(  )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关
解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.
12.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于(  )
A.3 B.4 C.5 D.6
解析:选A 列2×2列联表如下:
x1
x2
总计
y1
10
21
31
y2
c
d
35
总计
10+c
21+d
66
故K2的观测值k=≥5.024.
把选项A,B,C,D代入验证可知选A.
二、填空题(本大题共4个小题,每小题5分,共20分,把答案填在题中横线上)
13.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
8
25
33
总计
b
46
则表中b-a=________.
解析:b-a=8.
答案:8
14.已知样本容量为11,计算得i=510,i=214,回归方程为=0.3x+,则≈________,≈________.(精确到0.01)
解析:由题意得=i=≈46.36,=i=,因为=0.3+,所以=0.3×+,可得≈5.55.
答案:46.36 5.55
15.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分的含量x之间的关系,现取8对观测值,计算得i=52,i=228,=478,iyi=1 849,则y对x的回归直线方程是______________.(精确到0.01)
解析:由回归系数的计算公式,得b=≈2.62,=-b=11.47,故所求的回归直线方程为=2.62x+11.47.
答案:=2.62x+11.47
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
读书
健身
总计

24
31
55

8
26
34
总计
32
57
89
在犯错误的概率不超过________的前提下性别与休闲方式有关系.
解析:由列联表中的数据,得K2的观测值为
k=≈3.689>2.706,
因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.
答案:0.10
三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明证明过程或演算步骤)
17.(本小题满分10分)x与y有如下五组数据,
x
1
2
3
5
10
y
10
5
4
2
2
试分析x与y之间是否具有线性相关关系.若有,求出回归直线方程;若没有,说明理由.
解:作出散点图,如图所示:
由散点图可以看出,x与y不具有线性相关关系.
18.(本小题满分12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:
y1
y2
x1
a
20-a
x2
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?
解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k≥2.706,而
k===.
由k≥2.706得a≥7.19或a≤2.04.
又a>5且15-a>5,a∈Z,解得a=8或9,
故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系.
19.(本小题满分12分)有甲、乙两个班进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下列联表:

优秀
非优秀
总计
甲班
10
乙班
30
合计
105
已知在全部105人中随机抽取1人为优秀的概率为.
(1)请完成上面的列联表;
(2)根据列联表的数据,能否在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”?
解:(1)列联表如下:
优秀
非优秀
总计
甲班
10
45
55
乙班
20
30
50
合计
30
75
105
(2)根据列联表中的数据,得到
K2=≈6.109>3.841,
因此能在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”.
20.(本小题满分12分)为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:
患心肺疾病
不患心肺疾病
总计
大于40岁
16
小于等于40岁
12
总计
40
已知在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为.
(1)请将2×2列联表补充完整;
(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议重症患者住院治疗,现从这16名患者中选出2人,记需住院治疗的人数为ξ,求ξ的分布列和数学期望;
(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?
解:(1)将2×2列联表补充完整如下:
患心肺疾病
不患心肺疾病
总计
大于40岁
16
4
20
小于等于40岁
8
12
20
总计
24
16
40
(2)ξ的可能取值为0,1,2.
P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,
所以随机变量ξ的分布列为
ξ
0
1
2
P



故ξ的数学期望E(ξ)=0×+1×+2×=.
(3)K2==>6.635,
所以能在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关.
21.(本小题满分12分)PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如下表:
时间
周一
周二
周三
周四
周五
车流量x(万辆)
50
51
54
57
58
PM2.5的浓度y
(微克/立方米)
69
70
74
78
79
(1)请根据上表数据,在如图所示的平面直角坐标系中画出散点图;
(2)根据上表数据,用最小二乘法求出y关于x的回归直线方程=x+;
(3)若周六同一时间的车流量是25万辆,试根据(2)中求出的回归直线方程预测此时PM2.5的浓度为多少(保留整数).
解:(1)散点图如图.
(2)∵==54,
==74.
xi-)(yi-)=4×5+3×4+3×4+4×5=64,
xi-)2=(-4)2+(-3)2+32+42=50,
∴===1.28,
=-=74-1.28×54=4.88,
故y关于x的回归直线方程为=1.28x+4.88.
(3)当x=25时,y=1.28×25+4.88=36.88≈37,
所以可以预测此时PM2.5的浓度约为37微克/立方米.
22.(本小题满分12分)在一段时间内,某种商品价格x(万元)和需求量y(t)之间的一组数据如下表:
价格x
1.4
1.6
1.8
2
2.2
需求量
12
10
7
5
3
(1)画出散点图;
(2)求出y对x的线性回归方程,并在(1)的图形上画出它的图象;
(3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t).
解:(1)散点图如图所示.
(2)=1.8,=7.4,iyi=62,=16.6,
====-11.5,=-=7.4+11.5×1.8=28.1.
所以y对x的线性回归方程为=-11.5x+28.1.画出图象如图.
(3)当价格定为1.9万元,即x=1.9时,y=-11.5×1.9+28.1=6.25.所以商品价格定为1.9万元时,需求量大约是6.25 t.