2017_2018学年高中数学第三章统计案例优化练习(打包2套)新人教A版选修2_3

文档属性

名称 2017_2018学年高中数学第三章统计案例优化练习(打包2套)新人教A版选修2_3
格式 zip
文件大小 85.5KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2018-08-06 17:48:12

文档简介

3.1 回归分析的基本思想及其初步应用
[课时作业]
[A组 基础巩固]
1.下列各关系中是相关关系的是 (  )
①路程与时间、速度的关系;②加速度与力的关系;③产品成本与产量的关系;④圆周长与圆面积的关系;⑤广告费支出与销售额的关系.
A.①②④ B.①③⑤
C.③⑤ D.③④⑤
解析:①②④都是确定的函数关系.
答案:C
2.下列关于残差的叙述正确的是(  )
A.残差就是随机误差
B.残差就是方差
C.残差都是正数
D.残差可用来判断模型拟合的效果
解析:由残差的相关知识可知D正确.
答案:D
3.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程为=x+,那么下列说法中不正确的是(  )
A.直线=x+必经过点(,)
B.直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线=x+的斜率为
D.直线=x+的纵截距为-
解析:由用最小二乘法求回归直线方程的公式可知,A,C,D都正确,B不正确,回归直线可以不经过样本数据中的任何一个点.故应选B.
答案:B
4.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:由变量x与y正相关知C,D均错,又回归直线经过样本点的中心(3,3.5),代入验证得A正确,B错误.故选A.
答案:A
5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y(单位:%)为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是(  )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分的人体内脂肪含量为31.50%
解析:当x=37时,=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.
答案:C
6.如图是x和y的样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.
解析:经计算,去掉D(3, 10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.
答案:D(3,10)
7.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:由题意知[0.254(x+1)+0.321]-[0.254x+0.321]=0.254.
答案:0.254
8.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:
月平均气温x(℃)
17
13
8
2
月销售量y(件)
24
33
40
55
由表中数据算出线性回归方程=x+中的≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________.
解析:由表格得(,)为(10,38),又(,)在回归直线=x+上,且≈-2,
∴38=-2×10+,=58,所以=-2x+58,当x=6时,=-2×6+58=46.
答案:46
9.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如表:
温度(x)
0
10
20
50
70
溶解度(y)
66.7
76.0
85.0
112.3
128.0
由资料看y与x呈线性相关,试求回归方程.
解析:=30,==93.6.
===≈0.880 9.
=-=93.6-0.880 9×30=67.173.
故回归方程为=0.880 9x+67.173.
10.某地10户家庭的年收入和年饮食支出的统计资料如下表:
年收入x/万元
2
4
4
6
6
6
7
7
8
10
年饮食支出y
/万元
0.9
1.4
1.6
2.0
2.1
1.9
1.8
2.1
2.2
2.3
(1)根据表中数据,确定家庭的年收入和年饮食支出是否具有相关关系;
(2)如果某家庭年收入为9万元,预测其年饮食支出.
解析:由题意知,年收入x为解释变量,年饮食支出y为预报变量,作散点图如下图所示:
从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
(2)=6,=1.83,=406,
=35.13,iyi=117.7,≈0.172,=- =0.798,
从而得到回归直线方程为=0.172x+0.798.
当x=9时,=0.172×9+0.798=2.346(万元).
[B组 能力提升]
1.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2如表:




R2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好?(  )
A.甲 B.乙
C.丙 D.丁
解析:相关指数R2越大,表示回归模型的拟合效果越好.
答案:A
2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与x间的回归方程为(  )
A.=x+1 B.=x+2
C.=2x+1 D.=x-1
解析:易知变量y与x具有线性相关关系,且=1,=2.5,=3.5,∴=3.5-1×2.5=1,故可得出线性回归方程为=x+1.
答案:A
3.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.
解析:由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得-5=1.23(x-4),即=1.23x+0.08.
答案:=1.23x+0.08
4.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温/℃
18
13
10
-1
杯数
24
34
38
64
由表中数据算得线性回归方程=x+中的≈-2,预测当气温为-5 ℃时,热茶销售量为________杯.(已知回归系数=,=-)
解析:根据表格中的数据可求得
=×(18+13+10-1)=10,=×(24+34+38+64)=40.
∴=-=40-(-2)×10=60,∴=-2x+60,
当x=-5时,=-2×(-5)+60=70.
答案:70
5.某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如表对应数据:
x
10
15
17
20
25
28
32
y
1
1.3
1.8
2
2.6
2.7
3.3
(1)画出散点图;
(2)求回归直线方程;
(3)估计销售总额为24千万元时的利润.
解析:(1)散点图如图:
(2)列表,并利用科学计算器进行有关计算.
i
1
2
3
4
5
6
7
xi
10
15
17
20
25
28
32
yi
1
1.3
1.8
2
2.6
2.7
3.3
=21,=2.1
=3 447,y=34.87,xiyi=346.3
于是=≈0.104.
=2.1-0.104×21=-0.084,
因此回归直线方程为=0.104x-0.084.
(3)当x=24时,y=0.104×24-0.084=2.412(千万元).
6.为探究某弹簧悬挂物体的质量x (单位:g)对弹簧长度y(单位:cm)的影响,分别将6个不同质量的物体悬挂在弹簧下,并测量弹簧的长度,数据如表所示(弹簧的质量忽略不计):
x/g
5
10
15
20
25
30
y/cm
7.25
8.12
8.95
9.90
10.9
11.8
(1)画出散点图;
(2)根据散点图判断是否可以用线性回归模型进行拟合,如果可以,求y与x之间的回归直线方程;
(3)求R2,并对拟合效果做出评价.
解析:(1)散点图如图所示:
(2)由于样本点分布在一条直线附近,所以可以用线性回归模型进行拟合.计算可得=17.5,≈9.487,从而
=≈0.183,
=-≈6.285.
因此,y与x之间的回归直线方程为=0.183x+6. 285.
(3)因为(yi-i)2=0.013 175,
(yi-)2=14.678 33,
所以R2=1-≈0.999.
由于R2非常接近于1,因此拟合效果较好.
3.2 独立性检验的基本思想及其初步应用
[课时作业]
[A组 基础巩固]
1.以下关于独立性检验的说法中,错误的是(  )
A.独立性检验依赖小概率原理
B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判断两事物是否相关的唯一方法
解析:独立性检验只是在一定的可信度下进行判断,不一定正确.
答案:B
2.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大(  )
A.与        B.与
C.与 D.与
解析:由等高条形图可知与相差越大,|ad-bc|就越大,相关性就越强.
答案:C
3.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是(  )
A.k越大,“X与Y有关系”的可信程度越小
B.k越小,“X与Y有关系”的可信程度越小
C.k越接近于0,“X与Y没有关系”的可信程度越小
D.k越大,“X与Y没有关系”的可信程度越大
解析:k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即k越小,“X与Y有关系”的可信程度越小.
答案:B
4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是 (  )
A.k≥6.635 B.k<6.635
C.k≥7.879 D.k<7.879
解析:有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.
答案:C
5.某班主任对全班50名学生进行了作业量的调查,数据如表
认为作业量大
认为作业量不大
总计
男生
18
9
27
女生
8
15
23
总计
26
24
50
则推断“学生的性别与认为作业量大有关”,这种推断犯错误的概率不超过(  )
A.0.01 B.0.005
C.0.025 D.0.001
解析:k=≈5.059>5.024.
∵P(K2≥5.024)=0.025,
∴犯错误的概率不超过0.025.
答案:C
6.在吸烟与患肺病是否相关的判断中,有下面的说法:
①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;
③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是________.
解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.
答案:③
7.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
进行统计分析时的统计假设是_________________________________________________.
解析:根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与剂量无关”.
答案:小白鼠的死亡与剂量无关
8.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
理科
文科

13
10

7
20
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到k=≈4.844.则认为选修文科与性别有关系出错的可能性约为________.
解析:k≈4.844>3.841,故判断出错的概率为0.05.
答案:0.05
9.某防疫站检查屠宰场及肉食零售点的猪肉沙门氏菌情况,结果如表,试检验屠宰场与零售点猪肉带菌率有无差异.
带菌头数
不带菌头数
总计
屠宰场
8
32
40
零售点
14
18
32
总计
22
50
72
解析:由公式得K2的观测值
k=≈4.726.
因为4.726>3.841,所以我们有95%的把握说,屠宰场与零售点猪肉带菌率有差异.
10.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.如表是性别与吃零食的列联表:


总计
喜欢吃零食
5
12
17
不喜欢吃零食
40
28
68
总计
45
40
85
请问喜欢吃零食与性别是否有关?
解析:K2=,
把相关数据代入公式,得K2的观测值k=≈4.722>3.841.
因此,约有95%的把握认为“喜欢吃零食与性别有关”.
[B组 能力提升]
1.考察棉花种子经过处理与生病之间的关系,得到表中的数据:
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
根据以上数据可得出(  )
A.种子是否经过处理与是否生病有关
B.种子是否经过处理与是否生病无关
C.种子是否经过处理决定是否生病
D.有90%的把握认为种子经过处理与生病有关
解析:k=≈0.164<0.455,
即没有充足的理由认为种子是否经过处理跟生病有关.
答案:B
2.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706
P(K2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
如果K2≥5.024,那么就有把握认为“X与Y有关系”的百分比为(  )
A.25% B.75%
C.2.5% D.97.5%
解析:k0=5.024对应的0.025是“X与Y有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.
答案:D
3.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得如表中的数据:
无效
有效
总计
男性患者
15
35
50
女性患者
6
44
50
总计
21
79
100
假设H0:服用此药的效果与患者的性别无关,计算得K2的观测值k≈________(小数点后保留三位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
解析:由公式计算得K2的观测值k≈4.882,
∴k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.
答案:4.882 5%
4.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为________.
解析:列出2×2列联表:
发病
不发病
总计
阳性家族史
16
93
109
阴性家族史
17
240
257
总计
33
333
366
随机变量K2的观测值
k=≈6.067>5.024,
所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关.
答案:0.975
5.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.
(1)根据以上数据列出2×2列联表;
(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关系吗?为什么?
解析:(1)由已知可列2×2列联表:
患胃病
未患胃病
总计
生活规律
20
200
220
生活不规律
60
260
320
总计
80
460
540
(2)根据列联表中的数据,由计算公式得K2的观测值
k=≈9.638.
∵9.638>6.635,
因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.
6.用两种检验方法对某食品做沙门氏菌检验,结果如表.
阳性
阴性
总计
荧光抗体法
160
5
165
常规培养法
26
48
74
总计
186
53
239
附:
P(K2≥k0)
0.010
0.005
0.001
k0
6.635
7.879
10.828
(1)利用图形判断采用荧光抗体法与检验结果呈阳性是否有关系;
(2)能否在犯错误的概率不超过0.001的前体下认为采用荧光抗体法与检验结果呈阳性有关系?
解析:(1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.
(2)通过计算可知K2=≈113.184 6.而查表可知,因为P(K2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.