【优化设计】2015-2016数学人教A版选修2-3 第三章 统计案例(课后训练+单元测评)(打包4套)

文档属性

名称 【优化设计】2015-2016数学人教A版选修2-3 第三章 统计案例(课后训练+单元测评)(打包4套)
格式 zip
文件大小 261.7KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2015-12-31 13:54:30

文档简介

【优化设计】2015-2016学年高中数学 3.1回归分析的基本思想及其初步应用课后训练 新人教A版选修2-3
A组
1.为了考察两个变量x和y之间的线性相关 ( http: / / www.21cnjy.com )性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用最小二乘法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,则下列说法正确的是(  )
                 
A.l1和l2有交点(s,t)
B.l1与l2相交,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
解析:都过样本中心点(s,t),但斜率不确定.
答案:A
2.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程为x+,且x1+x2+…+x8=2(y1+y2+…+y8)=6,则实数等于(  )
A. B.
C. D.
解析:由x1+x2+…+x8=2(y1+y2+…+y8)=6,得.
由于回归直线方程x+过样本点(),则,解得.
答案:B
3.下列说法中表述恰当的个数为(  )
①相关指数R2可以刻画回归模型的拟合效果,R2越接近于1,说明模型的拟合效果越好;
②在线性回归模型中,R2表示解释变量对于预报变量的贡献率,R2越接近于1,表示解释变量和预报变量的线性相关关系越强;
③若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当.
A.0 B.1 C.2 D.3
解析:由回归分析的相关概念知①②③都正确.
答案:D
4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,下列结论中不正确的是(  )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心()
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:由回归方程为=0.85x-85.71 ( http: / / www.21cnjy.com )知y随x的增大而增大,所以y与x具有正的线性相关关系;由最小二乘法建立回归方程的过程知x+x+),所以回归直线过样本点的中心();利用回归方程可以估计总体,所以D不正确.
答案:D
5.已知x,y的取值如下表:
x 0 1 3 4
y 2.2 4.3 4.8 6.7
若x,y具有线性相关关系,且回归方程为=0.95x+,则等于(  )
A.0.325 B.2.6 C.2.2 D.0
解析:由已知得=2,=4.5,而回归直线过点(),则4.5=0.95×2+=2.6.
答案:B
6.在某学生的4次模拟考试中,其英语作文的减分情况如下表:
考试次数x 1 2 3 4
所减分数y 4.5 4 3 2.5
若所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为(  )
A.=0.7x+5.25 B.=-0.6x+5.25
C.=-0.7x+6.25 D.=-0.7x+5.25
解析:由题意可知,所减分数y与模拟考试次数x之间的相关关系为负相关,所以排除A.
考试次数的平均数为(1+2+3+4)=2.5,
所减分数的平均数为(4.5+4+3+2.5)=3.5,
即回归直线应该过点(2.5,3.5),代入选项验证可知直线y=-0.7x+5.25成立,故选D.
答案:D
7.在研究两个变量的相关关系时,观察散点图 ( http: / / www.21cnjy.com )发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=ln y,求得回归直线方程为=0.25x-2.58,则该模型的回归方程为           .
解析:由z=ln y,=0.25x-2.58,
得ln =0.25x-2.58,
∴=e0.25x-2.58.
故该模型的回归方程为=e0.25x-2.58.
答案:=e0.25x-2.58
8.将形如y=axb+c(b≠0)的函数转化成线性函数的方法是:令   ,则得到方程   ,其函数图象是一条直线.
答案:t=xb y=at+c
9.某服装店经营某种服装,在某周内纯获利y(单位:元)与该周每天销售这种服装件数x之间的一组数据如下表:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
(1)求样本中心点;
(2)画出散点图;
(3)求纯获利y与每天销售件数x之间的回归方程.
解:(1)=6,≈79.86,即样本中心点为(6,79.86).
(2)散点图如图所示.
( http: / / www.21cnjy.com )
(3)因为≈4.75,
≈51.36,所以=4.75x+51.36.
10.为了研究某种细菌繁殖的个数随时间x变化的情况,收集如下数据:
天数x 1 2 3 4 5 6
繁殖个数y 6 12 25 49 95 190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据对应的散点图;
(2)观察散点图是否可用曲线y=c1拟合,描述解释变量与预报变量之间的关系.
解:(1)作出散点图,如图所示.
( http: / / www.21cnjy.com )
(2)由散点图可以看出散点图可用曲线y=c1拟合,于是令z=ln y,则数据转化为
x 1 2 3 4 5 6
z 1.79 2.48 3.22 3.89 4.55 5.25
由计算得=0.69x+1.115,
则有=e0.69x+1.115.
B组
                 
1.给出关于x,y的下列数据,则建立的函数模型与所给数据符合较好的是(  )
x 1 2 3 4 5 6 7 8 9 10
y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3
A.y=2+x B.y=2ex
C.y=2 D.y=2+ln x
解析:画出散点图(图略),并代入数据检验可知选D.
答案:D
2.给出关于x,y的下列数据:
x 0.1 0.2 0.3 0.5 1 2 3 4 5
y 20 9 6 4 2 0.94 0.65 0.51 0.45
则x,y满足的函数模型为   .
解析:画出散点图(图略),图形形如y=的图象,经检验知b≈2.
答案:y=
3.在对于变量y与x的10组统计数据的回归模型中,R2=0.95,又知残差平方和为120.53,则(yi-)2的值为    .
解析:依题意有0.95=1-,所以=2 410.6.
答案:2 410.6
4.面对竞争日益激烈的消费 ( http: / / www.21cnjy.com )市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:
=71,=79,xiyi=1 481.
则销量每增加1 000箱,单位成本约下降    元.
解析:由题意知≈-1.818 2,
≈71-(-1.818 2)×≈77.36,=-1.818 2x+77.36,所以销量每增加1千箱,单位成本约下降1.818 2元.
答案:1.818 2
5.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号 1 2 3 4 5
工作年限x/年 3 5 6 7 9
年推销金额y/万元 2 3 3 4 5
(1)求年推销金额y关于工作年限x的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
解:(1)设所求的线性回归方程为x+,
则=0.5,
=0.4.
所以年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.
(2)当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).
所以可以估计第6名推销员的年推销金额为5.9万元.
6.假设某农作物基本苗数x与有效穗数y之间存在相关关系,今测得5组数据如下:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
(1)以x为解释变量,y为预报变量,画出散点图;
(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗数.
解:(1)散点图如图所示.
( http: / / www.21cnjy.com )
(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程来建立两个变量之间的关系.
设线性回归方程为x+,
由题表中数据可得≈0.29,≈34.70,
故y与x之间的回归方程为=0.29x+34.70.
当x=56.7时,=0.29×56.7+34.70=51.143.
7.某地区不同身高的未成年男性的体重平均值如下表:
身高x/cm 60 70 80 90 100 110
体重y/kg 6.13 7.90 9.99 12.15 15.02 17.50
身高x/cm 120 130 140 150 160 170
体重y/kg 20.92 26.86 31.11 38.85 47.25 55.05
(1)试建立y与x之间的回归方程;
(2)如果体重超过相同身高男性体重平均 ( http: / / www.21cnjy.com )值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高175 cm、体重82 kg的在校男生体重是否正常
解:(1)根据题表中的数据画出散点图如图所示.
( http: / / www.21cnjy.com )
由图可看出,样本点分布在某条指数函数曲线y=c1的周围,
于是令z=ln y,得下表:
x 60 70 80 90 100 110 120 130 140 150 160 170
z 1.81 2.07 2.30 2.50 2.71 2.86 3.04 3.29 3.44 3.66 3.86 4.01
作出散点图如图所示.
( http: / / www.21cnjy.com )
由表中数据可得z与x之间的回归直线方程为=0.662 5+0.020x,
则有=e0.662 5+0.020x.
(2)当x=175时,预报平均体重为
=e0.662 5+0.020×175≈64.23,
因为64.23×1.2≈77.08<82,所以这个男生偏胖.【优化设计】2015-2016学年高中数学 第三章 统计案例单元测评A 新人教A版选修2-3
(基础过关卷)
(时间:90分钟,满分:100分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法:①在残差图中,残差点比较均匀 ( http: / / www.21cnjy.com )地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和大小,残差平方和越小的模型拟合效果越好.其中说法正确的是(  )
A.①②          B.②③
C.①③ D.①②③
答案:C
2.下列关于回归分析与独立性检验的说法正确的是(  )
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
解析:回归分析是对两个变量之间的相关关 ( http: / / www.21cnjy.com )系的一种分析,而相关关系是一种不确定的关系,通过回归分析可以确定两个变量之间具有的近似关系;而独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.
答案:C
3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是(  )
x 4 5 6 7 8 9 10
y 14 18 19 20 23 25 28
A.线性函数模型
B.二次函数模型
C.指数函数模型
D.对数函数模型
解析:画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
答案:A
4.一位母亲记录了儿子3~9岁的身 ( http: / / www.21cnjy.com )高数据,由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(  )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm左右
D.身高在145.83 cm以下
解析:回归模型只能进行预测,应选C.
答案:C
5.某考察团对全国10个城市进行 ( http: / / www.21cnjy.com )职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为(  )
A.72% B.83%
C.67% D.66%
解析:因为当=7.675时,x=≈9.262,
所以≈0.829≈83%.
答案:B
6.已知一个线性回归方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则等于(  )
A.60 B.46.5
C.58.5 D.75
解析:=9,因为回归直线方程过点(),所以=1.5×+45=1.5×9+45=58.5.
答案:C
7.有一组观测数据(x1,y1),(x ( http: / / www.21cnjy.com )2,y2),…,(x12,y12)得=1.542,=2.847 5,=29.808,=99.208,xiyi=54.243,则回归直线方程为(  )
A.=1.218x-0.969
B.=-1.218x+0.969
C.=0.969x+1.218
D.=1.218x+0.969
解析:由公式得≈1.218,≈0.969.
∴回归直线方程为=1.218x+0.969.
答案:D
8.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施(  )
优、良、中 差 总计
实验班 48 2 50
对比班 38 12 50
总计 86 14 100
A.有关
B.无关
C.关系不明确
D.以上都不正确
解析:随机变量K2的观测值k=≈8.306>6.635,则认为“实验效果与教学措施有关”的概率约为0.99.
答案:A
9.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面列联表:
  数学物理   85~100分 85分以下 总计
85~100分 37 85 122
85分以下 35 143 178
总计 72 228 300
现判断数学成绩与物理成绩有关系,则判断的出错率为(  )
A.0.5% B.1%
C.2% D.5%
解析:代入公式得K2的观测值
k=≈4.514>3.841,查表可得,判断的出错率为5%.
答案:D
10.两个分类变量X和Y,它们的可 ( http: / / www.21cnjy.com )能取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于(  )
A.3 B.4
C.5 D.6
解析:列2×2列联表如下
x1 x2 总计
y1 10 21 31
y2 c d 35
总计 10+c 21+d 66
故K2的观测值k=≥5.024.
把选项A,B,C,D代入验证可知选A.
答案:A
二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中横线上)
11.已知某车间加工零件的个数x与所 ( http: / / www.21cnjy.com )花费时间y(单位:h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要    h.
解析:当x=600时,=0.01×600+0.5=6.5.
答案:6.5
12.下面是一个2×2列联表:
y1 y2 合计
x1 a 21 70
x2 5 c 30
总计 b d 100
则b-d=   .
答案:8
13.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e2x+1的图象附近,则可通过转换得到的线性回归方程为   .
解析:由y=3e2x+1,得ln y=ln(3e2x+1),
即ln y=ln 3+2x+1.
令u=ln y,v=x,则线性回归方程为u=1+ln 3+2v.
答案:y=1+ln 3+2x
14.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:
年龄 合计
不超过40岁 超过40岁
吸烟量不多于20支/天 50 15 65
吸烟量多于20支/天 10 25 35
合计 60 40 100
则在犯错误的概率不超过   的前提下认为吸烟量与年龄有关.
解析:利用题中列联表,代入公式计算.
K2的观测值为k=≈22.16>10.828, 
所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.
答案:0.001
15.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
患慢性气管炎 未患慢性气管炎 合计
吸烟 20 20 40
不吸烟 5 55 60
合计 25 75 100
根据列联表数据,求得K2=    (保留3位有效数字),根据下表,有    的把握(填写相应的百分比)认为患慢性气管炎与吸烟有关.
附:
 
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
K2=.
解析:K2的观测值k=≈22.2>10.828.
∴有99.9%的把握认为患慢性气管炎与吸烟有关.
答案:22.2 99.9%
三、解答题(本大题共4小题,共25分.解答应写出必要的文字说明、证明过程或演算步骤)
16.(6分)在一次恶劣气候的飞行航程 ( http: / / www.21cnjy.com )中调查男、女乘客在飞机上晕机的情况,共调查了89位乘客,其中男乘客有24人晕机,31人不晕机;女乘客有8人晕机,26人不晕机.根据此材料能否在犯错误的概率不超过0.05的前提下认为在恶劣气候飞行中男性比女性更容易晕机
解:由已知数据列出2×2列联表:
晕机 不晕机 总计
男性 24 31 55
女性 8 26 34
总计 32 57 89
根据公式计算得K2的观测值为
k=≈3.689<3.841.
所以在犯错误的概率不超过0.05的前提下我们不能认为恶劣气候下飞行中男性比女性更容易晕机.
17.(6分)有两个分类变量X与Y的取值分别为{x1,x2},{y1,y2},其2×2列联表为
y1 y2
x1 a 20-a
x2 15-a 30+a
其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为X与Y之间有关系
解:查表可知,要使在犯错误的概率不超过0.1的前提下认为X与Y之间有关系,则k≥2.706,而
K2的观测值为
k=,
由k≥2.706,
得a>7.19或a≤2.04.
又a>5,且15-a>5,a∈Z,即a=8或9.
故a为8或9时,在犯错误的概率不超过0.1的前提下认为X与Y之间有关系.
18.(6分)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人
解:设男生人数为x,依题意可得列联表如下:
喜欢韩剧 不喜欢韩剧 总计
男生 x
女生
总计 x
若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则k≥3.841,
K2的观测值为k=≥3.841,解得x>10.24.
∵为整数,
∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,男生至少有12人.
19.(7分)假定某企业的某种产品产量与单位成本数据如下:
产量x(千件) 2 3 4 3 4 5
单位成本y(元/件) 73 72 71 73 69 68
(1)试确定回归直线方程;
(2)指出产量每增加1 000件时,单位成本下降多少元;
(3)假定产量为6 000件时,单位成本是多少 单位成本为70元时,产量应为多少
解:(1)xi=21,yi=426,=79,=30 268,xiyi=1 481,=3.5,=71,
=
=≈-1.818,
≈71+1.818×3.5=77.363,
∴回归方程为y=77.363-1.818x.
(2)产量每增加1 000件时单位成本下降1.818元.
(3)当x=6时,y=66.455;
当y=70时,x≈4.
所以当产量为6 000件时,单位成本约为66.455元;当单位成本为70元时,产量应约为4 000件.【优化设计】2015-2016学年高中数学 第三章 统计案例单元测评B 新人教A版选修2-3
(高考体验卷)
(时间:90分钟 满分:100分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2014重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )
A.=0.4x+2.3      
B.=2x-2.4
C.=-2x+9.5
D.=-0.3x+4.4
解析:由变量x与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过点(),由此排除B,故选A.
答案:A
2.(2015福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元) 8.2 8.6 10.0 11.3 11.9
支出y(万元) 6.2 7.5 8.0 8.5 9.8
根据上表可得回归直线方程x+,其中=0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为(  )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:∵=10,
=8,
∴-0.76=8-0.76×10=0.4.
∴=0. 76x+0.4.
当x=15时,
=0.76×15+0.4=11.8.
答案:B
3.(2015湖北武汉调考)根据如下样本数据:
x 3 4 5 6 7
y 4.0 2.5 -0.5 0.5 -2.0
得到的回归直线方程为x+.若=7.9,则x每增加1个单位,y就(  )
A.增加1.4个单位 B.减少1.4个单位
C.增加1.2个单位 D.减少1.2个单位
解析:(3+4+5+6+7)=5,(4.0+2.5-0.5+0.5-2.0)=0.9,所以样本中心为(5,0.9),代入回归直线方程可得0.9=×5+7.9 =-1.4,所以x每增加1个单位,y就减少1.4个单位,故选B.
答案:B
4.(2012新课标全国高考改编)在一组 ( http: / / www.21cnjy.com )样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关指数为(  )
A. B.0
C. D.1
解析:因为所有的点都在直线上,所以就是确定的函数关系,所以相关指数为1.
答案:D
5.(2014陕西咸阳模拟)某产品在某零售摊位上的零售价x(元)与每天的销售量y(个)的统计如下表:
x 16 17 18 19
y 50 34 41 31
据上表可得回归直线方程x+中的=-4,则据此模型预测零售价为15元时,销售量为(  )
A.48 B.49
C.50 D.51
解析:=39.
∵回归直线方程为x+,且=-4,
∴39=-4×+a,解得a=109.
∴=-4x+109,当x=15时,y=49.
答案:B
6.(2014河南开封模拟)在一次独立性检验中,得到2×2列联表如下:
y1 y2 总计
x1 200 800 1 000
x2 180 m 180+m
总计 380 800+m 1 180+m
且最后发现,两个分类变量X和Y没有任何关系,则m的可能值是(  )
A.200 B.720
C.100 D.180
解析:∵两个变量没有任何关系,∴200m≈180×800,解得m≈720.
答案:B
7.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关,且=2.347x-6.423;
②y与x负相关,且=-3.476x+5.648;
③y与x正相关,且=5.437x+8.493;
④y与x正相关,且=-4.326x-4.578.
其中一定不正确的结论的序号是(  )
A.①② B.②③
C.③④ D.①④
解析:正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④,故选D.
答案:D
8.(2014湖北高考)根据如下样本数据:
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
得到的回归方程为x+,则(  )
A.>0,>0
B.>0,<0
C.<0,>0
D.<0,<0
解析:由样本数据可知y值总体上是随x值的增大而减少的,故<0.又回归直线过第一象限,故纵截距>0.故选B.
答案:B
9.(2013福建高考改编)已知x与y之间的几组数据如下表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归直线方程为 ( http: / / www.21cnjy.com )x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为'x+',则以下结论正确的是(  )
A.',' B.','
C.',' D.','
解析:,
,
,
=-,
'==2>'=-2<.
答案:C
10.(2014江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(  )
表1
   成绩性别    不及格 及格 总计
男 6 14 20
女 10 22 32
总计 16 36 52
表2
   视力性别    好 差 总计
男 4 16 20
女 12 20 32
总计 16 36 52
表3
   智商性别    偏高 正常 总计
男 8 12 20
女 8 24 32
总计 16 36 52
表4
   阅读量性别    丰富 不丰富 总计
男 14 6 20
女 2 30 32
总计 16 36 52
A.成绩 B.视力
C.智商 D.阅读量
解析:根据K2=,代入题中数据计算得D选项K2最大.故选D.
答案:D
二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中横线上)
11.(2015河北唐山一模)为了研究某种细 ( http: / / www.21cnjy.com )菌在特定环境下随时间变化的繁殖规律,得如下实验数据,计算得回归直线方程为=0.85x-0.25.由以上信息,得到下表中c的值为   .
天数x/天 3 4 5 6 7
繁殖个数y/千个 2.5 3 4 4.5 c
解析:∵=5,,∴这组数据的样本中心点是.把样本中心点代入回归直线方程中得=0.85×5-0.25,解得c=6.
答案:6
12.(2015辽宁大连双基)已知x,y的取值如下表所示:
x 2 3 4
y 6 4 5
如果y与x线性相关,且线性回归方程为x+,则的值为   .
解析:将=3,=5代入到x+中,得=-.
答案:-
13.(2011辽宁高考)调查 ( http: / / www.21cnjy.com )了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元).调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加    万元.
解析:家庭收入每增加1万元,对应回归直线方程中的x增加1,相应的的值增加0.254,即年饮食支出平均增加0.254万元.
答案:0.254
14.(2014山东青岛高三月考试 ( http: / / www.21cnjy.com )题)已知y与x之间具有很强的线性相关关系,现观测得到(x,y)的四组观测值并制作了如下的对照表,由表中数据粗略地得到线性回归直线方程为x+60,其中的值没有写上.当x不小于-5时,预测y的最大值为    .
x 18 13 10 -1
y 24 34 38 64
解析:由已知,得=10,
=40,
所以40=10+60,=-2,=-2x+60.当x≥-5时,≤70.
答案:70
15.(2011广东高考)某 ( http: / / www.21cnjy.com )数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为     cm.
解析:由题意父亲身高x cm与儿子身高y cm对应关系如下表:
x 173 170 176
y 170 176 182
则=173,
=176,
(xi-)(yi-)=(173-173)×( ( http: / / www.21cnjy.com )170-176)+(170-173)×(176-176)+(176-173)(182-176)=18,
(xi-)2=(173-173)2+(170-173)2+(176-173)2=18.
∴=1.∴=176-173=3.
∴线性回归直线方程x+=x+3.
∴可估计孙子身高为182+3=185(cm).
答案:185
三、解答题(本大题共4小题,共25分.解答应写出必要的文字说明、证明过程或演算步骤)
16.(6分)(2014课标全国Ⅱ高考)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份 2007 2008 2009 2010 2011 2012 2013
年份代号t 1 2 3 4 5 6 7
人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007 ( http: / / www.21cnjy.com )年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为.
解:(1)由所给数据计算得
(1+2+3+4+5+6+7)=4,
(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)
=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
=0.5,
=4.3-0.5×4=2.3,
所求回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
17.(6分)(2014安徽高考改编)某高校 ( http: / / www.21cnjy.com )共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法.收集300位学生每周平均体育运动时间的样本数据(单位:小时).
( http: / / www.21cnjy.com )
(1)应收集多少位女生的样本数据
(2)根据这300个样本数据, ( http: / / www.21cnjy.com )得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
附K2=.
解:(1)300×=90,
所以应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,
所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:
每周平均体育运动时间与性别列联表
男生 女生 总计
每周平均体育运动时间不超过4小时 45 30 75
每周平均体育运动时间超过4小时 165 60 225
总计 210 90 300
结合列联表可算得K2的观测值为k=≈4.762>3.841.
所以,能在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
18.(6分)(2013福建高考改编)某工厂 ( http: / / www.21cnjy.com )有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
( http: / / www.21cnjy.com )
25周岁以上组
( http: / / www.21cnjy.com )
25周岁以下组
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不 ( http: / / www.21cnjy.com )少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”
附:χ2=
P(χ2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
(注:此公式也可以写成K2=)
解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以,样本中日平均生产件数 ( http: / / www.21cnjy.com )不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果 ( http: / / www.21cnjy.com )共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的 ( http: / / www.21cnjy.com )可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
(2)由频率分布直方图可知,在抽取 ( http: / / www.21cnjy.com )的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:
生产能手 非生产能手 合计
25周岁以上组 15 45 60
25周岁以下组 15 25 40
合计 30 70 100
所以得K2的观测值为
k=
=
=≈1.79.
因为1.79<2.706,
所以不能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”.
19.(7分)(2015课标全国Ⅰ高考)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
( http: / / www.21cnjy.com )
(xi-)2 (wi-)2 (xi-)(yi-) (wi-)(yi-)
46.6 563 6.8 289.8 1.6 1 469 108.8
表中wi=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型 (给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少
②年宣传费x为何值时,年利润的预报值最大
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为.
解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程.
由于=68,
=563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.
(3)①由(2)知,当x=49时,年销售量y的预报值
=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当=6.8,即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.【优化设计】2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用课后训练 新人教A版选修2-3
A组
1.关于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是(  )
A.k的值越大,“X和Y有关系”的可信程度越小
D.k的值越小,“X和Y有关系”的可信程度越小
C.k的值越接近于0,“X和Y无关”的可信程度越小
D.k的值越大,“X和Y无关”的可信程度越大
解析:k的值越大,X和Y有关系的可能性就越大,也就意味着X与Y无关系的可能性就越小.
答案:B
                 
2.下面是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出(  )
( http: / / www.21cnjy.com )
A.性别与喜欢理科无关
B.女生中喜欢理科的比例约为80%
C.男生比女生喜欢理科的可能性大些
D.男生中不喜欢理科的比例约为60%
解析:由题图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.故选C.
答案:C
3.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:
文化程度与月收入列联表(单位:人)
月收入2 000元以下 月收入2 000元及以上 总计
高中文化以上 10 45 55
高中文化及以下 20 30 50
总计 30 75 105
由上表中数据计算得K2的观测值k=≈6.109,请估计“文化程度与月收入有关系”的把握是(  )
A.1% B.99%
C.2.5% D.97.5%
解析:由于6.109>5.024,故在犯错误的概率不超过0.025的前提下认为“文化程度与月收入有关系”,即有97.5%的把握认为“文化程度与月收入有关系”.
答案:D
4.假设两个分类变量X与Y,它们的值域分别为{x1,x2},{y1,y2},其2×2列联表为
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为(  )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=2,d=4
C.a=5,b=2,c=4,d=3
D.a=2,b=3,c=5,d=4
解析:相差越大,说明ad与bc相差越大,两个分类变量有关系的可能性越大.
答案:B
5.某班主任对全班50名学生进行了作业量的调查,所得数据如下表:
认为作业量大 认为作业量不大 总计
男生 18 9 27
女生 8 15 23
总计 26 24 50
则推断“学生的性别与认为作业量大有关”,这种推断犯错误的概率不超过(  )
A.0.01 B.0.005 C.0.025 D.0.001
解析:K2的观测值为k=≈5.059>5.024.
∵P(K2≥5.024)=0.025,
∴犯错误的概率不超过0.025.
答案:C
6.在独立性检验中,在犯错误不超过0.01的前提下认为两个分类变量“X和Y有关系”,则K2的观测值k的取值范围是   .
解析:∵P(K2>6.635)=0.01,∴6.635答案:(6.635,+∞)
7.某卫生机构对366人进行健康体检, ( http: / / www.21cnjy.com )有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率约为    .
解析:列出2×2列联表:
发病 不发病 总计
阳性家族史 16 93 109
阴性家族史 17 240 257
总计 33 333 366
所以随机变量K2的观测值为
k=≈6.067>5.024,
所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关.
答案:0.975
8.从发生汽车交通事故的司机中抽取2 000名司机,调查他们的血液中是否含有酒精以及他们是否对事故负有责任,将数据整理如下:
有责任 无责任 总计
有酒精 650 150 800
无酒精 700 500 1 200
总计 1 350 650 2 000
根据以上数据判断司机对事故负有责任与血液中含有酒精是否有关系 若有关系,你认为在多大程度上有关系
解:K2的观测值为k=≈114.9
因为114.9>10.828,
所以,我们有99.9%的把握认为司机对事故负有责任与血液中含有酒精有关.
9.某大型活动即将举行,为了做好接待工作, ( http: / / www.21cnjy.com )组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.
(1)根据以上数据完成以下2×2列联表:
喜爱运动 不喜爱运动 总计
男 10 16
女 6 14
总计 30
(2)根据列联表判断能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关
解:(1)
喜爱运动 不喜爱运动 总计
男 10 6 16
女 6 8 14
总计 16 14 30
(2)由已知数据可求得:
K2的观测值为k=≈1.157 5<2.706,
因此,不能在犯错误的概率不超过0.10的前提下认为喜爱运动与性别有关.
B组
1.                    
为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀 作文成绩一般 总计
课外阅读量较大 22 10 32
课外阅读量一般 8 20 28
总计 30 30 60
由以上数据,计算得到K2的观测值是k≈9.643,根据临界值表,在犯错误的概率不超过   的前提下认为课外阅读量大与作文成绩优秀有关.
解析:由临界值表知P(K2>7.879)=0.005,所以在犯错误的概率不超过0.005的前提下认为课外阅读量大与作文成绩优秀有关.
答案:0.005
2.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如下表所示:
死亡 存活 总计
第一种剂量 14 11 25
第二种剂量 6 19 25
总计 20 30 50
进行统计分析时,计算得到K2的观测值k≈   .(精确到0.01)
答案:5.33
3.某校2015年高三年级2个班共91人参加高考,统计数据如下:
城镇考生 农村考生
录取 31 24
未录取 19 17
则在犯错误的概率不超过0.10的前提下认为考生的户口形式和高考被录取   .(填“无关”或“有关”)
解析:2×2列联表如下:
城镇考生 农村考生 合计
录取 31 24 55
未录取 19 17 36
合计 50 41 91
计算K2的观测值k=≈0.11.
由于0.11<2.706,所以在犯错误的概率不超过0.10的前提下认为考生的户口形式和高考被录取无关.
答案:无关
4.随着工业化以及城市车辆的 ( http: / / www.21cnjy.com )增加,城市的空气污染越来越严重,空气质量指数API一直居高不下,对人体的呼吸系统造成了严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康情况,得到2×2列联表如下:
室外工作 室内工作 总计
有呼吸系统疾病 150
无呼吸系统疾病 100
总计 200
(1)补全2×2列联表;
(2)能否在犯错误的概率不超过0.05的前提下认为感染呼吸系统疾病与工作场所有关
(3)现采用分层抽样从室内工作的居民中抽取一个容量为6的样本,将该样本看成一个总体,从中随机地抽取两人,求两人都有呼吸系统疾病的概率.
解:(1)列联表如下:
室外工作 室内工作 总计
有呼吸系统疾病 150 200 350
无呼吸系统疾病 50 100 150
总计 200 300 500
(2)计算得K2的观测值为k=≈3.968>3.841.
所以能在犯错误的概率不超过0. 05的前提下认为感染呼吸系统疾病与工作场所有关.
(3)采用分层抽样从室内工作的居民中抽 ( http: / / www.21cnjy.com )取6名,其中有呼吸系统疾病的抽4人,无呼吸系统疾病的抽2人,A=“从中随机地抽取两人,两人都有呼吸系统疾病”,则P(A)=.
5.对某校学生进行心理障碍测试得到的数据如下表:
焦虑 说谎 懒惰 总计
女生 5 10 15 30
男生 20 10 50 80
总计 25 20 65 110
试说明在这三种心理障碍中哪一种与性别关系最大.
解:对于题中三种心理障碍分别构造三个随机变量.其观测值分别为k1,k2,k3.
由题表中数据列出焦虑是否与性别有关的2×2列联表:
焦虑 不焦虑 总计
女生 5 25 30
男生 20 60 80
总计 25 85 110
可得k1=≈0.863<2.706,
同理,k2=≈6.366>5.024,
k3=≈1.410<2.706.
因此,在犯错误的概率不超过0.025的前提下,认为说谎与性别有关,没有充分的证据显示焦虑、懒惰与性别有关.