第三章 学业质量标准检测
时间120分钟,满分150分.
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)
1.下列不具有相关关系的是( D )
A.瑞雪兆丰年 B.名师出高徒
C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧
[解析] 喜鹊叫喜,乌鸦叫丧是一种迷信说法,无任何关系.
2.(2019·四川模拟)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:
根据图中的信息,下列结论中不正确的是( D )
A.样本中的男生数量多于女生数量
B.样本中喜欢手机支付的数量多于现金支付的数量
C.样本中多数男生喜欢手机支付
D.样本中多数女生喜欢现金支付
[解析] 由左图知,样本中的男生数量多于女生数量,A正确;
由右图知样本中喜欢手机支付的数量多于现金支付的数量,B正确;
由右图知,样本中多数男生喜欢手机支付,C正确;
由右图知样本中女生喜欢现金支付人数比手机支付人数少,D错误.
故选D.
3.(2019·福州高二检测)在一次试验中,当变量x取值分别是1,,,时,变量Y的值依次是2,3,4,5,则Y与之间的回归曲线方程是( A )
A.=+1 B.=+3
C.=2x+1 D.=x-1
[解析] 把x=1,,,代入四个选项,逐一验证可得=+1.
4.(2019·唐山高二检测)四名同学根据各自的样本数据研究变量x、y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
② y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( D )
A.①② B.②③
C.③④ D.①④
[解析] y与x正(或负)相关时,线性回归直线方程y=x+中,x的系数>0(或<0),故①④错.
5.对变量x、y观测数据(x1,y1)(i=1,2,…,10),得散点图1;对变量u、v有观测数据(u1,v1)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( C )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
[解析] 本题主要考查了变量的相关知识.
用散点图可以判断变量x与y负相关,u与v正相关.
6.为了解疾病A是否与性别有关,在一医院随机地对入院的50人进行了问卷调查得到了如下的列联表:
患疾病A
不患疾病A
总计
男
20
5
25
女
10
15
25
总计
30
20
50
请计算出统计量K2,你有多大的把握认为疾病A与性别有关( C )
下面的临界值表供参考:
P(K2≥k)
0.05
0.010
0.005
0.001
k
3.841
6.635
7.879
10.828
A.95% B.99%
C.99.5% D.99.9%
[解析] 由公式得K2=
≈8.333>7.879,
故有1-0.005=99.5%的把握认为疾病A与性别有关.
7.(2019·大连高二检测)已知回归直线的斜率的估计值是2,样本点的中心为(4,12),则回归直线的方程是( A )
A.=2x+4 B.=x+2
C.=2x-20 D.=x+2
[解析] 由回归直线方程=x+的定义知,=2,
∵回归直线过样本点的中心,∴12=2×4+,
∴=4,∴回归直线方程为=2x+4.
8.以下关于线性回归的判断,正确的个数是( D )
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;
③已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69;
④回归直线方程的意义是它反映了样本整体的变化趋势.
A.0 B.1
C.2 D.3
[解析] 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线=bx+才是回归直线,
∴①不对;②正确;
将x=25代入=0.50x-0.81,得=11.69,
∴③正确;④正确,故选D.
9.某人对一地区人均工资x(千元)与该地区人均消费Y(千元)进行统计调查,Y与x有相关关系,得到回归直线方程=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为( D )
A.66% B.72%
C.67% D.83%
[解析] 该题考查线性回归的实际应用,由条件知,消费水平为7.675千元时,人均工资为
≈9.262(千元).
故≈83%.
10.某化工厂为预测某产品的回收率Y,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观察值,计算得i=52,i=228,=478,iyi=1 849,则y与x的回归方程是( A )
A.=11.47+2.62x B.=-11.47+2.62x
C.=2.62+11.47x D.=11.47-2.62x
[解析] 据已知=
=≈2.62.
=-=11.47.故选A.
11.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是( A )
模型
模型1
模型2
模型3
模型4
相关系数r
0.98
0.80
0.50
0.25
A.模型1 B.模型2
C.模型3 D.模型4
[解析] 线性回归分析中,相关系数为r,
|r|越接近于1,相关程度越大;
|r|越小,相关程度越小,
∵模型1的相关系数r最大,∴模拟效果最好,
故选A.
12.下面是某市场农产品的调查表.
市场供应量表:
单价(元/千克)
2
2.4
2.8
3.2
3.6
4
供应量(1 000千克)
50
60
70
75
80
90
市场需求量表:
单价(元/千克)
4
3.4
2.9
2.6
2.3
2
供应量(1 000千克)
50
60
70
75
80
90
根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间( C )
A.(2.3,2.6) B.(2.4,2.6)
C.(2.6,2.8) D.(2.8,2.9)
[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.已知一个回归直线方程为=1.5x+45,x∈{1,7,5,13,19},则=__58.5__.
[解析] 因为=(1+7+5+13+19)=9,且=1.5+45,所以=1.5×9+45=58.5.
本题易错之处是根据x的值及=1.5x+45求出y的值再求,由=1.5x+45求得的y值不是原始数据,故错误.
14.给出下列命题:
①样本方差反映了所有样本数据与样本平均值的偏离程度;
②若随机变量X~N(0.43,0.182),则此正态曲线在x=0.43处达到峰值;
③在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;
④市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了3 000人.经过计算得K2=6.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.
P(K2≥k0)
…
0.25
0.15
0.10
0.025
0.010
0.005
0.001
k0
…
1.323
2.072
2.706
5.024
6.635
7.879
10.828
其中正确的命题是__①②④__.
[解析] 根据样本方差的概念、正态分布的概念可知①②均正确;在回归分布中,残差的平方和越小,说明模型的拟合效果越好,即X与Y有很强的关系,所以③不正确;通过表中的数据和K2=6.023>5.024可知,可以认为有97.5%以上的把握认为市民收入与旅游欲望有关系,因此④正确.
15.在2019年春节期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为__=-3.2x+40__.
[解析] iyi=392,=10,=8,(xi-)2=2.5,代入公式,得=-3.2,所以,=-=40,故回归直线方程为=-3.2x+40.
16.某市居民2015~2019年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2015
2016
2017
2018
2019
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭平均收入的中位数是__13__,家庭年平均收入与年平均支出有__正__线性相关关系.
[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.(本题满分12分)(2019·洛阳市高二检测)以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系的一组样本数据:
销售经验x(年)
1
3
4
6
10
12
年销售额y(万元)
8
9.5
9
10.5
11
12
(1)根据最小二乘法求出y关于x的线性回归方程;
(2)试预测销售经验为8年时的年销售额约为多少万元(精确到十分位)?
[解析] (1)由散点图(图略)知y与x呈线性相关关系,由表中数据计算得,=6,=10,=,=,
回归直线方程:=x+.
(2)x=8时,预测年销售额为×8+≈10.7万元.
18.(本题满分10分)(2019·青岛高二检测)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷
体育迷
合计
男
女
合计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:K2=
P(K2≥k0)
0.05
0.01
k0
3.841
6.635
[解析] (1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下:
非体育迷
体育迷
合计
男
30
15
45
女
45
10
55
合计
75
25
100
将2×2列联表中的数据代入公式计算,得
K2=
==≈3.030.
因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为
Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}
其中ai表示男性,i=1,2,3,bj表示女性,j=1,2.
Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.
用A表示“任选2人中,至少有1人是女性”这一事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},
事件A由7个基本事件组成,因而P(A)=.
19.(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:
产量x(千件)
生产费用(千元)
40
150
42
140
48
160
55
170
65
150
79
162
88
185
100
165
120
190
140
185
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行检验;
(3)设回归方程为=x+,求回归系数.
[解析] (1)根据数据可得:
=77.7,=165.7,x=70 903,y=277 119,
xiyi=132 938,所以r≈0.808,
即x与y之间的相关系数r≈0.808;
(2)因为r>0.75,所以可认为x与y之间具有线性相关关系;
(3)=0.398,=134.8.
20.(本题满分12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别是否需要志愿者
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
附:
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
χ2=
[解析] (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%.
(2)χ2=≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.
21.(本题满分12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1-7分别对应年份2008-2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:参考数据:i=9.32,iyi=40.17,=0.55,≈2.646.
参考公式:相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=- .
[解析] (1)由折线图中数据和附注中参考数据得
=4, (ti-)2=28,=0.55,
(ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(Ⅰ)得==≈0.103
=- ≈1.331-0.103×4≈0.92.
所以,y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
22.(本题满分12分)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1 000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查.根据问卷取得了这n名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组①[0,30),②[30,60),③[60,90),④[90,120),⑤[120,150),⑥[150,180),⑦[180,210),⑧[210,240],得到频率分布直方图如图.已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人.
(1)求n的值并补全频率分布直方图;
(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列2×2列联表:
利用时间充分
利用时间不充分
总计
走读生
住宿生
10
总计
据此资料,你是否认为学生“利用时间是否充分”与走读、住宿有关?
(3)若在第①组、第②组、第⑧组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X,求X的分布列及期望.
参考公式:K2=
[解析] (1)设第i组的频率为Pi(i=1,2,…,8),由图可知:P1=×30=, P2=×30=
∴学习时间少于60分钟的频率为P1+P2=
由题意:n×=5,∴n=100.
又P3=×30=, P5=×30=,P6=×30=,P7=×30=, P8=×30=,
∴P4=1-(P1+P2+P3+P5+P6+P7+P8)=.
∴第④组的高度为:h=×=
频率分布直方图如图:
(注:未标明高度1/250扣1分)
(2)由频率分布直方图可知,在抽取的100人中,
“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,
从而走读生中利用时间不充分的有25-10=15人,利用时间充分的有45-15=30人,由此可得2×2列联表如下:
利用时间充分
利用时间不充分
总计
走读生
30
15
45
住宿生
45
10
55
总计
75
25
100
将2×2列联表中的数据代入公式计算,得
K2=
==≈3.030
因为3.030<3.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关
(3)由(1)知:第①组2人,第②组3人,第⑧组5人,总计10人,则X的所有可能取值为0,1,2,3
P(X=i)=(i=0,1,2,3)
∴P(X=0)===,
P(X=1)===,
P(X=2)===,
P(X=3)===
∴X的分布列为:
X
0
1
2
3
P
∴E(X)=0×+1×+2×+3×==
(或由超几何分布的期望计算公式E(X)=n×=3×=)
课件62张PPT。第三章统计案例章末整合提升知 识 网 络专 题 突 破专题一 ?回归分析1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,也是本章的重点、高考的热点,主要考查线性回归分析.题型既有选择、填空题,也有解答题.
2.回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析.因此,回归分析的方法主要还是指线性回归分析的方法.要注意理解以下几点:①确定线性相关系数,判断变量是否线性相关的依据是观察样本点的散点图和线性回归系数的大小;②模型的合理性的刻画,确定线性相关程度的方法是通过计算相关系数r进行判断.典例 1[解析] (1)根据表中所给的5对数据,在平面直角坐标系中画出散点图,如图所示.『规律方法』 解决本题的关键是利用最小二乘估计求出的值,利用线性回归方程求销售额.典例 2[思路分析] 对两变量进行相关性检验,首先利用公式求出r,然后比较|r|与0.75的大小关系,明确线性相关关系的强弱,确定回归模型,求出回归方程,再根据父亲的身高预报儿子的身高.『规律方法』 利用相关系数r判断两变量相关关系的强弱,要注意运算的准确性,然后将|r|与0.75比较,如果|r|>0.75,那么说明两变量之间有很强的线性相关关系.专题二 ?独立性检验 十八届五中全会公报指出:努力促进人口均衡发展,坚持计划生育的基本国策,完善人口发展战略,全面实施一对夫妇可生育两个孩子的政策,提高生殖健康、妇幼保键、托幼等公共服务水平.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了100位30到40岁的公务员,得到情况如下表:典例 3
北京某高中举办了一次“喜迎六中全会”的读书读报知识竞赛,参赛选手为从高一年级和高二年级随机抽取的各100名学生.图1和图2分别是高一年级和高二年级参赛选手成绩的频率分布直方图.典例 4(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;
(2)若称成绩在68分以上的学生知识渊博,试以上述数据估计该高一、高二两个年级学生的知识渊博率;
(3)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.010的前下,认为高一、高二两个年级学生这次读书读报知识竞赛成绩有差异.[思路分析] (1)利用均值公式求平均成绩;(2)先利用频率分布直方图求出高一、高二两个年级学生成绩在68分以上的学生所占的频率;(3)完善2×2列联表,代入K2公式求解.[解析] (1)高一年级参赛学生的平均成绩为(45×0.04+55×0.04+65×0.01+75×0.01)×10=54(分),
高二年级参赛学生的平均成绩为(45×0.015+55×0.025+65×0.035+75×0.025)×10=62(分).『规律方法』 正确利用概率分布直方图与平均数等,求出高一、高二年级各个分数的学生数是利用K公式求得k并进行估计的前提条件.专题三 ?数形结合思想数形结合思想是一种非常重要的思想方法,就是把“数”与“形”有机地结合起来,充分应用“形”的直观性、“数”的严密性与准确性,使抽象问题直观化、复杂问题简单化,从而使问题得到解决.在回归分析问题中,利用散点图可以判断所考察的两个变量之间是否具有线性相关性.典例 5[思路分析] 本题考查回归分析,先依据表中数据,设x轴表示年龄,y轴表示脂肪含量,依据表中数据画出散点图,从而判断两个变量是否具有相关关系,用两个模型的方程分别求出对应的预测值,再计算R2比较拟合效果.[解析] (1)以年龄为x轴,脂肪含量为y轴,可得相应的散点图,如图所示.由散点图可知两者之间具有相关关系.『规律方法』 本题由散点图判断两个变量之间具有相关关系,由数到形,由形到数,利用数形的辩证统一找到解题途径.专题四 ?转化与化归思想在回归分析过程中,由于两个变量间的关系并非是线性关系,也可能是二次函数形、指数函数型、对数函数等其中的一种,对于前者我们可以借助于线性回归模型y=bx+a+e来处理;对于后者在解答过程中,我们常利用变量间的转换,把非线性回归问题转化成线性回归问题,最终用线性回归方程进行研究.典例 6[解析] 作散点图如图所示.『规律方法』 从散点图中观察样本点的分布情况,确定它们在何种函数图像附近,将两变量关系转化为线性关系求解.B 2.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X和Y有关系”的可信度,如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为 ( )
A.25% B.75%
C.2.5% D.97.5%
[解析] 查表可得K2>5.024.因此有97.5%的把握认为“x和y有关系”.D B 4.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是 ( )
D
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
[解析] 考查正、负相关及对柱形图的理解.
由柱形图得,从2006年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关,故选D.
二、填空题
5.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据试求K2的观测值为__________.10.76 68 21.25 9.某保健药品推销商为推销其药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对防治A疾病是否有效.[解析] (1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.