人教A版数学选修2-3 第三章统计案例 学业质量标准检测(课件57张PPT+练习)

文档属性

名称 人教A版数学选修2-3 第三章统计案例 学业质量标准检测(课件57张PPT+练习)
格式 zip
文件大小 2.9MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-11-15 15:35:31

文档简介

第三章 学业质量标准检测
时间120分钟,满分150分.
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)
1.下列不具有相关关系的是( D )
A.瑞雪兆丰年      B.名师出高徒
C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧
[解析] 喜鹊叫喜,乌鸦叫丧是一种迷信说法,无任何关系.
2.(2018·四川模拟)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:
根据图中的信息,下列结论中不正确的是( D )
A.样本中的男生数量多于女生数量
B.样本中喜欢手机支付的数量多于现金支付的数量
C.样本中多数男生喜欢手机支付
D.样本中多数女生喜欢现金支付
[解析] 由左图知,样本中的男生数量多于女生数量,A正确;
由右图知样本中喜欢手机支付的数量多于现金支付的数量,B正确;
由右图知,样本中多数男生喜欢手机支付,C正确;
由右图知样本中女生喜欢现金支付人数比手机支付人数少,D错误.
故选D.
3.(2019·唐山高二检测)四名同学根据各自的样本数据研究变量x、y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
② y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( D )
A.①②  B.②③ 
C.③④  D.①④
[解析] y与x正(或负)相关时,线性回归直线方程y=x+中,x的系数>0(或<0),故①④错.
4.(2019·福州高二检测)在一次试验中,当变量x取值分别是1,,,时,变量Y的值依次是2,3,4,5,则Y与之间的回归曲线方程是( A )
A.=+1 B.=+3
C.=2x+1 D.=x-1
[解析] 把x=1,,,代入四个选项,逐一验证可得=+1.
5.对变量x、y观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断:( C )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
[解析] 本题主要考查了变量的相关知识.
用散点图可以判断变量x与y负相关,u与v正相关.
6.为了解疾病A是否与性别有关,在一医院随机地对入院的50人进行了问卷调查得到了如下的列联表:
患疾病A
不患疾病A
总计

20
5
25

10
15
25
总计
30
20
50
请计算出统计量K2,你有多大的把握认为疾病A与性别有关( C )
下面的临界值表供参考:
P(K2≥k)
0.05
0.010
0.005
0.001
k
3.841
6.635
7.879
10.828
A.95% B.99%
C.99.5% D.99.9%
[解析] 由公式得K2=
≈8.333>7.879,
故有1-0.005=99.5%的把握认为疾病A与性别有关.
7.(2018·大连高二检测)已知回归直线的斜率的估计值是2,样本点的中心为(4,12),则回归直线的方程是( A )
A.=2x+4 B.=x+2
C.=2x-20 D.=x+2
[解析] 由回归直线方程=x+的定义知,=2,
∵回归直线过样本点的中心,∴12=2×4+,
∴=4,∴回归直线方程为=2x+4.
8.以下关于线性回归的判断,正确的个数是( D )
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;
③已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69;
④回归直线方程的意义是它反映了样本整体的变化趋势.
A.0 B.1
C.2 D.3
[解析] 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线=bx+才是回归直线,
∴①不对;②正确;
将x=25代入=0.50x-0.81,得=11.69,
∴③正确;④正确,故选D.
9.某人对一地区人均工资x(千元)与该地区人均消费Y(千元)进行统计调查,Y与x有相关关系,得到回归直线方程=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为( D )
A.66% B.72%
C.67% D.83%
[解析] 该题考查线性回归的实际应用,由条件知,消费水平为7.675千元时,人均工资为
≈9.262(千元).
故≈83%.
10.某化工厂为预测某产品的回收率Y,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观察值,计算得i=52,i=228,=478,iyi=1849,则y与x的回归方程是( A )
A.=11.47+2.62x B.=-11.47+2.62x
C.=2.62+11.47x D.=11.47-2.62x
[解析] 据已知=
=≈2.62.
=-=11.47.故选A.
11.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是( A )
模型
模型1
模型2
模型3
模型4
相关系数r
0.98
0.80
0.50
0.25
A.模型1 B.模型2
C.模型3 D.模型4
[解析] 线性回归分析中,相关系数为r,
|r|越接近于1,相关程度越大;
|r|越小,相关程度越小,
∵模型1的相关系数r最大,∴模拟效果最好,
故选A.
12.下面是某市场农产品的调查表.
市场供应量表:
单价(元/千克)
2
2.4
2.8
3.2
3.6
4
供应量(1000千克)
50
60
70
75
80
90
市场需求量表:
单价(元/千克)
4
3.4
2.9
2.6
2.3
2
供应量(1000千克)
50
60
70
75
80
90
根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间( C )
A.(2.3,2.6) B.(2.4,2.6)
C.(2.6,2.8) D.(2.8,2.9)
[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.已知一个回归直线方程为=1.5x+45,x∈{1,7,5,13,19},则=__58.5__.
[解析] 因为=(1+7+5+13+19)=9,且=1.5+45,所以=1.5×9+45=58.5.
本题易错之处是根据x的值及=1.5x+45求出y的值再求,由=1.5x+45求得的y值不是原始数据,故错误.
14.许多因素都会影响贫穷,教育也许是其中之一.在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的线性回归方程为=0.8x+4.6,斜率的估计值为0.8.说明__美国一个地区的成年人受过9年或更少教育的百分比增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比增加0.8%左右__.
15.给出下列命题:
①样本方差反映了所有样本数据与样本平均值的偏离程度;
②若随机变量X~N(0.43,0.182),则此正态曲线在x=0.43处达到峰值;
③在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;
④市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了3000人.经过计算得K2=6.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.
P(K2≥k0)

0.25
0.15
0.10
0.025
0.010
0.005
0.001
k0

1.323
2.072
2.706
5.024
6.635
7.879
10.828
其中正确的命题是__①②④__.
[解析] 根据样本方差的概念、正态分布的概念可知①②均正确;在回归分析中,残差的平方和越小,说明模型的拟合效果越好,即X与Y有很强的关系,所以③不正确;通过表中的数据和K2=6.023>5.024可知,可以认为有97.5%以上的把握认为市民收入与旅游欲望有关系,因此④正确.
16.某市居民2015~2019年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2015
2016
2017
2018
2019
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭平均收入的中位数是__13__,家庭年平均收入与年平均支出有__正__线性相关关系.
[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.(本题满分12分)(2019·洛阳市高二检测)以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系的一组样本数据:
销售经验x(年)
1
3
4
6
10
12
年销售额y(万元)
8
9.5
9
10.5
11
12
(1)根据最小二乘法求出y关于x的线性回归方程;
(2)试预测销售经验为8年时的年销售额约为多少万元(精确到十分位)?
[解析] (1)由散点图(图略)知y与x呈线性相关关系,由表中数据计算得,=6,=10,=,=,
回归直线方程:=x+.
(2)x=8时,预测年销售额为×8+≈10.7万元.
18.(本题满分10分)(2019·青岛高二检测)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷
体育迷
合计


合计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:K2=
P(K2≥k0)
0.05
0.01
k0
3.841
6.635
[解析] (1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下:
非体育迷
体育迷
合计

30
15
45

45
10
55
合计
75
25
100
将2×2列联表中的数据代入公式计算,得
K2=
==≈3.030.
因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为
Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}
其中ai表示男性,i=1,2,3,bj表示女性,j=1,2.
Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.
用A表示“任选2人中,至少有1人是女性”这一事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},
事件A由7个基本事件组成,因而P(A)=.
19.(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:
产量x(千件)
生产费用(千元)
40
150
42
140
48
160
55
170
65
150
79
162
88
185
100
165
120
190
140
185
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行检验;
(3)设回归方程为=x+,求回归系数.
[解析] (1)根据数据可得:
=77.7,=165.7,x=70903,y=277119,
xiyi=132938,所以r=0.808,
即x与y之间的相关系数r≈0.808;
(2)因为r>0.75,所以可认为x与y之间具有线性相关关系;
(3)=0.398,=134.8.
20.(本题满分12分)为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:
患病
未患病
总计
没服用药
20
30
50
服用药
x
y
50
总计
M
N
100
设从没服用药物的动物中任取2只,未患病数为ξ;从服用药物的动物中任取2只,未患病数为η,工作人员曾计算过P(ξ=0)=P(η=0).
(1)求出列联表中数据x、y、M、N的值;
(2)求ξ与η的均值(期望)并比较大小,请解释所得结论的实际含义;
(3)能够以99%的把握认为药物有效吗?
参考公式:K2=.
①当K2≥3.841时有95%的把握认为ξ、η有关联;
②当K2≥6.635时有99%的把握认为ξ、η有关联.
[解析] (1)∵P(ξ=0)=,P(η=0)=,
∴=×,∴x=10.
∴y=40,∴M=30,N=70.
(2)ξ取值为0、1、2.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==.
ξ
0
1
2
P
∴E(ξ)=.
P(η=0)==.
P(η=1)==.
P(η=2)==.
η
0
1
2
P
∴E(η)=.
∴E(ξ)(3)∵K2=≈4.76.
∵4.76<6.635,∴不能够以99%的把握认为药物有效.
21.(本题满分12分)(2019·安徽芜湖一中检测)测得某地10对父子的身高(单位:英寸)如下:
父亲
身高x
60
62
64
65
66
67
68
70
72
74
儿子
身高y
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,求线性回归方程;
(3)如果父亲的身高为73英寸,估计儿子的身高为多少.
[解析] (1)根据题意,得=66.8,=67.01,
=44794,=44941.93,iyi=44842.4,
所以r=

≈0.9804.
∵|r|≈0.9804>0.75,
∴y与x之间具有很强的线性相关关系.
(2)由(1)可得=
=≈0.4646,
=-=67.01-0.4646×66.8≈35.97,
故所求的线性回归方程为=0.4646x+35.97.
(3)当x=73时,=0.4646×73+35.97≈69.9(英寸),
所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.
22.(本题满分12分)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查.根据问卷取得了这n名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组①[0,30),②[30,60),③[60,90),④[90,120),⑤[120,150),⑥[150,180),⑦[180,210),⑧[210,240],得到频率分布直方图如图.已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人.
(1)求n的值并补全频率分布直方图;
(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列2×2列联表:
利用时间充分
利用时间不充分
总计
走读生
住宿生
10
总计
据此资料,你是否认为学生“利用时间是否充分”与走读、住宿有关?
(3)若在第①组、第②组、第⑧组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X,求X的分布列及期望.
参考公式:K2=
[解析] (1)设第i组的频率为Pi(i=1,2,…,8),由图可知:P1=×30=, P2=×30=
∴学习时间少于60分钟的频率为P1+P2=
由题意:n×=5,∴n=100.
又P3=×30=,
P5=×30=,
P6=×30=,
P7=×30=,
P8=×30=,
∴P4=1-(P1+P2+P3+P5+P6+P7+P8)=.
∴第④组的高度为:h=×=
频率分布直方图如图:
(2)由频率分布直方图可知,在抽取的100人中,
“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,
从而走读生中利用时间不充分的有25-10=15人,利用时间充分的有45-15=30人,由此可得2×2列联表如下:
利用时间充分
利用时间不充分
总计
走读生
30
15
45
住宿生
45
10
55
总计
75
25
100
将2×2列联表中的数据代入公式计算,得
K2=
==≈3.030
因为3.030<3.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关
(3)由(1)知:第①组2人,第②组3人,第⑧组5人,总计10人,则X的所有可能取值为0,1,2,3
P(X=i)=(i=0,1,2,3)
∴P(X=0)===,
P(X=1)===,
P(X=2)===,
P(X=3)===
∴X的分布列为:
X
0
1
2
3
P
∴E(X)=0×+1×+2×+3×==
(或由超几何分布的期望计算公式E(X)=n×=3×=)
课件57张PPT。第三章统计案例章末整合提升知 识 网 络专 题 突 破专题一 ?线性回归分析对所抽取的样本的数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.回归分析的过程就是建立回归模型的过程.具体步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画出散点图,观察它们是线性相关的,还是符合哪一种函数模型;③由经验确定回归方程的类型(如线性回归方程,反比例函数模型,指数函数模型,对数函数模型等);④用最小二乘法求回归方程的参数;⑤检查回归模型的拟合程度,如分析残差图,求相关指数R2等.典例 1[分析] 作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄.
(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出回归效果很好.
由残差图也可观察到,第2、5、9、10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.专题二 ?独立性检验典例 2     (2019·安徽涡阳四中月考)北京某高中举办了一次“喜迎六中全会”的读书读报知识竞赛,参赛选手为从高一年级和高二年级随机抽取的各100名学生.图1和图2分别是高一年级和高二年级参赛选手成绩的频率分布直方图.典例 3(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;
(2)若称成绩在68分以上的学生知识渊博,试以上述数据估计该高一、高二两个年级学生的知识渊博率;
(3)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.010的前下,认为高一、高二两个年级学生这次读书读报知识竞赛成绩有差异.[分析] (1)利用均值公式求平均成绩;(2)先利用频率分布直方图求出高一、高二两个年级学生成绩在68分以上的学生所占的频率;(3)完善2×2列联表,代入K2公式求解.[解析] (1)高一年级参赛学生的平均成绩为(45×0.04+55×0.04+65×0.01+75×0.01)×10=54(分),
高二年级参赛学生的平均成绩为(45×0.015+55×0.025+65×0.035+75×0.025)×10=62(分).『规律方法』 正确利用概率分布直方图与平均数等,求出高一、高二年级各个分数的学生数是利用K2公式求得k并进行估计的前提条件.专题三 ?数形结合思想数形结合思想是一种非常重要的思想方法,就是把“数”与“形”有机地结合起来,充分应用“形”的直观性、“数”的严密性与准确性,使抽象问题直观化、复杂问题简单化,从而使问题得到解决.在回归分析问题中,利用散点图可以判断所考察的两个变量之间是否具有线性相关性.典例 4[分析] 本题考查回归分析,先依据表中数据,设x轴表示年龄,y轴表示脂肪含量,依据表中数据画出散点图,从而判断两个变量是否具有相关关系,用两个模型的方程分别求出对应的预测值,再计算R2比较拟合效果.[解析] (1)以年龄为x轴,脂肪含量为y轴,可得相应的散点图,如图所示.由散点图可知两者之间具有相关关系.『规律方法』 本题由散点图判断两个变量之间具有相关关系,由数到形,由形到数,利用数形的辩证统一找到解题途径.专题四 ?转化与化归思想在回归分析过程中,由于两个变量间的关系并非是线性关系,也可能是二次函数形、指数函数型、对数函数等其中的一种,对于前者我们可以借助于线性回归模型y=bx+a+e来处理;对于后者在解答过程中,我们常利用变量间的转换,把非线性回归问题转化成线性回归问题,最终用线性回归方程进行研究.典例 5『规律方法』 从散点图中观察样本点的分布情况,确定它们在何种函数图象附近,将两变量关系转化为线性关系求解.B D [解析] 查表可得K2>5.024.因此有97.5%的把握认为“x和y有关系”.B 4.根据下面给出的2009年至2018年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是 (  )D 
A.逐年比较,2013年减少二氧化硫排放量的效果最显著
B.2012年我国治理二氧化硫排放显现成效
C.2011年以来我国二氧化硫年排放量呈减少趋势
D.2011年以来我国二氧化硫年排放量与年份正相关
[解析] 考查正、负相关及对柱形图的理解.
由柱形图得,从2011年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关,故选D.10.76 5 3.8 9.某保健药品推销商为推销其药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对防治A疾病是否有效.