知识整合与阶段检测
[对应学生用书P48]
1.一种重要图形
散点图是进行线性回归分析的主要手段,其作用如下:
一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;
二是判断样本中是否存在异常.
2.一个重要方程
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其线性回归直线方程为=x+.
其中=,=-.
3.两个重要参数
(1)相关系数r:
相关系数r是用来判断两个变量之间是否有线性相关关系的.|r|≤1,且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
(2)χ2统计量:
χ2是用来判断两个事件在多大程度上有关的变量,独立性检验即计算χ2的值,并与两个临界值3.841与6.635进行比较,从而得到两个事件在多大程度上有关.
(时间90分钟,满分120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题所给的四个选项中,只有一项是符合题目要求的.)
1.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )
A.函数关系 B.线性关系
C.相关关系 D.回归关系
解析:由相关关系的概念可知C正确.
答案:C
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归直线方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求回归直线方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,则下列操作顺序正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:由对两个变量进行回归分析的步骤,知选D.
答案:D
3.(湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79 kg,故D不正确.
答案:D
4.(湖北高考)根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=bx+a,则( )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析:由表中数据画出散点图,如图,
由散点图可知b<0,a>0,选B.
答案:B
5.在一个2×2列联表中,由其数据计算χ2=7.097,则判断这两个变量间有关系的概率大约为( )
A.1% B.5%
C.99% D.95%
解析:因为χ2>6.635,所以概率约为99%.
答案:C
6.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为2×2列联表.
高度辐射
轻微辐射
合计
身体健康
30
A
50
身体不健康
B
10
60
合计
C
D
E
则A,B,C,D的值依次为( )
A.20,80,30,50 B.20,50,80,30
C.20,50,80,110 D.20,80,110,50
解析:A=50-30=20,B=60-10=50,C=30+B=80,D=A+10=30.
答案:B
7.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
年龄/岁
3
4
5
6
7
8
9
身高/cm
94.8
104.2
108.7
117.8
124.3
130.8
139.0
A.身高一定在145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm左右
D.身高在145.83 cm以下
解析:将x=10代入得=145.83,但这种预测不一定准确,应该在这个值的左右.
答案:C
8.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,各自选取10组数据,并用回归分析方法分析求得相关系数r如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则哪位同学的试验结果体现A、B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
解析:丁同学所得相关系数r=0.85最接近1,所以A,B两变量线性相关性更强.
答案:D
9.在一次试验中,当变量 x 的取值分别为1,,,时,变量 y 的值分别为2,3,4,5,则 y 与x的回归曲线方程为( )
A.=+1 B.=+3
C.=2x+1 D.=x-1
解析:由数据可得,四个点都在曲线=+1上.
答案:A
10.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:
学位
性别
硕士
博士
合计
男
162
27
189
女
143
8
151
合计
305
35
340
根据以上数据,则( )
A.性别与获取学位类别有关
B.性别与获取学位类别无关
C.性别决定获取学位的类别
D.以上都是错误的
解析:由列联表可得χ2=≈7.34>6.635,所以有99%的把握认为性别与获取学位的类别有关.
答案:A
二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
11.若回归直线方程为=0.5x-0.81,则x=25时,y的估计值为________.
解析:将x=25代入=0.5x-0.81,
得=0.5×25-0.81=11.69.
答案:11.69
12.如果统计量χ2=3.854,则有________的把握认为两件事件有关.
解析:χ2=3.854>3.841,故有95%的把握认为两件事有关.
答案:95%
13.(广东高考)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.
解析:设父亲身高为x cm,儿子身高为y cm,则
x
173
170
176
y
170
176
182
=173,=176,
==1,
=-=176-1×173=3,
∴=x+3,当x=182时,=185.
答案:185
14.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和及格统计人数后,得到如下列联表:
班级与成绩列联表
优秀
及格
合计
甲班
11
34
45
乙班
8
37
45
合计
19
71
90
则χ2=________.(精确到0.001)
解析:由列联表得
则χ2=≈0.600.
答案:0.600
三、解答题(本大题共4小题,共50分.解答应写出必要的文字说明、证明过程或演算步骤)
15.(本小题满分12分)针对某工厂某产品产量与单位成本的资料进行线性回归分析:
月份
产量(千件)x
单位成本(元/件)y
x2
xy
1
2
73
4
146
2
3
72
9
216
3
4
71
16
284
4
3
73
9
219
5
4
69
16
276
6
5
68
25
340
合计
21
426
79
1 481
求产量每增加1 000件,单位成本平均下降多少元?
解:设回归直线方程为=x+,
=,==71,x=79,xiyi=1 481,
代入公式,==≈-1.818 2,
=71-(-1.818 2)×≈77.36,
故回归直线方程为y=77.36-1.818 2x.
由于回归系数为-1.818 2,由回归系数的意义可知:产量每增加1 000件,单位成本下降1.818 2元.
16.(本小题满分12分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.
若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人?
解:设男生人数为x,依题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
总计
男生
x
女生
总计
x
x
若有95%的把握认为是否喜欢韩剧和性别有关,
则χ2>3.841,
由χ2==x>3.841,
解得x>10.24,
∵为整数,且>5,∴x≥36.
∴若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有36人.
17.(本小题满分12分)某中学生物研究性学习小组对春季昼夜温差大小与水稻发芽率之间的关系进行研究,记录了实验室4月10日至4月14日的每天昼夜温差与每天每50颗稻籽浸泡后的发芽数,得到如下资料:
日期
4月10日
4月11日
4月12日
4月13日
4月14日
温差x/℃
10
12
13
14
11
发芽数y/颗
11
13
14
16
12
根据表中的数据可知发芽数y(颗)与温差x(℃)呈线性相关,请求出发芽数y关于温差x的线性回归方程=x+.
解:因为=12,=13.2,=730,iyi=804,
所以=1.2,
于是=13.2-1.2×12=-1.2.
故所求线性回归方程为=1.2x-1.2.
18.(本小题满分14分)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
60分以下
61~70分
71~80分
81~90分
91~100分
甲班(人数)
3
6
11
18
12
乙班(人数)
4
8
13
15
10
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分别估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,并判断“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”是否有关系.
优秀人数
非优秀人数
合计
甲班
乙班
合计
解析:(1)由题意知,甲、乙两班均有学生50人,
甲班优秀人数为30人,优秀率为=60%,
乙班优秀人数为25人,优秀率为=50%,
所以甲、乙两班的优秀率分别为60%和50%.
(2)2×2列联表如下:
优秀人数
非优秀人数
合计
甲班
30
20
50
乙班
25
25
50
合计
55
45
100
由表中数据,可得
χ2==≈1.010<3.841,
所以没有理由说“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有关系.
课件6张PPT。知识整合与阶段检测核心要点归纳阶段质量检测第三章阶段质量检测见阶段质量检测(三)阶段质量检测(三) 统计案例
(时间:90分钟,满分120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题所给的四个选项中,只有一项是符合题目要求的.)
1.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )
A.函数关系 B.线性关系
C.相关关系 D.回归关系
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归直线方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求回归直线方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,则下列操作顺序正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
3.(湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
4.(湖北高考)根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=bx+a,则( )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
5.在一个2×2列联表中,由其数据计算χ2=7.097,则判断这两个变量间有关系的概率大约为( )
A.1% B.5%
C.99% D.95%
6.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为2×2列联表.
高度辐射
轻微辐射
合计
身体健康
30
A
50
身体不健康
B
10
60
合计
C
D
E
则A,B,C,D的值依次为( )
A.20,80,30,50 B.20,50,80,30
C.20,50,80,110 D.20,80,110,50
7.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
年龄/岁
3
4
5
6
7
8
9
身高/cm
94.8
104.2
108.7
117.8
124.3
130.8
139.0
A.身高一定在145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm左右
D.身高在145.83 cm以下
8.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,各自选取10组数据,并用回归分析方法分析求得相关系数r如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则哪位同学的试验结果体现A、B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
9.在一次试验中,当变量 x 的取值分别为1,,,时,变量 y 的值分别为2,3,4,5,则 y 与x的回归曲线方程为( )
A.=+1 B.=+3
C.=2x+1 D.=x-1
10.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:
学位
性别
硕士
博士
合计
男
162
27
189
女
143
8
151
合计
305
35
340
根据以上数据,则( )
A.性别与获取学位类别有关
B.性别与获取学位类别无关
C.性别决定获取学位的类别
D.以上都是错误的
二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
11.若回归直线方程为=0.5x-0.81,则x=25时,y的估计值为________.
12.如果统计量χ2=3.854,则有________的把握认为两件事件有关.
13.(广东高考)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.
14.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和及格统计人数后,得到如下列联表:
班级与成绩列联表
优秀
及格
合计
甲班
11
34
45
乙班
8
37
45
合计
19
71
90
则χ2=________.(精确到0.001)
三、解答题(本大题共4小题,共50分.解答应写出必要的文字说明、证明过程或演算步骤)
15.(本小题满分12分)针对某工厂某产品产量与单位成本的资料进行线性回归分析:
月份
产量(千件)x
单位成本(元/件)y
x2
xy
1
2
73
4
146
2
3
72
9
216
3
4
71
16
284
4
3
73
9
219
5
4
69
16
276
6
5
68
25
340
合计
21
426
79
1 481
求产量每增加1 000件,单位成本平均下降多少元?
16.(本小题满分12分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.
若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人?
17.(本小题满分12分)某中学生物研究性学习小组对春季昼夜温差大小与水稻发芽率之间的关系进行研究,记录了实验室4月10日至4月14日的每天昼夜温差与每天每50颗稻籽浸泡后的发芽数,得到如下资料:
日期
4月10日
4月11日
4月12日
4月13日
4月14日
温差x/℃
10
12
13
14
11
发芽数y/颗
11
13
14
16
12
根据表中的数据可知发芽数y(颗)与温差x(℃)呈线性相关,请求出发芽数y关于温差x的线性回归方程=x+.
18.(本小题满分14分)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
60分以下
61~70分
71~80分
81~90分
91~100分
甲班(人数)
3
6
11
18
12
乙班(人数)
4
8
13
15
10
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分别估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,并判断“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”是否有关系.
优秀人数
非优秀人数
合计
甲班
乙班
合计
答 案
1.选C 由相关关系的概念可知C正确.
2.选D 由对两个变量进行回归分析的步骤,知选D.
3.选D 当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79 kg,故D不正确.
4.选B 由表中数据画出散点图,如图,
由散点图可知b<0,a>0,选B.
5.选C 因为χ2>6.635,所以概率约为99%.
6.选B A=50-30=20,B=60-10=50,C=30+B=80,D=A+10=30.
7.选C 将x=10代入得=145.83,但这种预测不一定准确,应该在这个值的左右.
8.选D 丁同学所得相关系数r=0.85最接近1,所以A,B两变量线性相关性更强.
9.选A 由数据可得,四个点都在曲线=+1上.
10.选A 由列联表可得χ2=≈7.34>6.635,所以有99%的把握认为性别与获取学位的类别有关.
11.解析:将x=25代入=0.5x-0.81,
得=0.5×25-0.81=11.69.
答案:11.69
12.解析:χ2=3.854>3.841,故有95%的把握认为两件事有关.
答案:95%
13.解析:设父亲身高为x cm,儿子身高为y cm,则
x
173
170
176
y
170
176
182
=173,=176,
==1,
=-=176-1×173=3,
∴=x+3,当x=182时,=185.
答案:185
14.解析:由列联表得
则χ2=≈0.600.
答案:0.600
15.解:设回归直线方程为=x+,
=,==71,x=79,xiyi=1 481,
代入公式,==≈-1.818 2,
=71-(-1.818 2)×≈77.36,
故回归直线方程为y=77.36-1.818 2x.
由于回归系数为-1.818 2,由回归系数的意义可知:产量每增加1 000件,单位成本下降1.818 2元.
16.解:设男生人数为x,依题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
总计
男生
x
女生
总计
x
x
若有95%的把握认为是否喜欢韩剧和性别有关,
则χ2>3.841,
由χ2==x>3.841,
解得x>10.24,
∵为整数,且>5,∴x≥36.
∴若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有36人.
17.解:因为=12,=13.2,=730,iyi=804,
所以=1.2,
于是=13.2-1.2×12=-1.2.
故所求线性回归方程为=1.2x-1.2.
18.解析:(1)由题意知,甲、乙两班均有学生50人,
甲班优秀人数为30人,优秀率为=60%,
乙班优秀人数为25人,优秀率为=50%,
所以甲、乙两班的优秀率分别为60%和50%.
(2)2×2列联表如下:
优秀人数
非优秀人数
合计
甲班
30
20
50
乙班
25
25
50
合计
55
45
100
由表中数据,可得
χ2==≈1.010<3.841,
所以没有理由说“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有关系.