§1.1 独立性检验
学习目标 1.理解2×2列联表的意义,会依据列联表中数据判断两个变量是否独立.2.掌握统计量χ2的意义和独立性检验的基本思想.
知识点一 2×2列联表和统计量χ2
1.2×2列联表
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样数据:
Ⅱ
类1
类2
合计
Ⅰ
类A
n11
n12
n1+
类B
n21
n22
n2+
合计
n+1
n+2
n
上述表格称为2×2列联表.
2.统计量χ2
χ2=,其中n=n11+n12+n21+n22.
知识点二 独立性检验
独立性检验
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)作2×2列联表;
(2)根据2×2列联表计算χ2的值;
(3)查对临界值,作出判断.
1.事件A与B的独立性检验无关,即两个事件互不影响.( × )
2.χ2的大小是判断事件A与B是否相关的统计量.( √ )
3.列联表中的数据是两个分类变量的频数.( √ )
类型一 2×2列联表和χ2统计量
例1 为了解人们对于国家新颁布的“生育二孩放开”政策的热度,现在某市进行调查,随机抽调了50人,他们年龄的频数分布及支持“生育二孩放开”人数如下表:
年龄
[5,15)
[15,25)
[25,35)
[35,45)
[45,55)
[55,65)
频数
5
10
12
10
5
8
支持“生育二孩放开”
4
5
9
8
2
4
由以上统计数据填下面2×2列联表:
年龄不低于45岁的人数
年龄低于45岁的人数
合计
支持
a=
c=
不支持
b=
d=
合计
考点 分类变量与列联表
题点 求列联表中的数据
解 2×2列联表如下:
年龄不低于45岁的人数
年龄低于45岁的人数
合计
支持
a=6
c=26
32
不支持
b=7
d=11
18
合计
13
37
50
反思与感悟 准确理解给定信息,找准分类变量,然后依次填入相应空格内数据.
跟踪训练1 某校高二年级共有1 600名学生,其中男生960名,女生640名,该校组织了一次满分为100分的数学学业水平模拟考试.根据研究,在正式的学业水平考试中,本次成绩在[80,100)的学生可取得A等(优秀),在[60,80)的学生可取得B等(良好),在[40,60)的学生可取得C等(合格),不到40分的学生只能取得D等(不合格).为研究这次考试成绩优秀是否与性别有关,现按性别采用分层抽样的方法抽取100名学生,将他们的成绩按从低到高分成[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),七组加以统计,绘制成如图所示的频率分布直方图.
(1)估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数;
(2)请你根据已知条件将下列2×2列联表补充完整.
数学成绩优秀
数学成绩不优秀
合计
男生
a=12
b=
女生
c=
d=34
合计
n=100
考点 分类变量与列联表
题点 求列联表中的数据
解 (1)设抽取的100名学生中,本次考试成绩不合格的有x人,根据题意得x=100×[1-10×(0.006+0.012×2+0.018+0.024+0.026)]=2.
据此估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数为×1 600=32.
(2)根据已知条件得2×2列联表如下:
数学成绩优秀
数学成绩不优秀
合计
男生
a=12
b=48
60
女生
c=6
d=34
40
合计
18
82
100
例2 根据下表计算:
不看电视
看电视
男
37
85
女
35
143
则χ2≈________.(保留3位小数)
考点 定性分析的两类方法
题点 利用列联表定性分析
答案 4.514
解析 χ2=≈4.514.
反思与感悟 列联表中的数据信息与χ2统计量之间的关系要对应,其次,需对“卡方”公式的结构有清醒的认识.
跟踪训练2 已知列联表:
药物效果与动物试验列联表
患病
未患病
合计
服用药
10
45
55
未服药
20
30
50
合计
30
75
105
则χ2≈________.(结果保留3位小数)
考点 定性分析的两类方法
题点 利用列联表定性分析
答案 6.109
解析 χ2=≈6.109.
类型二 独立性检验
例3 某班主任对班级50名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的26人中,有20人认为作业多,6人认为作业不多;在不喜欢玩电脑游戏的24人中,有7人认为作业多,17人认为作业不多.
(1)根据以上数据建立一个2×2列联表;
(2)试问喜欢玩电脑游戏与认为作业多少是否有关系?
考点 独立性检验及其基本思想
题点 独立性检验的思想
解 (1)根据题中所给数据,得到如下列联表:
认为作业多
认为作业不多
合计
喜欢玩电脑游戏
20
6
26
不喜欢玩电脑游戏
7
17
24
合计
27
23
50
(2)由公式得χ2=≈11.458.
∵11.458>6.635,
∴有99%的把握认为喜欢玩电脑游戏与认为作业多少有关.
反思与感悟 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.
跟踪训练3 调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:
晕船
不晕船
合计
男人
12
25
37
女人
10
24
34
合计
22
49
71
根据此资料,你是否认为在2~3级风的海上航行中男人比女人更容易晕船?
考点 独立性检验及其基本思想
题点 独立性检验的思想
解 由公式得χ2=≈0.08.
因为χ2<3.841,所以我们没有理由认为男人比女人更容易晕船.
1.下面是一个2×2列联表:
y1
y2
合计
x1
a
21
73
x2
7
20
27
合计
b
41
则表中a,b处的值分别为( )
A.94,96 B.52,50
C.52,59 D.59,52
考点 分类变量与列联表
题点 求列联表中的数据
答案 C
解析 ∵a+21=73,∴a=52,b=a+7=52+7=59.
2.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:
心脏病
无心脏病
合计
秃发
20
300
320
不秃发
10
445
455
合计
30
745
775
根据表中数据得到χ2=≈8.290,因为χ2>6.635,则断定秃发与患心脏病有关系,那么这种判断出错的可能性为( )
A.0.1 B.0.05 C.0.025 D.0.01
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 D
解析 因为χ2>6.635,所以有99%的把握说秃发与患心脏病有关,故这种判断出错的可能性为1-0.99=0.01.
3.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这个人有99%的概率患有肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 D
解析 独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.
4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据包括________________________________________________________________________
________________________________________________________________________.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 女正教授人数、男正教授人数、女副教授人数、男副教授人数
5.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.
总成绩好
总成绩不好
合计
数学成绩好
478
a
490
数学成绩不好
399
24
423
合计
b
c
913
(1)计算a,b,c的值;
(2)文科学生总成绩不好与数学成绩不好有关系吗?
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 (1)由478+a=490,得a=12.
由a+24=c,得c=12+24=36.
由b+c=913,得b=913-36=877.
(2)根据表中数据计算得
χ2=≈6.233>3.841,
所以有95%的把握认为文科学生总成绩不好与数学成绩不好有关系.
1.利用χ2=求出χ2的值,再利用临界值的大小来判断假设是否成立.
2.解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.
一、选择题
1.在2×2列联表中,四个变量的取值n11,n12,n21,n22应是( )
A.任意实数 B.正整数
C.大于5的整数 D.非负整数
考点 分类变量与列联表
题点 求列联表中的数据
答案 C
2.如果有99%的把握认为“x与y有关系”,那么χ2满足( )
A.χ2>6.635 B.χ2≥5.024
C.χ2≥7.879 D.χ2>3.841
考点 独立性检验思想的应用
题点 独立性检验在分类变量中的应用
答案 A
3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D.以上三种说法都不正确
考点 独立性检验及其基本思想
题点 独立性检验的思想
答案 C
4.根据下面的列联表得到如下四个判断:
①有95%的把握认为“患肝病与嗜酒有关”;②有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.
嗜酒
不嗜酒
合计
患肝病
700
60
760
未患肝病
200
32
232
合计
900
92
992
其中正确命题的个数为( )
A.0 B.1 C.2 D.3
考点 分类变量与列联表
题点 求观测值
答案 C
解析 由列联表中数据可求得
χ2=≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即有99%的把握认为“患肝病与嗜酒有关系”.因此②③正确,故选C.
5.在2×2列联表中,两个分类变量有关系的可能性越大,相差越大的两个比值为( )
A.与 B.与
C.与 D.与
考点 分类变量与列联表
题点 求列联表中的数据
答案 A
解析 以表格为例,
B
合计
A
n11
n12
n1+
n21
n22
n2+
合计
n+1
n+2
n
事件B发生与A相关性越强,则两个频率与相差越大.
6.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:
优秀
及格
合计
甲班
11
34
45
乙班
8
37
45
合计
19
71
90
则统计量χ2约为( )
A.0.600 B.0.828 C.2.712 D.6.004
考点 分类变量与列联表
题点 求观测值
答案 A
解析 根据列联表中的数据,
可得χ2=≈0.600.故选A.
二、填空题
7.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________.(填序号)
①若统计量χ2=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 ③
解析 统计量χ2是支持确定有多大的把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.
8.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
合计
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
设H0:服用此药的效果与患者的性别无关,则统计量χ2≈________(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 4.882 5%
解析 由公式计算得统计量χ2≈4.882,
∵χ2>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性判断出错.
9.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:
不喜欢西班牙队
喜欢西班牙队
合计
高于40岁
p
q
50
不高于40岁
15
35
50
合计
a
b
100
若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为,则有________的把握认为年龄与西班牙队的被喜欢程度有关.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 95%
解析 设“从所有人中任意抽取一个,取到喜欢西班牙的人”为事件A,
由已知得P(A)==,
所以p=25,q=25,a=40,b=60.
χ2==≈4.167>3.841.
故有95%的把握认为年龄与西班牙队的被喜欢程度有关.
10.某高校“统计初步”课程的教师随机调查了一些学生,具体数据如下表所示,为了判断选修统计专业是否与性别有关系,根据表中数据,得到χ2=≈4.844,因为4.844>3.841.所以选修统计专业与性别有关系,那么这种判断出错的可能性为________.
没选统计专业
选统计专业
男
13
10
女
7
20
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 5%
三、解答题
11.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)判断性别与休闲方式是否有关系.
考点 定性分析的两类方法
题点 利用列联表定性分析
解 (1)列联表如下:
休闲方式
性别
看电视
运动
合计
女
43
27
70
男
21
33
54
合计
64
60
124
(2)χ2=≈6.201,
∵χ2>3.841,
∴有95%的把握认为性别与休闲方式有关.
四、探究与拓展
12.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:
死亡
存活
合计
第一种剂量
14
11
25
第二种剂量
6
19
25
合计
20
30
50
进行统计分析时的统计假设是________.
考点 独立性检验及其基本思想
题点 独立性检验
答案 小白鼠的死亡与剂量无关
解析 根据独立性检验的基本思想可知,类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与剂量无关”.
13.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为.
优秀
非优秀
合计
甲班
10
乙班
30
合计
110
(1)请完成上面的列联表;
(2)根据列联表的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;
P(χ2≥x0)
0.050
0.010
0.001
x0
3.841
6.635
10.828
(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到9号或10号的概率.
考点
题点
解 (1)由题意知,优秀的概率P=,故优秀人数为30,故2×2列联表如下:
优秀
非优秀
合计
甲班
10
50
60
乙班
20
30
50
合计
30
80
110
(2)根据列联表中的数据,得到
χ2=≈7.486<10.828.
因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.
(3)设“抽到9或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),所有的基本事件有(1,1),(1,2),(1, 3),…,(6,6),共36个.
事件A包含的基本事件有(3,6),(4,5),(5,4),(6,3),(5,5),(4,6),(6,4),共7个.
所以P(A)=,即抽到9号或10号的概率为.
§1.2 回归分析
学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.
知识点一 回归分析及回归直线方程
思考1 什么叫回归分析?
答案 回归分析是对具有相关关系的两个变量进行统计分析的一种方法.
思考2 回归分析中,利用回归直线方程求出的函数值一定是真实值吗?
答案 不一定是真实值,利用回归直线方程求的值,在很多时候是个预测值.
梳理 (1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.若两个变量之间具有线性相关关系,则称相应的回归分析为线性回归分析.
(2)回归直线方程为=x+ ,且=,=-,其中=i,=i,(,)称为样本点的中心,回归直线一定过样本点的中心.
知识点二 相关系数
1.对于变量x与Y随机抽到的n对数据(x1,y1),(x2,y2),…,(xn,yn),检验统计量是样本相关系数
r=
=.
2.相关系数r的取值范围是[-1,1],|r|越接近1,变量之间的线性相关程度越强;|r|越接近0,变量之间的线性相关程度越弱.当|r|>r0.05时,表明有95%的把握认为两个变量之间具有线性相关关系.
1.求回归直线方程前可以不进行相关性检验.( × )
2.利用回归直线方程求出的值是准确值.( × )
类型一 回归直线方程
例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据女大学生的身高预测体重的回归直线方程,并预测一名身高为172 cm的女大学生的体重.
考点 线性回归分析
题点 回归直线的应用
解 (1)画散点图
选取身高为自变量x,体重为因变量y,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.
由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线方程 = x+ 来近似刻画它们之间的关系.
(2)建立回归方程由计算器可得 =0.848, =-85.632.
于是得到回归直线方程为 =0.848x-85.632.
(3)预测和决策
当x=172时, =0.848×172-85.632=60.224(kg).
即一名身高为172 cm的女大学生的体重预测值为60.224 kg.
反思与感悟 在使用回归直线方程进行预测时要注意
(1)回归直线方程只适用于我们所研究的样本的总体.
(2)我们所建立的回归直线方程一般都有时间性.
(3)样本取值的范围会影响回归直线方程的适用范围.
(4)不能期望回归直线方程得到的预测值就是因变量的精确值.
跟踪训练1 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计数据:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
由此资料可知y对x呈线性相关关系.
(1)求回归直线方程;
(2)求使用年限为10年时,该设备的维修费用为多少?
考点 回归直线方程
题点 求回归直线方程
解 (1)由题干表中的数据可得
=4,=5,=90,iyi=112.3,
∴===1.23,
∴=-=5-1.23×4=0.08.
∴回归直线方程为=1.23x+0.08.
(2)当x=10时,=1.23×10+0.08=12.38.
即使用年限为10年时,该设备的维修费用约为12.38万元.
类型二 相关性检验
例2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:
甲醛浓度(g/L)
18
20
22
24
26
28
30
缩醛化度(克分子%)
26.86
28.35
28.75
28.87
29.75
30.00
30.36
(1)画散点图;
(2)求回归直线方程;
(3)求相关系数r,并进行相关性检验.
考点 线性相关系数
题点 线性相关系数的概念及计算
解 (1)散点图如图.
(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算 , .
i
xi
yi
x
xiyi
1
18
26.86
324
483.48
2
20
28.35
400
567
3
22
28.75
484
632.5
4
24
28.87
576
692.88
5
26
29.75
676
773.5
6
28
30.00
784
840
7
30
30.36
900
910.80
∑
168
202.94
4 144
4 900.16
==24,=,
==≈0.264 3,
=- =-0.264 3×24≈22.648,
∴回归直线方程为 =22.648+0.264 3x.
(3)y≈5 892,r=
=≈0.96.
∵r=0.96>r0.05=0.754.
∴有95%的把握认为“甲醛浓度与缩醛化度有线性相关关系”,求得的回归直线方程有意义.
反思与感悟 根据已知数据求得回归直线方程后,可以利用相关系数和临界值r0.05比较,进行相关性检验.
跟踪训练2 为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(y)的关系,某地区观察了2012年至2017年的情况,得到了下面的数据:
年份
2012
2013
2014
2015
2016
2017
x(℃)
24.4
29.6
32.9
28.7
30.3
28.9
y(日)
19
6
1
10
1
8
(1)对变量x,y进行相关性检验;
(2)据气象预测,该地区在2019年3月下旬平均气温为27℃,试估计2019年4月化蛹高峰日为哪天.
考点 线性相关系数
题点 线性相关系数的概念及计算
解 由已知条件可得下表:
i
1
2
3
4
5
6
xi
24.4
29.6
32.9
28.7
30.3
28.9
yi
19
6
1
10
1
8
≈29.13,=7.5,=5 130.92,=563,iyi=1 222.6
(1)r=≈-0.934 1.
查表知:r0.05=0.811.由|r|>r0.05可知,变量y和x存在线性相关关系.
(2)=≈-2.23,
=-≈72.46.
所以回归直线方程为=-2.23x+72.46.
当x=27时,=-2.23×27+72.46≈12.
据此,可估计该地区2019年4月12日为化蛹高峰日.
1.某商品销售量y(件)与销售价格x(元/件)呈负相关,则其回归直线方程可能是( )
A. =-10x+200
B. =10x+200
C. =-10x-200
D. =10x-200
考点 线性回归分析
题点 回归直线的应用
答案 A
解析 由于销售量y与销售价格x成负相关,故排除B,D.又当x=10时,A中y=100,而C中y=-300,C不符合题意,故选A.
2.下表是x和y之间的一组数据,则y关于x的回归直线必过( )
x
1
2
3
4
y
1
3
5
7
A.点(2,3) B.点(1.5,4)
C.点(2.5,4) D.点(2.5,5)
考点 回归直线方程
题点 样本点中心的应用
答案 C
解析 回归直线必过样本点中心(,),即(2.5,4).
3.对变量y和x进行相关性检验,已知n为数据的对数,r是相关系数,且已知①n=3,r=0.995 0;②n=7,r=0.953 3;③n=15,r=0.301 2;④n=17,r=0.499 1.则变量y和x具有线性相关关系的是( )
A.①和② B.①和③
C.②和④ D.③和④
考点 线性相关系数
题点 线性相关系数的应用
答案 C
解析 ①当n=3时,r0.05=0.997,所以|r|r0.05,表明有95%的把握认为x与y之间具有线性相关关系;③当n=15时,r0.05=0.514,所以|r|r0.05,表明有95%的把握认为x与y之间具有线性相关关系,所以②和④满足题意,故选C.
4.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:
x
16
17
18
19
y
50
34
41
31
由上表可得回归直线方程=x+中的=-5,据此模型预测当零售价为14.5元时,每天的销售量为( )
A.51个 B.50个 C.54个 D.48个
考点 线性回归分析
题点 回归直线方程的应用
答案 C
解析 由题意知=17.5,=39,代入回归直线方程得
=126.5,126.5-14.5×5=54,故选C.
5.已知x,y之间的一组数据如下表:
x
0
1
2
3
y
1
3
5
7
(1)分别计算:,,x1y1+x2y2+x3y3+x4y4,x+x+x+x;
(2)已知变量x与y线性相关,求出回归直线方程.
考点 回归直线方程
题点 求回归直线方程
解 (1)==1.5,==4,
x1y1+x2y2+x3y3+x4y4=0×1+1×3+2×5+3×7=34,
x+x+x+x=02+12+22+32=14.
(2)==2,
=- =4-2×1.5=1,
故回归直线方程为=2x+1.
1.对具有线性相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报.
2.通过求相关系数并和临界值r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.
一、选择题
1.根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归直线方程为=x+,则( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
考点 线性回归分析
题点 回归直线方程的应用
答案 B
解析 作出散点图如下:
观察图象可知,回归直线=x+的斜率<0,
当x=0时,=>0.故>0,<0.
2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
x(月份)
1
2
3
4
5
y(万盒)
5
5
6
6
8
若x,y线性相关,回归直线方程为=0.7x+,估计该制药厂6月份生产甲胶囊产量为( )
A.8.0万盒 B.8.1万盒 C.8.9万盒 D.8.6万盒
考点 回归直线方程
题点 样本点中心的应用
答案 B
解析 回归直线一定过样本点中心.由已知数据可得=3,=6,代入回归方程,可得=-0.7=3.9,即回归直线方程为=0.7x+3.9.把x=6代入,可近似得=8.1,故选B.
3.某化工厂为预测某产品的回收率y,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得i=52,i=228,=478,iyi=1 849,则y与x的回归直线方程是( )
A.=2.62x+11.47 B.=2.62x-11.47
C.=11.47x+2.62 D.=-2.62x+11.47
考点 回归直线方程
题点 求回归直线方程
答案 A
解析 由题中数据得=6.5,=28.5,
∴===≈2.62,
=-≈28.5-2.62×6.5=11.47,
∴y与x的回归直线方程是=2.62x+11.47,故选A.
4.给定x与y的一组样本数据,求得相关系数r=-0.690,则( )
A.y与x的线性相关性很强
B.y与x的相关性很强
C.y与x正相关
D.y与x负相关
考点 线性相关系数
题点 线性相关系数的应用
答案 D
解析 因为r<0,所以y与x负相关,又|r|∈[0.75,1]才表示y与x具有很强的线性相关性,所以选D.
5.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关试验,并用回归分析方法分别求得相关系数r如表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是( )
A.甲 B.乙 C.丙 D.丁
考点 线性相关系数
题点 线性相关系数的概念及计算
答案 D
解析 由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强,故选D.
6.每一吨铸铁成本yc(元)与铸件废品率x%建立的回归方程为yc=56+8x,那么下列说法正确的是( )
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
考点 回归直线方程
题点 回归直线方程的应用
答案 C
二、填空题
7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
考点 线性相关系数
题点 线性相关系数的概念及计算
答案 1
解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上时,相关系数为1.
8.已知一个回归直线方程为=1.5x+45,x∈{1,5,7,13,19},则=________.
考点 回归直线方程
题点 样本点中心的应用
答案 58.5
解析 ∵==9,且=1.5x+45,
∴=1.5×9+45=58.5.
9.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为 =0.79x-73.56,数据列表是:
身高x(cm)
155
161
a
167
174
体重y(kg)
49
53
56
58
64
则其中的数据a=________.
考点 回归直线方程
题点 样本点中心的性质
答案 163
解析 由表中数据计算=×(49+53+56+58+64)=56,
根据回归直线经过样本点中心(,),
可得56=0.79-73.56,解得=164.
由=×(155+161+a+167+174)=164,
解得a=163.
10.2018年3月1日,某地物价部门对该地的5家商场的某商品一天的销售量及其价格进行调查,5家商场该商品的售价x元和销售量y件之间的一组数据如表所示,由散点图可知,销售量y与价格x之间有较好的线性相关关系,其回归直线方程是 =-3.2x+ ,则 =________.
价格x(元)
9
9.5
10
10.5
11
销售量y(件)
11
10
8
6
5
考点 线性回归分析
题点 回归直线的应用
答案 40
解析 由题意,得==10,==8,
∵回归直线方程是=-3.2x+ ,∴8=-3.2×10+ ,∴ =40.
三、解答题
11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)求y关于x的回归直线方程=x+;
(2)试预测加工10个零件需要多少时间?
考点 回归直线方程
题点 求回归直线方程
解 (1)由表中数据得iyi=52.5,
=3.5,=3.5,=54,
所以==0.7,
所以=- =1.05.
所以=0.7x+1.05.
(2)将x=10代入回归直线方程,
得=0.7×10+1.05=8.05,
所以预测加工10个零件需要8.05小时.
12.已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
判断y与x是否具有线性相关关系?若有,求出其回归直线方程.
考点 回归直线方程
题点 求回归直线方程
解 作出散点图如图,可看出y与x具有线性相关关系.
=(14+16+18+20+22)=18,=(12+10+7+5+3)=7.4,
x=142+162+182+202+222=1 660,
xiyi=14×12+16×10+18×7+20×5+22×3=620,
所以===-1.15,
=7.4+1.15×18=28.1,
所以所求的回归直线方程是=-1.15x+28.1.
四、探究与拓展
13.如图是x和y的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关系数最大.
考点 线性相关系数
题点 线性相关系数的应用
答案 D(3,10)
解析 经计算,去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强.
14.为了分析某高三学生学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x、物理成绩y进行分析,下面是该生7次考试的成绩.(单位:分)
数学成绩x
88
83
117
92
108
100
112
物理成绩y
94
91
108
96
104
101
106
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的理由;
(2)已知该学生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.
考点 线性回归分析
题点 回归直线的应用
解 (1)=100+=100,
=100+=100,
s=142,s=,
因为s>s,所以他的物理成绩更稳定.
(2)由于x与y之间具有线性相关关系,
经计算得=0.5,=100-0.5×100=50.
所以回归直线方程为=0.5x+50.
当y=115时,x=130.
估计他的数学成绩是130分.
建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.
第一章 统计案例
章末复习
学习目标 1.理解独立性检验的基本思想及实施步骤.2.会求回归直线方程,并用回归直线进行预报.
1.2×2列联表
2×2列联表如表所示:
B
合计
A
n11
n12
n1+
n21
n22
n2+
合计
n+1
n+2
n
其中n+1=n11+n21,n+2=n12+n22,
n1+=n11+n12,n2+=n21+n22,
n=n11+n21+n12+n22.
2.最小二乘法
对于一组数据(xi,yi),i=1,2,…,n,如果它们线性相关,则回归直线方程为=x+,其中==,=- .
3.独立性检验
常用统计量
χ2=来检验两个变量是否有关系.
类型一 独立性检验
例1 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
6
女生
10
合计
48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的2×2列联表补充完整;(不用写计算过程)
(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由.
考点 独立性检验及其基本思想
题点 独立性检验的综合应用
解 (1)列联表补充如下:
喜爱打篮球
不喜爱打篮球
合计
男生
22
6
28
女生
10
10
20
合计
32
16
48
(2)由χ2=≈4.286.
因为4.286>3.841,所以能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关.
反思与感悟 通过公式χ2=
计算出χ2的值,再与临界值作比较,最后得出结论.
跟踪训练1 奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:
是否愿意提供
志愿者服务
性别
愿意
不愿意
男生
20
10
女生
10
20
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?
(2)你能否在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
P(χ2≥x0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
考点 独立性检验思想的应用
题点 独立性检验在分类变量中的应用
解 (1)由题意,可知男生抽取6×=4(人).
(2)χ2=≈6.667,由于6.667>6.635,所以能在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关.
类型二 线性回归分析
例2 某城市理论预测2010年到2014年人口总数与年份的关系如表所示:
年份201x(年)
0
1
2
3
4
人口数y(十万)
5
7
8
11
19
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,求出y关于x的回归直线方程=x+;
(3)据此估计2019年该城市人口总数.
考点 回归分析思想的应用
题点 回归分析思想的应用
解 (1)散点图如图:
(2)因为==2,
==10,
iyi=0×5+1×7+2×8+3×11+4×19=132,
=02+12+22+32+42=30,
所以==3.2,
=- =3.6.
所以回归直线方程为=3.2x+3.6.
(3)令x=9,则=3.2×9+3.6=32.4,
故估计2019年该城市人口总数为32.4(十万).
反思与感悟 解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.
(3)实际应用.依据求得的回归方程解决实际问题.
跟踪训练2 某运动员训练次数与运动成绩之间的数据关系如下:
次数x
30
33
35
37
39
44
46
50
成绩y
30
34
37
39
42
46
48
51
(1)作出散点图;
(2)求出回归直线方程;
(3)计算相关系数并进行相关性检验;
(4)试预测该运动员训练47次及55次的成绩.
解 (1)作出该运动员训练次数x与成绩y之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.
(2)列表计算:
次数xi
成绩yi
x
y
xiyi
30
30
900
900
900
33
34
1 089
1 156
1 122
35
37
1 225
1 369
1 295
37
39
1 369
1 521
1 443
39
42
1 521
1 764
1 638
44
46
1 936
2 116
2 024
46
48
2 116
2 304
2 208
50
51
2 500
2 601
2 550
由上表可求得=39.25,=40.875,x=12 656,
y=13 731,xiyi=13 180,
∴ =≈1.041 5, =- =-0.003 88,
∴回归直线方程为y=1.041 5x-0.003 88.
(3)计算相关系数r=0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系.
(4)由上述分析可知,我们可用回归直线方程y=1.041 5x-0.003 88作为该运动员成绩的预报值.
将x=47和x=55分别代入该方程可得y≈49和y≈57.故预测该运动员训练47次和55次的成绩分别为49和57.
1.从某地区老人中随机抽取500人,其生活能否自理的情况如下表所示,则( )
性别
人数
生活能否自理
男
女
能
178
278
不能
23
21
A.有95%的把握认为老人生活能否自理与性别有关
B.有99%的把握认为老人生活能否自理与性别有关
C.没有充分理由认为老人生活能否自理与性别有关
D.以上都不对
考点 独立性检验及其基本思想
题点 独立性检验的思想
答案 C
解析 经计算,得χ2=
≈2.925<3.841,
故我们没有充分的理由认为老人生活能否自理与性别有关.
2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y与父亲的身高x的回归直线方程=x+中,的值( )
A.在(-1,0)内 B.等于0
C.在(0,1)内 D.在[1,+∞)内
考点 线性回归分析
题点 回归直线方程的应用
答案 C
解析 子代平均身高向中心回归,应为正的真分数,故选C.
3.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③ C.③④ D.①④
考点 线性回归分析
题点 回归直线方程的应用
答案 D
解析 ①中,回归方程中x的系数为正,不是负相关;④中,回归方程中x的系数为负,不是正相关,所以①④一定不正确.
4.对于回归直线方程=x+,当x=3时,对应的y的估计值是17,当x=8时,对应的y的估计值是22,那么,该回归直线方程是________,根据回归直线方程判断当x=________时,y的估计值是38.
考点 线性回归分析
题点 回归直线方程的应用
答案 =x+14 24
解析 首先把两组值代入回归直线方程,得
解得
所以回归直线方程是=x+14.
令x+14=38,可得x=24,即当x=24时,y的估计值是38.
1.建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量.
(2)画出散点图,观察它们之间的关系.
(3)由经验确定回归方程的类型.
(4)按照一定的规则估计回归方程中的参数.
2.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.
一、选择题
1.当χ2>3.841时,认为事件A与事件B( )
A.有95%的把握有关
B.有99%的把握有关
C.没有理由说它们有关
D.不确定
答案 A
2.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是( )
x
4
5
6
7
8
9
10
y
14
18
19
20
23
25
28
A.线性函数模型 B.二次函数模型
C.指数函数模型 D.对数函数模型
考点 回归分析
题点 建立回归模型的基本步骤
答案 A
解析 画出散点图(图略)可以得到这些样本点在某一条直线上或在该直线附近,故最可能是线性函数模型.
3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其回归直线方程是=-0.7x+,则等于( )
A.10.5 B.5.15 C.5.2 D.5.25
考点 回归直线方程
题点 样本中心点的应用
答案 D
解析 样本点的中心为(2.5,3.5),将其代入回归直线方程可解得=5.25.
4.据统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系,对某小组每周用于数学学习时间x与数学成绩y进行数据收集如表:
x
15
16
18
19
22
y
102
98
115
115
120
由表中样本数据求回归直线方程=x+,则点(,)与直线x+18y=110的位置关系为( )
A.点在直线左侧 B.点在直线右侧
C.点在直线上 D.无法确定
考点 回归直线方程
题点 样本点中心的性质
答案 C
解析 由题意知=18,=110,样本点中心为(18,110)在回归直线上,故110=18+,即点(,)在直线上.
5.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查,y与x具有线性相关关系,回归直线方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72% C.67% D.66%
考点 线性回归分析
题点 回归直线方程的应用
答案 A
解析 将y=7.675代入回归直线方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.
6.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
考点 线性回归分析
题点 回归直线方程的应用
答案 C
解析 因为y=-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设z=ay+b(a>0),所以z=-0.1ax+a+b,-0.1a<0,所以x与z负相关.故选C.
二、填空题
7.已知x与y之间的一组数据:
x
0
2
4
6
y
a
3
5
3a
已求得关于y与x的回归直线方程为 =1.2x+0.55,则a=________.
考点 线性回归分析
题点 回归直线方程的应用
答案 2.15
解析 =3,=a+2,将(3,a+2)代入方程,得a+2=3.6+0.55,解得a=2.15.
8.某工厂为了新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单位x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得回归直线方程为 =-4x+ ,若在这些样本点中任取一点,则它在回归直线左下方的概率为________.
考点 线性回归分析
题点 回归直线方程的应用
答案
解析 由表中数据得=6.5,=80,由点(,)在直线 =-4x+ 上,得 =106,即回归直线方程为 =-4x+106,经过计算只有点(9,68)和(5,84)在直线的左下方,故所求概率为=.
9.某工厂为了调查工人文化程度与月收入之间的关系,随机调查了部分工人,得到如下表所示的2×2列联表(单位:人):
月收入2 000元以下
月收入2 000元及以上
总计
高中文化以上
10
45
55
高中文化及以下
20
30
50
总计
30
75
105
由2×2列联表计算可知,我们有________以上的把握认为“文化程度与月收入有关系”.
P(χ2≥x0)
0.15
0.10
0.05
0.025
0.01
0.001
x0
2.072
2.706
3.841
5.024
6.635
10.828
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 97.5%
解析 由表中的数据可得χ2=≈6.109,
由于6.109>5.024,
所以我们有97.5%以上的把握认为“文化程度与月收入有关系”.
10.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,则他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 ①
解析 查临界值表知P(χ2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清与预防感冒有关”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能.故答案为①.
三、解答题
11.某城区为研究城镇居民家庭月人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:
月人均收入x(元)
300
390
420
520
570
月人均生活费y(元)
255
324
335
360
450
月人均收入x(元)
700
760
800
850
1 080
月人均生活费y(元)
520
580
600
630
750
(1)作出散点图;
(2)求出回归直线方程;
(3)试预测月人均收入为1 100元和月人均收入为1 200元的两个家庭的月人均生活费.
考点
题点
解 (1)作出散点图如图所示,由图可知月人均生活费与月人均收入之间具有较强的线性相关关系.
(2)通过计算可知=639,=480.4,
x=4 610 300,xiyi=3 417 560,
∴ =≈0.659 9, =-=58.723 9,
∴回归直线方程为 =0.659 9x+58.723 9.
(3)由以上分析可知,我们可以利用线性回归方程
=0.659 9x+58.723 9来计算月人均生活费的预测值.
将x=1 100代入,得y≈784.61,
将x=1 200代入,得y≈850.60.
故预测月人均收入分别为1 100元和1 200元的两个家庭的月人均生活费分别为784.61元和850.60元.
12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
分组
[29.86,29.90)
[29.90,29.94)
[29.94,29.98)
[29.98,30.02)
[30.02,30.06)
[30.06,30.10)
[30.10,30.14]
频数
12
63
86
182
92
61
4
乙厂:
分组
[29.86,29.90)
[29.90,29.94)
[29.94,29.98)
[29.98,30.02)
[30.02,30.06)
[30.06,30.10)
[30.10,30.14]
频数
29
71
85
159
76
62
18
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填写下面的2×2列联表,并问能否在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”?
甲厂
乙厂
合计
优质品
非优质品
合计
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;
乙厂抽查的产品中有'320件优质品,从而乙厂生产的零件的优质品率估计为=64%.
(2)2×2列联表如下:
甲厂
乙厂
合计
优质品
360
320
680
非优质品
140
180
320
合计
500
500
1 000
χ2=≈7.353>6.635,
所以在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异.”
四、探究与拓展
13.某校高一年级理科有8个班,在一次数学考试中成绩情况分析如下:
班级
1
2
3
4
5
6
7
8
大于145分的人数
6
6
7
3
5
3
3
7
不大于145分的人数
39
39
38
42
40
42
42
38
附:xiyi=171,x=204.
求145分以上人数y对班级序号x的回归直线方程.(精确到0.000 1)
考点 独立性检验思想的应用
题点 独立性检验与回归直线方程、期望的综合应用
解 =4.5,=5,xiyi=171,x=204,
==
=-≈-0.214 3,
=-=5-(-0.214 3)×4.5≈5.964 4,
∴回归直线方程为=-0.214 3x+5.964 4.