一、选择题
1.调查男女学生购买食品时是否看出厂日期与性别有无关系时,最有说服力的是( )
A.期望 B.方差
C.正态分布 D.独立性检验
【解析】 要判断两个事件是否相关时,用独立性检验.
【答案】 D
2.提出统计假设H0,计算出χ2的值,则拒绝H0的是( )
A.χ2=6.635 B.χ2=2.63
C.χ2=0.725 D.χ2=1.832
【解析】 依据独立性检验的思想及其结论的应用.应选A.
【答案】 A
3.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在推断结论为错误的可能性为0.01的前提下认为这个结论是成立的,下列说法中正确的是( )
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这个人有99%的概率患有肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
【解析】 由题意知,有99%的把握说明吸烟与患有肺癌有关,但相关程度有多大不清楚.
【答案】 D
4.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定断言“X与Y有关系”的可信度,如果χ2>6.635,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过( )
A.0.05 B.0.95
C.0.01 D.0.99
【解析】 通过查表确定临界值χ0.
当χ2>χ0=6.635时,推断“X与Y有关系”,这种推断犯错误的概率不超过0.01.故选C.
【答案】 C
5.某班主任对全班50名学生进行了作业量多少的调查,数据如下表所示:
作业量的情况
玩电脑游戏的情况
认为
作业多
认为作
业不多
总数
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总数
26
24
50
则认定喜欢玩电脑游戏与认为作业量的多少有关系的把握为( )
A.99% B.95%
C.90% D.以上都不对
【解析】 χ2=≈5.059>3.841.因而有95%的把握认定喜欢玩电脑游戏与认为作业量的多少有关.
【答案】 B
二、填空题
6.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到随机变量χ2的值:
χ2=≈4.844.
因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
【解析】 根据χ2≈4.844>3.841,可判断有95%的把握认为主修统计专业与性别有关系.故有5%的可能性出错.
【答案】 5%
7.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,有________的把握说,打鼾与患心脏病是________的.(有关、无关)
【解析】 ∵χ2=7.63,∴χ2>6.635,
因此,有99%的把握说,打鼾与患心脏病是有关的.
【答案】 99% 有关
8.若两个分类变量X与Y的列联表为:
y1
y2
总计
x1
10
15
25
x2
40
16
56
总计
50
31
81
则“X与Y之间有关系”这个结论出错的概率为________.
【解析】 由列联表的数据,可求得随机变量K2的观测值k=≈7.227>6.635.
因为P(K2≥6.635)≈0.01,所以“X与Y之间有关系”出错的概率仅为0.01.
【答案】 0.01
三、解答题
9.某地震观测站对地下水位的变化和发生地震的情况共进行了n=1 700次观测,列联表如下:
地震
次数
水位
有震
无震
合计
有变化
98
902
1 000
无变化
82
618
700
合计
180
1 520
1 700
问观测结果是否说明地下水位的变化与地震的发生相关?
【解】 根据列联表中的数据得到:
χ2=≈1.59<3.841,
所以,没有充分的证据显示地下水位的变化与地震的发生相关.
10.某班班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加
班级工作
不太主动参
加班级工作
合计
学习积极性高
18
7
25
学习积极性一般
6
19
25
合计
24
26
50
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.
【解】 (1)积极参加班级工作的学生有24人,总人数有50,
故抽到积极参加班级工作的学生的概率是=;
不太主动参加班级工作且学习积极性一般的学生有19人,故抽到不太主动参加班级工作且学习积极性一般的学生的概率是.
(2)由公式得χ2=≈11.539.
因为11.539>6.635,所以我们有99%的把握认为“学生的学习积极性与对待班级工作的态度有关系.”
11.现在大多数同学都有自己的电子邮箱,我们经常使用它相互传递学习资料.从中我们发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,于是我们收集了124个邮箱名称,其中中国人的有64个,外国人的有60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立一个2×2列联表;
(2)试问能以多大把握认为国籍与邮箱名称里含有数字有关?
【解】 (1)根据题目中的数据,得到如下2×2列联表:
中国人的
外国人的
总计
有数字
43
27
70
无数字
21
33
54
总计
64
60
124
(2)假设“国籍和邮箱名称里含有数字无关”.
由表中数据,得
χ2=≈6.201.
因为χ2>3.841,所以有95%的把握认为“国籍和邮箱名称里含有数字有关”.
课件50张PPT。
演示结束 独立性检验及其应用 较大 无关 99% 95% 两个变量的独立性检验 独立性检验的综合应用 课时作业(3.1)
一、选择题
1.(2013·临沂高二检测)某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分的人体内脂肪含量为31.5%
【解析】 x=37时,y=0.577×37-0.448=20.90,因为回归方程得到的值只是近似的,故选C.
【答案】 C
2.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
【解析】 ==3.5,==42,
∴=-=42-9.4×3.5=9.1,
∴回归方程为=9.4x+9.1,
∴当x=6时,=9.4×6+9.1=65.5,故选B.
【答案】 B
3.变量X与V相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2C.r2<0【解析】 画散点图,由散点图可知x与y是正相关,则相关系数r1>0,U与V是负相关,相关系数r2<0,故选C.
【答案】 C
4.如图3-2-1所示的5组数据中,去掉________组数据后,剩下的4组数据的线性相关系数最大.
图3-2-1
【解析】 由图象得去掉D之后则A、B、C、E更加靠近某条直线,即线性相关系数最大.
【答案】 D
5.在两个变量Y与x的回归模型中,分析选择了四个不同的模型,它们的相关系数r如下,其中拟合效果最好的为( )
A.模型①的相关系数为0.876 5
B.模型②的相关系数为0.735 1
C.模型③的相关系数为0.001 2
D.模型④的相关系数为0.215 1
【解析】 由于相关系数越接近于1,拟合效果越好,所以选A.
【答案】 A
二、填空题
6.对具有线性相关关系的变量x和Y,测得一组数据如下表:
x
2
4
5
6
8
Y
30
40
60
50
70
若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.
【解析】 设回归直线为=6.5x+,点(,)在此直线上,故=17.5.
【答案】 =6.5x+17.5
7.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【解析】 法一:特殊值法.
令x1=1得=0.254+0.321.
令x2=1+1=2得=2×0.254+0.321.
-=0.254.
法二:由=0.254x1+0.321,=0.254(x1+1)+0.321,则-=0.254.
【答案】 0.254
8.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)对比结果如下:
与实际相符数据个数
与实际不符合数据个数
合计
甲回归方程
32
8
40
乙回归方程
40
20
60
合计
72
28
100
则从表中数据分析,________回归方程更好(即与实际数据更贴近).
【解析】 可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为=,而乙回归方程的数据准确率为=.显然甲的准确率高些,因此甲回归方程好些.
【答案】 甲
三、解答题
9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
推销金额Y/万元
2
3
3
4
5
(1)求年推销金额Y关于工作年限x的回归直线方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
参考数据:=1.02;由检验水平0.01及n-2=3,查表得r0.01=0.959.
参考公式:线性回归方程系数公式:=x+,其中=,=-.
【解】 (1)设所求的回归直线方程为=x+,
则===0.5,
=-=0.4.
所以年推销金额Y关于工作年限x的回归直线方程为=0.5x+0.4.
(2)当x=11时,=0.5x+0.4=0.5×11+0.4=5.9万元.
所以可以估计第6名推销员的年推销金额为5.9万元.
10.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩Y(单位:分)之间有如下数据:
x
24
15
23
19
16
11
20
16
17
13
Y
92
79
97
89
64
47
83
68
71
59
若某同学每周用于数学学习的时间为18小时,试预测该同学数学成绩.
【解】 因为学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.
i
1
2
3
4
5
6
7
8
9
10
xi
24
15
23
19
16
11
20
16
17
13
yi
92
79
97
89
64
47
83
68
71
59
xiyi
2 208
1 185
2 231
1 691
1 024
517
1 660
1 088
1 207
767
=3 182,=58 375,iyi=13 578
于是可得:
==≈3.53,
=-b=74.9-3.53×17.4≈13.5.
因此可求得回归直线方程为=3.53x+13.5.
当x=18时,=3.53×18+13.5=77.
故该同学预计可得77分左右.
11.下表是1957年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y表示相应的平均价格,求y关于x的回归方程.
使用年数x
1
2
3
4
5
6
7
8
9
10
平均价格y(美元)
2 651
1 943
1 494
1 087
765
538
484
290
226
204
【解】 由散点图看出y与x呈指数关系,于是令z=ln y.
变换后得数据:
x
1
2
3
4
5
6
7
8
9
10
z
7.883
7.572
7.309
6.991
6.640
6.288
6.182
5.670
5.421
5.318
由图可知,各点基本上处于一直线,由表中数据可得线性回归方程:
=8.165-0.298x.
因此旧车的平均价格对使用年数的非线性回归方程为
=e8.165-0.298x.
课件61张PPT。演示结束 回归分析 n-2 小概率0.05 线性相关 越弱 越强 原来的假设 95% 样本相关系数 相关关系的判定及线性回归方程 命题的判断 二项式系数性质的应用 课时作业(3.2)