2018年高中数学苏教版选修2-3教学案:第3章统计案例(3份)

文档属性

名称 2018年高中数学苏教版选修2-3教学案:第3章统计案例(3份)
格式 zip
文件大小 3.7MB
资源类型 教案
版本资源 苏教版
科目 数学
更新时间 2018-11-03 23:38:40

文档简介

3.1 独立性检验
1.2×2列联表的定义
对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.这些取值可用下面的2×2列联表表示.
  2
.χ2统计量的求法
公式χ2=.
3.独立性检验的概念
用统计量χ2研究两变量是否有关的方法称为独立性检验.
4.独立性检验的步骤
要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0:Ⅰ与Ⅱ没有关系;
(2)根据2×2列联表及χ2公式,计算的值;
(3)查对临界值,作出判断.
其中临界值如表所示:
P(χ2≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
χ0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
  表示在H0成立的情况下,事件“χ2≥x0”发生的概率.
5.变量独立性判断的依据
(1)如果>10.828时,那么有99.9%的把握认为“Ⅰ与Ⅱ有关系”;
(2)如果>6.635时,那么有99%的把握认为“Ⅰ与Ⅱ有关系”;
(3)如果>2.706时,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;
(4)如果≤2.706时,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.
1.在2×2列联表中,通常要求a,b,c,d的值均不小于5.
2.表中|ad-bc|越小,Ⅰ与Ⅱ关系越弱;|ad-bc|越大,Ⅰ与Ⅱ关系越强.同时要记准表中a,b,c,d四个数据是交叉相乘然后再作差取绝对值,一定不要乘错.
3.表中类A与类B,以及类1与类2的关系:对于对象Ⅰ来说,类A与类B是对立的,也就是说类A发生,类B一定不发生,类A不发生,则类B一定发生;同样对于对象Ⅱ来说,类1与类2的关系也是如此.
  [例1] 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可.
[精解详析] 作列联表如下:
喜欢甜食
不喜欢甜食
合计

117
413
530

492
178
670
合计
609
591
1 200
[一点通] 分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.
1.下面是2×2列联表:
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
则表中a,b的值分别为________,________.
解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.
答案:52 54
2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人 .作出2×2列联表.
解:作列联表如下:
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1 020
  [例2] 下表是某地区的一种传染病与饮用水的调查表:
得病
不得病
合计
干净水
52
466
518
不干净水
94
218
312
合计
146
684
830
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.
[思路点拨] (1)根据表中的信息计算χ2的值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).
[精解详析] (1)假设H0:传染病与饮用水无关.把表中数据代入公式,得
χ2=≈54.21,
因为当H0成立时,χ2≥10.828的概率约为0.001,
所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关.
(2)依题意得2×2列联表:
得病
不得病
合计
干净水
5
50
55
不干净水
9
22
31
合计
14
72
86
此时,χ2=≈5.785.
由于5.785>2.706,
所以我们有90%的把握认为该种疾病与饮用不干净水有关.
两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.
[一点通] 解决独立性检验问题的基本步骤是:①指出相关数据,作列联表;②求χ2的值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.
3.某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病,请用所学知识分析该药品对患A疾病是否有效?
解:依题意得2×2的列联表:
患病
不患病
合计
使用
5
100
105
不使用
18
400
418
合计
23
500
523
要判断该药品对患A疾病是否有效,即进行独立性检验提出假设H0:该药品对患A疾病没有效.
根据列联表中的数据可以求得
χ2=≈0.041 45<0.455,
而查表可知P(χ2≥0.455)≈0.5,故没有充分的理由认为该保健药品对预防A疾病有效.
4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.实施西部开发战略是否对应届大学毕业生的选择产生了影响?
解:依题意,得2×2列联表:
志愿者
非志愿者
合计
开发战略公布前
80
920
1 000
开发战略公布后
400
800
1 200
合计
480
1 720
2 200
提出假设H0:实施西部开发战略的公布对应届大学毕业生的选择没有产生影响,根据列联表中的数据,可以求得
χ2=≈205.22.
因为当H0成立时,χ2≥10.828的概率约为0.001,所以有99.9%的所握认为西部开发战略的实施对应届大学毕业生的选择产生了影响.
独立性检验的基本思想与反证法的思想比较
反证法
独立性检验
要证明结论A
要确认“两个对象有关系”
在A不成立的前提下进行推理
假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下计算χ2
推出矛盾意味着结论A成立
由观测数据计算得到的χ2的观测值很大,则在一定可信程度上说明假设不合理
没有找到矛盾,不能对A下任何结论,即反证法不成立
根据随机变量χ2的含义,可以通过概率P(χ2≥x0)的大小来评价该假设不合理的程度有多大,从而得出“两个对象有关系” 这一结论成立的可信程度有多大
课下能力提升(十八)
一、填空题
1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关)
解析:由χ2值可判断有关.
答案:有关
2.若两个研究对象X和Y的列联表为:
y1
y2
x1
5
15
x2
40
10
则X与Y之间有关系的概率约为________.
解析:因为χ2=≈18.8,查表知P(χ2≥10.828)≈0.001.
答案:99.9%
3.在吸烟与患肺病这两个对象的独立性检验的计算中,下列说法正确的是________.(填序号)
①若χ2=6.635,则我们认为有99%的把握认为吸烟与患肺病有关系.那么在100个吸烟的人中必有99人患肺病.
②从独立性检验的计算中求有99%的把握认为吸烟与患肺病有关系时,我们认为如果某人吸烟,那么他有99%的可能患肺病.
③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.
④以上三种说法都不正确.
解析:由独立性检验的意义可知,③正确.
答案:③
4.调查者询问了72名男女大学生在购买食品时是否观看营养说明得到如下2×2列联表:
看营养说明
不看营养说明
总计
男大学生
28
8
36
女大学生
16
20
36
总计
44
28
72
从表中数据分析大学生的性别与看不看营养说明之间的关系是________.(填“有关”或“无关”)
解析:提出假设H0:大学生的性别与看不看营养说明无关,由题目中的数据可计算χ2=≈8.42,因为当H0成立时,P(χ2≥7.879)≈0.005,这里的χ2≈8.42>7.879,所以我们有99.5%的把握认为大学生的性别与看不看营养说明有关.
答案:有关
5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
合计
多看电视
68
42
110
少看电视
20
38
58
合计
88
80
168
则由表可知大约有________的把握认为多看电视与人变冷漠有关系.
解析:由公式得χ2=≈11.377>10.828,所以我们有99.9%的把握说,多看电视与人变冷漠有关.
答案:99.9%
二、解答题
6.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:
成绩优秀
成绩较差
合计
兴趣浓厚的
64
30
94
兴趣不浓厚的
22
73
95
合计
86
103
189
学生的数学成绩好坏与对学习数学的兴趣是否有关?
解析:提出假设H0:学生数学成绩的好坏与对学习数学的兴趣无关.
由公式得χ2的值为
χ2=≈38.459.
∵当H0成立时,χ2≥10.828的概率约为0.001,
而这里χ2≈38.459>10.828,
∴有99.9%的把握认为学生数学成绩的好坏与对学习数学的兴趣是有关的.
7.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表.
种子灭菌
种子未灭菌
合计
有黑穗病
26
184
210
无黑穗病
50
200
250
合计
76
384
460
试按照原试验目的作统计推断.
解:提出假设H0:种子是否灭菌与有无黑穗病无关.
由公式得,χ2=≈4.804.
由于4.804>3.841,即当H0成立时,χ2>3.841的概率约为0.05,所以我们有95%的把握认为种子是否灭菌与有无黑穗病是有关系的.
8.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响.
解:2×2列联表如下
合格品数
次品数
合计
甲在生产现场
982
8
990
甲不在生产现场
493
17
510
合计
1 475
25
1 500
提出假设H0:质量监督员甲是否在生产现场与产品质量的好坏无明显关系.
根据χ2公式得
χ2=≈13.097.
因为H0成立时,χ2>10.828的概率约为0.001,
而这里χ2≈13.097>10.828,所以有99.9%的把握认为质量监督员甲是否在生产现场与产品质量的好坏有关系.
3.2 回归分析

1.线性回归模型
(1)随机误差
具有线性相关关系的两个变量的取值x、y,y的值不能由x完全确定,可将x,y之间的关系表示为y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差.
(2)随机误差产生的主要原因
①所用的确定性函数不恰当引起的误差;
②忽略了某些因素的影响;
③存在观测误差.
(3)线性回归模型中a,b值的求法
y=a+bx+ε称为线性回归模型.
a,b的估计值为a ∧,b ∧,则

(4)回归直线和线性回归方程
直线y_∧=a_∧+b_∧x称为回归直线,此直线方程即为线性回归方程,a ∧称为回归截距,b ∧称为回归系数,y ∧称为回归值.
2.样本相关系数r及其性质
(1)r=.
(2)r具有以下性质
①|r|≤1.
②|r|越接近于1,x,y的线性相关程度越强.
③|r|越接近于0,x,y的线性相关程度越弱.
3.对相关系数r进行显著性检验的基本步骤
(1)提出统计假设H0:变量x,y不具有线性相关关系.
(2)如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n-2在教材附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平).
(3)计算样本相关系数r.
(4)作出统计推断:若|r|>r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.
1.在线性回归方程中,b既表示回归直线的斜率,又表示自变量x的取值增加一个单位时,函数值y的改变量.
2.通过回归方程y ∧=a ∧+b ∧x可求出相应变量的估计值.
3.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.
  [例1] 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
  若由数据可知,y对x呈现线性相关关系.
(1)求线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
[思路点拨] 代入数值求线性回归方程,然后把x=10代入,估计维修费用.
[精解详析] (1)列表如下:
i
1
2
3
4
5
xi
2
3
4
5
6
yi
2.2
3.8
5.5
6.5
7.0
xiyi
4.4
11.4
22.0
32.5
42.0
x
4
9
16
25
36
经计算得:x=4,y=5,∑5,i=1x=90,∑5,i=1xiyi=112.3,
a ∧=y-b ∧·x=0.08,
所以线性回归方程为y ∧=a ∧+b ∧x=0.08+1.23x.
(2)当x=10时,y ∧=0.08+1.23×10=12.38(万元),
即若估计使用年限为10年时,维修费用为12.38万元.
[一点通] 线性回归分析的步骤:
(1)列出散点图,从直观上分析数据间是否存在线性相关关系;
(2)计算x,y,∑n,i=1x,∑n,i=1y,∑n,i=1xiyi;
(3)代入公式求出y ∧=b ∧x+a ∧中参数b ∧,a ∧的值;
(4)写出线性回归方程,并对实际问题作出估计.
某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:
x
6
8
10
12
y
2
3
5
6
则y对x的线性回归方程为_________________________________________________.
解析:∵==9,==4,
故y对x的线性回归方程为y ∧=0.7x-2.3.
答案:y ∧=0.7x-2.3
2.某班5名学生的数学和物理成绩如表:
学生学科
A
B
C
D
E
数学成绩(x)
88
76
73
66
63
物理成绩(y)
78
65
71
64
61
(1)画出散点图;
(2)求物理成绩y对数学成绩x的线性回归方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
解:(1)散点图如图.
(2)∵x=× (88+76+73+66+63)=73.2.
y=×(78+65+71+64+61)=67.8.
xiyi=88×78+76×65+73×71+66×64+63×61=25 054.
又x=882+762+732+662+632=27 174.
∴y对x的线性回归方程是y ∧=0.625x+22.05.
(3)当x=96时,y ∧=0.625×96+22.05≈82.
可以预测他的物理成绩是82.
  [例2] 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下:
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
  请问:这10名学生的两次数学成绩是否具有线性关系?
[思路点拨] 可先计算线性相关系数r的值,然后与r0.05比较,进而对x与y的相关性作出判断.
[精解详析] x=(120+108+…+99+108)=107.8,y=(84+64+…+57+71)=68.
所以相关系数为
r=
≈0.751.
由检验水平0.05及n-2=8,
在附录2中查得r0.05=0.632,
因为0.751>0.632,
由此可看出这10名学生的两次数学成绩具有较强的线性相关关系.
[一点通] 利用相关系数r进行判断相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器,但计算时应该特别细心,避免出现计算错误.
3.对于回归分析,有下列叙述:
(1)在回归分析中,变量间的关系若是非确定性关系,则因变量不能自由变量惟一确定.
(2)线性相关系数可以是正的或是负的.
(3)回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关.
(4)样本相关系数r∈(-∞,+∞).
判断其说法是否正确.
解:由回归模型及其性质易知(1),(2),(3)是正确的.相关系数的取值范围应为|r|≤1,所以(4)是错误的.
4.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少,随机器运转的速度而变化,下表为抽样试验的结果:
转速x(转/秒)
16
14
12
8
每小时生产有缺点的零件数y(件)
11
9
8
5
对变量y与x进行线性相关性检验.
解:由题中数据可得=12.5,=8.25,xiyi=438,
4 =412.5,x=660,y=291,所以
=
=≈0.995.
由检验水平0.05及n-2=2在教材附录表2中查得r0.05=0.950,因为r>r0.05,所以y与x具有线性相关关系.
对两个相关变量进行线性回归分析时,首先判断两个变量是否线性相关,可以通过散点图和相关系数判断,然后再求线性回归方程,对问题进行预测,否则求出的回归方程无意义,预测也无价值.
课下能力提升(十九)
一、填空题
1.下列命题中正确的是________(填所有正确命题的序号).
①任何两个变量都具有相关关系;
②圆的周长与圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的线性回归方程可能是没有意义的;
⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究.
解析:显然①是错误的;而②中,圆的周长与圆的半径的关系为C=2πR,是一种确定性的函数关系.
答案:③④⑤
2.已知x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从所得的散点图分析,y与x线性相关,且y ∧=0.95x+a ∧,则a ∧=________.
解析:∵=2,=4.5.又回归直线恒过定点(,),代入得a ∧=2.6.
答案:2.6
3.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y ∧=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以估计其体重为________.
解析:y ∧=0.849×172-85.712=60.316.
答案:60.316 kg
4.有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系;
⑤学生与其学号之间的关系.
其中有相关关系的是____________.(填序号)
解析:由相关关系定义分析.
答案:①③④
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得线性回归方程y=b ∧x+a ∧中的b ∧为9.4,据此模型预报广告费用为6万元时销售额为________万元.
解析:样本中心点是(3.5,42),
答案:65.5
二、解答题
6.下面是水稻产量与施肥量的一组观测数据:
施肥量
15
20
25
30
35
40
45
水稻产量
320
330
360
410
460
470
480
(1)将上述数据制成散点图;
(2)你能从散点图中发现施肥量与水稻产量近似成什么关系吗?
解:(1)散点图如下:
(2)从图中可以发现施肥量与水稻产量具有线性相关关系,当施肥量由小到大变化时,水稻产量也由小变大,图中的数据点大致分布在一条直线的附近,因此施肥量和水稻产量近似成线性正相关关系.
7.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为
1
2
3
4
5
价格x
1.4
1.6
1.8
2
2.2
需求量y
12
10
7
5
3
已知∑5,i=1xiyi=62,∑5,i=1x=16.6.
(1)画出散点图;
(2)求出y对x的线性回归方程;
(3)如价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t)
解:(1)散点图如下图所示:
(2)因为x=×9=1.8,y=×37=7.4,
8.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩:
数学(x)
88
83
117
92
108
100
112
物理(y)
94
91
108
96
104
101
106
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;
(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.
解:(1)∵=100+=100;
=100+=100;
∴σ==142,σ=,
从而σ>σ,∴物理成绩更稳定.
(2)由于x与y之间具有线性相关关系,因为
xiyi=70 497,x=70 994,
所以根据回归系数公式得到
当y=115时,x=130,即该生物理成绩达到115分时,他的数学成绩大约为130分.
建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.
第3章 统计案例
一、独立性检验
1.独立性检验的思想及方法
独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理.根据随机变量X的含义,可以通过概率来评价假设不合理程度.
2.独立性检验的一般步骤
(1)提出假设H0;
(2)根据样本数据列2×2列联表,
计算χ2=;
(3)比较χ2与临界值的大小并作出判断.
二、回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
建立回归模型的基本步骤:
(1)确定两个变量;(2)画出散点图;(3)进行相关系数检验;(4)确定线性回归方程类型,求出回归方程.
建立回归模型的基本步骤,不仅适用于线性回归模型,也适用于非线性回归模型的建立.
                   
(考试时间:120分钟 试卷总分:160分)
一、填空题(本大题共14小题,每小题5分,共70分)
1.下列有关线性回归的说法
①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;
②在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图;
③线性回归直线得到具有代表意义的线性回归方程;
④任何一组观测值都能得到具有代表意义的线性回归方程.其中错误的是________.
解析:任何一组观测值并不都能得到具有代表意义的线性回归方程.
答案:④
2.下表是x与y之间的一组数据,则y关于x的线性回归直线必过点________.
x
0
1
2
3
y
1
3
5
7
解析:∵x==1.5,y==4,∴样本点的中心为(1.5,4),
而回归直线必过样本点的中心,故必过(1.5,4).
答案:(1.5,4)
3.对两个变量y和x进行线性相关性检验,已知n是观察值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.999 1;④n=3,r=0.995 0,则变量y和x具有线性相关关系的是________.(填序号)
解析:判断变量y与x是否具有线性相关关系时,观察值组数n不能太小.若y与x具有线性相关性,则相关系数|r|≥0.75,故②④错.
答案:①③
4.由线性回归直线方程y ∧=4.75x+157,当x=28时,y ∧为________.
解析:将x的值代入回归直线方程得估计值y ∧=4.75×28+157=290.
答案:290
5.一家保险公司调查其总公司营业部的加班情况,收集了10周中每周加班工作时间y(小时)与签发保险单数目x的数据如下表所示:
x
825
215
1 070
550
480
920
1 350
325
670
1 215
y
3.5
1.0
4.0
2.0
1.0
3.0
4.5
1.5
3.0
5.0
已知用最小二乘法估计求出的线性回归方程的斜率为0.003 585,则线性回归方程为________________________________________________________________________.
解析:线性回归直线y ∧=b ∧x+a ∧过样本中心点(,),故将,求出代入即可.
答案:y ∧=0.118 2+0.003 585x
6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表,则喜不喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为________.
认为作业多
认为作业不多
合计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
合计
26
24
50
解析:假设H0:喜欢玩电脑游戏与认为作业量的多少没有关系,根据列联表中的数据,可以求得χ2=≈5.06,对照临界值表,当假设成立时,χ2≥5.024的概率约为0.025,所以我们有97.5%的把握认为喜欢玩电脑游戏与认为作业量的多少有关系.
答案:97.5%
7.下列关于回归分析与独立性检验的说法正确的是________.(填序号)
①回归分析和独立性检验没有什么区别;
②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;
③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;
④独立性检验可以100%确定两个变量之间是否具有某种关系.
解析:由回归分析、独立性检验的意义知,回归分析与独立性检验都是研究两个变量之间的相关性,但方法与手段有所不同,研究角度不同.由其意义知,③正确.
答案:③
8. 如图,有5组数据对(x,y),去掉哪组数据后剩下的4组数据的线性相关程度最大________.
解析:由散点图可知,除D之外的其余各点近似地在某条直线附近,而D点则偏离这一直线.故应去掉D.
答案:D
9.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x+a ∧,其中b ∧=-2.现预测当气温为-4 ℃时,用电量的度数约为________.
用电量y(度)
24
34
38
64
气温x(℃)
18
13
10
-1
解析:由题意可知x=(18+13+10-1)=10,y=(24+34+38+64)=40,b ∧=-2.
又回归方程y ∧=-2x+a ∧过点(10,40),故a ∧=60,所以当x=-4时,y ∧=-2×(-4)+60=68.
答案:68
10.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的2×2列联表:


总计
喜欢吃零食
5
12
17
不喜欢吃零食
40
28
68
合计
45
40
85
试回答吃零食与性别有关系吗?(“有”或“没有”)________.
解析:χ2==≈4.722>3.841.
故约有95%的把握认为“吃零食与性别”有关.
答案:有
11.变量x,y具有线性相关关系,当x的取值分别为8,12,14和16时,通过观测知y的值分别为5,8,9和11,若在实际问题中,y的预报值最大是10,则x的最大取值不能超过________.
解析:因为x=16时,y=11;当x=14时,y=9,所以当y的最大值为10时,x的最大值属于区间(14,16).
答案:15
12.下表是某厂1~4月份用水量(单位:百吨)的一组数据,
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由某散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y ∧=-0.7x+a ∧,则该厂6月份的用水量约为________.
解析:∵x=2.5,y=3.5,b ∧=-0.7,∴a ∧=3.5+0.7×2.5=5.25.
∴当x=6时,y ∧=-0.7×6+5.25=1.05.
答案:1.05百吨
13.为研究变量x和y的线性相关关系,甲、乙两人分别作了研究,利用线性回归方程得到回归直线l1和l2,两人计算知x相同,y也相同,则l1与l2的位置关系是________.
解析:每条回归直线都过样本的中心(x,y).
答案:l1与l2有公共点(x,y)
14.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则________.(填序号)
①r2<r1<0;②0<r2<r1;③r2<0<r1;④r2=r1.
解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,所以有r2<0答案:③
二、解答题(本大题共6小题,共90分,解答应写出必要的文字说明、证明过程或演算步骤)
15.(本小题满分14分)某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:
气温x(℃)
26
18
13
10
4
-1
杯数y
20
24
34
38
50
64
画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.
解:由表中数据画出散点图,如图所示.
由散点图可知热茶销售量与气温之间具有较强的线性相关关系.
16.(本小题满分14分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:
y1
y2
x1
a
20-a
x2
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,有90%的把握认为x与y之间有关系?
解:查表可知,要有90%的把握认为x与y之间有关系,则χ2≥2.706,而
χ2=
==.
由χ2≥2.706,得a≥7.19或a≤2.04.又a>5,且15-a>5,a∈Z,即a=8,9.
故a为8或9时,有90%的把握认为x与y之间有关系.
17.(本小题满分14分)某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目进行分析,根据上述数据能得出什么结论?
解:根据列联表中的数据,得到
χ2==10.76.
因为10.76>7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.
18.(本小题满分16分)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高约为多少?
解:由题意父亲身高x cm与儿子身高y cm对应关系如表:
x
173
170
176
y
170
176
182
则x-==173,y-==176, (xi-x)(yi-y)=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)(182-176)=18,
 (xi-x)2=(173-173)2+(170-173)2+(176-173)2=18.
19.(本小题满分16分)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
60分以下
61~70分
71~80分
81~90分
91~100分
甲班
(人数)
3
6
11
18
12
乙班
(人数)
4
8
13
15
10
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分别估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.
解:(1)由题意知,甲、乙两班均有学生50人,甲班优秀人数为30人,优秀率为=60%,
乙班优秀人数为25人,优秀率为=50%,所以甲、乙两班的优秀率分别为60%和50%.
(2)列联表如下:
因为χ2==≈1.010,
所以由参考数据知,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.
20.(本小题满分16分)某运动员训练次数与运动成绩之间数据关系如下:
次数(x)
30
33
35
37
39
44
46
50
成绩(y)
30
34
37
39
42
46
48
51
(1)作出散点图;
(2)求出回归方程;
(3)计算相关系数,并利用其检验两变量的相关关系的显著性;
(4)试预测该运动员训练47次和55次的成绩.
解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.
(2)计算得x=39.25,y=40.875,b ∧≈1.0415,a ∧≈-0.004,所求回归方程为y ∧=1.0415 x-0.004.
(3)计算得x=12 656,y=13 731,
r=
=
≈≈0.993,
查表得r0.05=0.707,r>r0.05,由此可得出,训练次数与运动成绩有较强的线性相关关系.
(4)由上述分析可知,我们可用回归方程y=1.041 5x-0.004作为该运动员成绩的预报值.
将x=47和x=55分别代入该方程可得y≈49和y≈57.
故预测该运动员训练47次和55次的成绩分别为49和57.