2018版高中数学新人教A版选修2-3课时作业:第三章统计案例(3份)

文档属性

名称 2018版高中数学新人教A版选修2-3课时作业:第三章统计案例(3份)
格式 zip
文件大小 329.5KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2018-06-24 07:55:36

文档简介

课时作业 17 回归分析的基本思想及其初步应用
|基础巩固|(25分钟,60分)
一、选择题(每小题5分,共25分)
1.关于回归分析,下列说法错误的是(  )
A.回归分析是研究两个具有相关关系的变量的方法
B.线性相关系数可以是正的或负的
C.回归模型中一定存在随机误差
D.散点图能明确反映变量间的关系
解析:用散点图反映两个变量间的关系时,存在误差,故D错误,选D.
答案:D
2.在一线性回归模型中,计算其相关指数K2=0.96,下面哪种说法不够妥当(  )
A.该线性回归方程的拟合效果较好
B.解释变量对于预报变量变化的贡献率约为96%
C.随机误差对预报变量的影响约占4%
D.有96%的样本点在回归直线上
解析:由相关指数R2表示的意义可知A,B,C三种说法都很妥当,相关指数R2=0.96,其值较大,说明残差平方和较小,绝大部分样本点分布在回归直线附近,不一定有96%的样本点在回归直线上,故选D.
答案:D
3.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的回归方程=650+80x,下列说法中正确的个数是(  )
①劳动生产率为1 000元时,工资为730元;
②劳动生产率提高1 000元,则工资提高80元;
③劳动生产率提高1 000元,则工资提高730元;
④当月工资为810元时,劳动生产率约为2 000元.
A.1 B.2
C.3 D.4
解析:代入方程计算可判断①②④正确.
答案:C
4.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(  )
A.r2B.r4C.r4D.r2解析:由相关系数的定义及散点图所表达的含义,可知r2答案:A
5.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归方程为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(  )
A.身高在145.83 cm左右
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高一定是145.83 cm
解析:回归方程得到的预报值是预报变量的估计值,它是预报变量可能取值的平均值.
答案:A
二、填空题(每小题5分,共15分)
6.某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:由回归方程中系数的含义知家庭年收入每增加1万元,年饮食支出平均增加0.254万元.
答案:0.254
7.有5组数据:(1,3),(2,4),(4,5),(3,10),(10,12),去掉________后剩下的4组数据的线性相关性最大.
解析:画散点图易知(3,10)明显异常,其余各点均在一条直线附近.
答案:(3,10)
8.在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.
解析:由相关指数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.
答案:85% 15%
三、解答题(每小题10分,共20分)
9.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:
x (0.01%)
104
180
190
177
147
134
150
191
204
121
y (min)
100
200
210
185
155
135
170
205
235
125
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归直线方程.
解析:(1)以x轴表示含碳量,y轴表示冶炼时间,可作散点图如图所示.
从图中可以看出,各点散布在一条直线附近,即它们线性相关.
(2)列出下表,并用科学计算器进行计算:
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10 400
36 000
39 900
32 745
22 785
18 090
25 500
39 155
47 940
15 125
=159.8,=172,
=265 448,=312 350,iyi=287 640
设所求的回归直线方程为=x+,则
=≈1.267,=-≈-30.47.
则回归直线方程为y=1.267x-30.47.
10.某工厂为了对新研究的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解析:(1)=(8+8.2+8.4+8.6+8.8+9)=
8.5,=(90+84+83+80+75+68)=80,从而=+20=80+20×8.5=250,故=-20x+250.
(2)由题意知,工厂获得利润z=(x-4)y=-20x2+330x-1 000=-202+361.25,所以当x==8.25时,zmax=361.25(元).
即当该产品的单价定为8.25元时,工厂获得最大利润.
|能力提升|(20分钟,40分)
11.通过下面的残差图,我们发现在采集样本点的过程中,样本点数据不准确的为(  )
A.第四个 B.第五个
C.第六个 D.第七个
解析:由题图可知第六个数据的偏差最大,故选C.
答案:C
12.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要________小时.
解析:把x=600代入方程得=0.01×600+0.5=6.5.
答案:6.5
13.已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
(1)画出y关于x的散点图.
(2)求出回归直线方程.
(3)计算R2的值,并说明回归模型拟合程度的好坏.(参考数据:=18,=7.4,=1 660,
=327,iyi=620,(yi-i)2=0.3,
(yi-)2=53.2)
解析:(1)
(2)因为=18,=7.4,=1 660,iyi=620,
所以==-1.15,=-=28.1.
所以回归直线方程为=-1.15x+28.1.
(3)因为(yi-i)2=0.3,(yi-)2=53.2,
所以R2=1-≈0.994,
所以回归模型拟合效果很好.
14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局和某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月10日
2月10日
3月10日
4月10日
5月10日
6月10日
昼夜温差x(℃)
10
11
13
12
8
6
就诊人数y(人)
22
25
29
26
16
12
该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组求线性回归方程,再用被选取的2组数据进行检验.
(1)若选取的是1月与6月两组数据,请根据2至5月份的数据,用最小二乘法求出y关于x的线性回归方程=+x.
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
解析:(1)由数据求得=11,=24,由公式求得=,再由=-=-,
所以y关于x的线性回归方程为y=-+x.
(2)当x=10时,y=,<2,同样,当x=6时,y=,<2,
所以,该小组所得线性回归方程是理想的.
课时作业 18 独立性检验的基本思想及其初步应用
|基础巩固|(25分钟,60分)
一、选择题(每小题5分,共25分)
1.对两个分类变量进行独立性检验的主要作用是(  )
A.判断模型的拟合效果
B.对两个变量进行相关分析
C.给出两个分类变量有关系的可靠程度
D.估计预报变量的平均值
解析:独立性检验的目的就是明确两个分类变量有关系的可靠程度.
答案:C
2.对两个分类变量A、B的下列说法中正确的个数为(  )
①A与B无关,即A与B互不影响;
②A与B关系越密切,则K2的观测值就越大;
③K2的观测值大小是判定A与B是否相关的唯一依据.
A.1 B.2
C.3 D.0
解析:①正确,A与B无关即A与B相互独立;②不正确,K2的观测值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.
答案:A
3.对服用某种维生素对婴儿头发稀疏与稠密的影响调查如下:服用的60人中头发稀疏的有5人,不服用的60人中头发稀疏的有46人,作出如下列联表:
头发稀疏
头发稠密
总计
服用维生素
5
a
60
不服用维生素
46
b
60
总计
51
a+b
120
则表中a,b的值分别为(  )
A.9,14 B.55,14
C.55,24 D.69,14
解析:根据列联表知a=60-5=55,b=60-46=14.
答案:B
4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,
k=≈7.8.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是(  )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
解析:由7.8>6.635知,有1-0.010即99%以上的把握认为“爱好该项运动与性别有关”.故选A.
答案:A
5.某班主任对全班50名学生进行了作业量的调查,数据如下表:
认为作业量大
认为作业量不大
总数
男生
18
9
27
女生
8
15
23
总数
26
24
50
则学生的性别与认为作业量的大小有关系的把握大约为(  )
A.99% B.95%
C.90% D.无充分根据
解析:由于随机变量K2的观测值k=≈5.059>3.841,所以在犯错误概率不超过0.05的前提下,可认为学生的性别与认为作业量的大小有关系,即有95%的把握,故选B.
答案:B
二、填空题(每小题5分,共15分)
6.在一项打鼾与患心肺病的调查中,共调查了1 671人,经计算K2的观测值k=27.63.根据这一数据分析,在犯错误的概率不超过0.001的前提下认为打鼾与患心肺病________(填“有关”或“无关”).
解析:根据独立性检验的基本思想及P(K2≥10.828)≈0.001且27.63>10.828,可知在犯错误的概率不超过0.001的前提下认为打鼾与患心肺病有关系.
答案:有关
7.某厂家为调查一种新推出的产品的颜色接受程度是否与性别有关,统计数据如下表所示:



17
9

6
22
根据表中的数据,得到K2=≈10.653,因为K2>7.879,所以产品的颜色接受程度与性别有关系,那么这种判断出错的可能性为________.
下面的临界值表供参考:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解析:因为K2>7.879,所以我们有99.5%的把握认为产品的颜色接受程度与性别有关系,这种判断出错的可能性是0.005.
答案:0.005
8.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
总计
男性患者
15
35
50
女性患者
6
44
50
总计
21
79
100
设H0:服用此药的效果与患者的性别无关,则K2的观测值k≈________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
解析:由公式计算得K2的观测值k≈4.882,
∵k>3.841,
∴在犯错误的概率不超过0.05的前提下认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.
答案:4.882 5%
三、解答题(每小题10分,共20分)
9.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材作了调查,结果如下表所示:
支持新
教材
支持旧
教材
合计
教龄在15年以下的老师
12
25
37
教龄在15年以上的教师
(包括15年)
10
24
34
合计
22
49
71
根据此资料,你是否认为教龄的长短与支持新的数学教材有关?
解析:由公式得K2的观测值
k=≈0.08.
由k<2.706,我们没有充分的证据说明教龄的长短与支持新的数学教材有关.
10.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别
阳性数
阴性数
总计
铅中毒病人
29
7
36
对照组
9
28
37
总计
38
35
73
试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解析:等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
|能力提升|(20分钟,40分)
11.观察下列各图,其中两个分类变量x,y之间关系最强的是(  )
解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选D.
答案:D
12.某电视台对100名观众收看文艺节目和新闻节目的相关统计数据如表所示:
文艺节目
新闻节目
总计
20~40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________.(填“是”或“否”)
解析:因为在20~40岁的58名观众中有18人收看新闻节目;大于40岁的42名观众中有27人收看新闻节目.=,=.两者相差较大,所以经直观分析,收看新闻节目的观众与年龄有关系.
答案:是
13.某校对学生的课外活动进行调查,结果整理成下表:
体育
文娱
总计
男生
21
23
44
女生
6
29
35
总计
27
52
79
试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为学生喜欢课外活动的类别与性别有关系.
解析:由表中数据可知K2的观测值
k=
=≈8.106.
因为P(K2≥7.879)≈0.005,且8.106>7.879,
所以在犯错误的概率不超过0.005的前提下,可以认为学生喜欢课外活动的类别与性别有关系.
14.某运动队研制了一种有助于运动员在大运动量的训练后快速恢复的口服制剂,为了试验新药的效果,抽取若干名运动员来试验,所得资料如下:
区分该种药剂对男、女运动员产生的效果的强弱.
解析:对男运动员:
k=≈7.013>6.635,
在犯错误的概率不超过0.01的前提下认为药剂有效.
对女运动员:
k=≈0.076<2.706,
没有充足的证据显示有关系.
综上所述,该药剂对男运动员有效果,对女运动员无效果.
第三章 章末检测卷
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列变量关系是线性相关关系的是(  )
A.人的身高与视力
B.角的大小与所对的圆弧长
C.收入水平与纳税水平
D.圆的半径与面积
解析:收入与纳税不是函数关系,但收入高,纳税多.
答案:C
2.下表是x与y之间的一组数据,则y关于x的线性回归直线必过点(  )
x
0
1
2
3
y
1
3
5
7
A.(2,2)  B.(1.5,2)
C.(1,2) D.(1.5,4)
解析:∵==1.5,==4,
∴样本点的中心为(1.5,4),而回归直线必过样本点的中心,故选D.
答案:D
3.某商品销售量y(单位:件)与销售价格x(单元:元/件)负相关,则其回归方程可能是(  )
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
解析:由x与y负相关,可排除B,D两项,而C项中的y=-10x-200<0不符合题意,故选A.
答案:A
4.已知x,y的值如下表所示:
x
2
3
4
y
5
4
6
如果y与x呈线性相关且回归直线方程为y=bx+,则b等于(  )
A.- B.
C.- D.
解析:=3,=5,代入y=bx+中,得5=3b+,∴b=.
答案:B
5.下表给出5组数据(x,y),为选出4组数据使得线性相关程度最大,且保留第1组数据(-5,-3),则应去掉(  )
第i组
1
2
3
4
5
xi
-5
-4
-3
-2
4
yi
-3
-2
4
-1
6
A.第2组数据 B.第3组数据
C.第4组数据 D.第5组数据
解析:画出散点图如图所示,则应去掉第3组数据(-3,4).
答案:B
6.如果散点图中所有的样本点均在同一条直线上,那么残差平方和与相关系数的绝对值分别为(  )
A.1,0 B.0,1
C.0.5,0.5 D.0.43,0.57
解析:如果所有的样本点均在同一直线上,那么建立的回归模型一定是这条直线.根据残差的计算公式可知,每个样本的残差均为0,则残差平方和也为0,即此时的模型为y=bx+a,没有随机误差项,所以是严格的一次函数关系,通过计算可以证明解释变量与预报变量之间的相关系数的绝对值是1.
答案:B
7.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是(  )
A.在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关”
B.在犯错误的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关
C.在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关
D.在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关
解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关.
答案:D
8.为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值.计算知i=52,i=228,=478,iyi=1 849,则y对x的回归方程是(  )
A.=11.47+2.62x B.=-11.47+2.62x
C.=2.62+11.47x D.=11.47-2.62x
解析:由=,=-,直接计算得≈2.62,≈11.47,所以=2.62x+11.47.
答案:A
9.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施(  )
优、良、中

总 计
实验班
48
2
50
对比班
38
12
50
总计
86
14
100
A.有关 B.无关
C.关系不明确 D.以上都不正确
解析:随机变量K2的观测值k=≈8.306>6.635,则认为“实验效果与教学措施有关”的概率为0.99.
答案:A
10.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为(  )
A.a=50,b=40,c=30,d=20
B.a=50,b=30,c=40,d=20
C.a=20,b=30,c=40,d=50
D.a=20,b=30,c=50,d=40
解析:当(ad-bc)2的值越大,K2的值越大,可知X与Y有关系的可能性就越大.显然D项中(ad-bc)2的值最大.故选D.
答案:D
11.某饮料店在某5天的月销售收入y(单位:百元)与当天平均气温x(单位:℃)之间的数据如下表
x
-2
-1
0
1
2
y
5
4
2
2
1
甲、乙、丙、丁四位同学对上述数据进行了研究,分别得到了x与y之间的四个线性回归方程
①=-x+3 ②=-x+2.8
③=-x+2.6 ④=-x+2.4
其中正确的方程是(  )
A.① B.②
C.③ D.④
解析:由数据可得
=×(-2-1+0+1+2)=0
=×(5+4+2+2+1)=2.8
又因回归直线必经过(0,2.8),将其代入验证可知直线=-x+2.8成立.
答案:B
12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①y=bx+a;②y=c+d;③y=p+qlnx;④y=k1ek2x;⑤y=c1x2+c2,则较适宜作为年销售量y关于年宣传费x的回归方程的是(  )
A.①② B.②③
C.②④ D.③⑤
解析:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y=c+d或y=p+qlnx较适宜,故选B.
答案:B
二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中横线上)
13.若施肥量x(kg)与小麦产量y(kg)之间的回归直线方程为=250+4x,当施肥量为50 kg时,预计小麦产量为________.
解析:将x=50代入回归方程得=450 kg.
答案:450 kg
14.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示:



178
278
不能
23
21
则该地区生活不能自理的老人中男性比女性约多________人.
解析:由题表中数据可知,男性不能自理的频率为,女性不能自理的频率为,
故15 000×=60(人).
答案:60
15.以下三个命题:
①若两个变量的线性相关性越强,则它们的相关系数的值越接近于1;
②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;
③对分类变量X与Y的随机变量K2的观测值k来说,k越小,判断“X与Y有关系”的把握越大.
其中假命题的序号为________.
解析:①线性相关系数r的绝对值越接近于1,两变量的线性相关性越强,但两个变量的线性相关性越强它们的相关系数的值不一定越接近1,也有可能接近-1,故命题错误;②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;③显然错误.
答案:①③
16.在某年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.
解析:iyi=392,=10,=8,(xi-)2=2.5,代入公式,得=-3.2,所以=-x=40,故回归直线方程为=-3.2x+40.
答案:=-3.2x+40
三、解答题(本大题共6小题,共70分.解答时应写出必要的文字说明、证明过程或演算步骤)
17.(10分)某电视台联合报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:
赞同
反对
总计

198
217
415

476
109
585
总计
674
326
1 000
根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?[P(K2≥10.828)≈0.001]
解析:假设对“男女同龄退休”这一问题的看法与性别无关,由列联表中的数据,可以得到
K2的观测值k=

≈125.161>10.828,
又P(K2≥10.828)≈0.001,
故能在犯错误的概率不超过0.001的前提下认为对“男女同龄退体”这一问题的看法与性别有关.
18.(12分)已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
(1)画出y关于x的散点图.
(2)求出回归直线方程.
解析:(1)散点图如图所示:
(2)因为=18,=7.4,=1 660,=327,iyi=620,
所以==-1.15,
=-=28.1.
即所求回归直线方程为:
=-1.15x+28.1.
19.(12分)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2的列联表.
(2)判断性别与休闲方式是否有关系.
解析:(1)2×2的列联表如下:
看电视
运动
总计

43
27
70

21
33
54
总计
64
60
124
(2)假设“休闲方式与性别无关”,
计算k=≈6.201,因为k>5.024,
所以,有理由认为假设“休闲方式与性别无关”是不合理的,在犯错误的概率不超过0.025的前提下认为“休闲方式与性别有关”.
20.(12分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,
iyi=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程=x+;
(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程=x+中,=,a=-,其中,为样本平均值.
解析:(1)由题意知n=10,
=i==8,
=i==2,
又-n2=720-10×82=80,
iyi-n=184-10×8×2=24,
由此得===0.3,=-=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).
21.(12分)某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数大于等于70的人,饮食以肉类为主)
(1)根据茎叶图,帮助这位同学说明其30位亲属的饮食习惯;
(2)根据以上数据完成如表所示的2×2列联表.
主食蔬菜
主食肉类
总计
50岁以下
50岁以上
总计
(3)能否在犯错误的概率不超过0.010的前提下认为“其亲属的饮食习惯与年龄有关”?并写出简要分析.
解析:(1)30位亲属中50岁以上的人饮食多以蔬菜为主,50岁以下的人饮食多以肉类为主.
(2)列联表如表所示:
主食蔬菜
主食肉类
总计
50岁以下
4
8
12
50岁以上
16
2
18
总计
20
10
30
(3)K2的观测值k==10>6.635,
所以在犯错误的概率不超过0.010的前提下认为“其亲属的饮食习惯与年龄有关”.
22.(12分)以下资料是一位销售经理收集到的每年销售额y(千元)和销售经验x(年)的关系:
销售经验x/年
1
3
4
4
6
8
10
10
11
13
年销售额y/千元
80
97
92
102
103
111
119
123
117
136
(1)依据这些数据画出散点图并作直线=78+4.2x,计算(yi-i)2;
(2)依据这些数据求回归直线方程并据此计算(yi-i)2;
(3)比较(1)(2)中的残差平方和(yi-i)2的大小.
解析:(1)散点图与直线=78+4.2x的图形如图,
对x=1,3,…,13,有
i=82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6,(yi-i)2=179.28.
(2)=i=7,(xi-)2=142,
=i=108,
(xi-)(yi-)=568,
∴==4,
=-=108-7×4=80,
故=80+4x,对x=1,3,…,13,有
i=84,92,96,96,104,112,120,120,124,132,
(yi-i)2=170.
(3)比较可知,(2)中求出的(yi-i)2较小.