第一章 统计案例 B卷
1.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:
月收入2000元以下 月收入2000元以上 总计
高中文化以上 10 45 55
高中文化及以下 20 30 50
总计 30 75 105
请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )
0.05 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.1% B.99% C.2.5% D.97.5%
2.利用独立件检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.
0.05 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
如果,那么就有把握认为“X与Y有关系”的百分比为( )
A.25% B.75% C.2.5% D.97.5%
3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若的观测值为,在犯错误的概率不超过的前提下认为吸烟与患肺病有关系,那么在个吸烟的人中必有人患有肺病
B.由独立性检验可知,在犯错误的概率不超过的前提下认为吸烟与患肺病有关系,我们说某人吸烟,那么他有的可能患有肺病
C.若从统计量中求出在犯错误的概率不超过的前提下认为吸烟与患肺病有关系,是指有的可能性使得判断出现错误
D.以上三种说法都不正确
4.两个分类变量X和Y可能的取值分别为和,其样本频数满足,,,若认为X与Y有关系的犯错误的概率不超过0.1,则c的值可能=( )
A.4 B.5 C.6 D.7
5.如果根据性别与是否爱好运动的列联表得到,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( )
A.2.5% B.0.5% C.1% D.5%
6.根据如下样本数据:
x 3 4 5 6 7 8
y
得到的回归方程为,则( )
A. B. C. D.
7.某研究员为研究某两个变量的相关性,随机抽取这两个变量样本数据如下表:
0.04 1
4.84 10.24
1.1 2.1 2.3 3.3 4.2
若依据表中数据画出散点图,则样本点都在曲线附近波动.但由于某种原因表中一个值被污损,将方程作为回归方程,则根据回归方程和表中数据可求得被污损数据为( )
A. B.1.69 C.1.96 D.4.32
8.在一次试验中,测得的四组值分别是,则y与x之间的回归直线方程为( )
A. B. C. D.
9.已知回归直线斜率的估计值为1.23,样本点的中心为点,当时,估计y的值为( )
A.6.46 B.7.46 C.2.54 D.1.39
10.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,则下列结论正确的是( )
A.y与x成正线性相关关系
B.当商品销售价格提高1元时,商品的销售量减少200件
C.当销售价格为10元/件时,销售量为100件
D.当销售价格为10元/件时,销售量为100件左右
11.下表是关于喜欢抢红包与性别是否有关的列联表,依据表中的数据,得到的观测值k为_____________(结果保留到小数点后三位).
喜欢抢红包 不喜欢抢红包 总计
女 40 28 68
男 5 12 17
总计 45 40 85
12.在一项打鼾与患心脏病的调查中,共调查了人,经过计算得,根据这一数据分析,我们有理由认为打鼾与患心脏病是的____________(填“有关”或“无关”).
13.已知一组关于的数据具有线性相关性:,且与之间的回归方程为。则 。
14.调查了某地若干户家庭的年收入(单位:万元)和年饮食支出(单位:万元),调查显示年收入与年饮食支出具有线性相关关系,并由调查数据得到对的回归直线方程:.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
15.“支付宝捐步”已经成为当下很热门的健身方式,为了了解是否使用支付宝捐步与年龄有关,研究人员随机抽取了5000名使用支付宝的人员进行调查,所得情况如表所示:
50岁以上 50岁以下
使用支付宝捐步 1000 1000
不使用支付宝捐步 2500 500
(1)根据上表数据,能否有99.9%的把握认为是否使用支付宝捐步与年龄有关?
(2)55岁的老王在了解了捐步功能以后开启了自己的捐步计划,可知其在捐步的前5天,捐步的步数与天数呈线性相关。
第x天 第1天 第2天 第3天 第4天 第5天
步数y 4000 4200 4300 5000 5500
①根据上表数据,建立y关于x的线性回归方程;
②记由①中回归方程得到的预测步数为,若从5天中任取3天,记的天数为X,求X的分布列以及数学期望.
附参考公式与数据:,;
,其中.
P() 0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
答案以及解析
1.答案:D
解析:根据列联表得出的观测值
,则有的把握认为文化程度与月收入有关系.故选D.
2.答案:D
解析:,而在观测值表中对应于的是,所以有的把握认为“X和Y有关系”,故选D.
3.答案:C
解析:若从统计量中求出在犯错误的概率不超过的前提下认为吸烟与患肺病有关系,是指有的可能性使得判断出现错误,并不是说某人吸烟,那么他有的可能患有肺病,更不是在个吸烟的人中必有人患有肺病,故应选C项.
4.答案:B
解析:若认为X和Y有关系的犯错误的概率不超过0.1,则的观测值k所在的范围为,根据计算公式,其中,及,,,得,可得是符合的.
5.答案:D
解析:因为,故“判断性别与运动有关”出错的可能性为.
6.答案:A
解析:画出散点图知,故选A.
7.答案:C
解析:设缺失的数据为,则样本数据如下表所示:
0.2 1
2.2 3.2
1.1 2.1 2.3 3.3 4.2
其回归直线方程为,由表中数据额可得,,由线性回归方程得,,即,解得.故选C.
8.答案:A
解析:∵, ,
∴这组数据的样本中心点是
把样本中心点代入四个选项中,只有成立,
故选:A.
9.答案:C
解析:由题意知,∴,将中心点的坐标代入可得. ∴,当时,.综上所述,答案选择:C
10.答案:D
解析:由,知y与x成负线性相关关系,所以A项错误;当商品销售价格提高1元时,商品的销售量约减少10件,所以B项错误;当销售价格为10元/件时,销售量在100件左右,因此C项错误,D项正确.
11.答案:4.772
解析:的观测值.
12.答案:有关
解析:就有的理由认为两个量是有关的.
13.答案:0.8
解析:
,
.
14.答案:0.254
解析:解:∵对的回归直线方程.
∴当家庭年收入增加1万元时,,
∵.
故年饮食支出平均增加0.254万元.
故答案为:0.254.
15.答案:(1)依题意,得
50岁以上 5O岁以下 总计
使用支付宝捐步 1000 1000 2000
不使用支付宝摘步 2500 500 3000
总计 3500 1500 5000
由表中数据得的观测值
.
因为,所以有99.9%的把握认为是否使用支付宝捐步与年龄有关。
(2)①由题意得:,
,
故.
所以y关于x的线性回归方程为.
②由①可知,
第x天 第1天 第2天 策3天 第4天 第5天
步数y 4000 4200 4300 5000 5500
预刹步数 3840 4220 4600 4980 5360
故X的可能取值为1,2,3,
,
,
。
故X的分布列为
X 1 2 3
P
故。