人教A版高中数学选择性必修第三册章末综合检测(三)成对数据的统计分析含答案(教师用)

文档属性

名称 人教A版高中数学选择性必修第三册章末综合检测(三)成对数据的统计分析含答案(教师用)
格式 doc
文件大小 412.7KB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2025-05-21 09:29:29

图片预览

文档简介

章末综合检测(三) 成对数据的统计分析
A卷——基本知能盘查卷
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.可用来分析身高与体重有关系的是(  )
A.残差分析 B.线性回归模型
C.等高堆积条形图 D.独立检验
解析:选B 因为身高与体重是两个具有相关关系的变量,所以要用线性回归模型来解决.
2.两个变量y与x的经验回归模型中,分别选择了四个不同模型来拟合y与x之间的关系,它们的决定系数R2如下,其中拟合效果最好的模型是(  )
模型 1 2 3 4
R2 0.98 0.80 0.50 0.25
A.模型1  B.模型2  C.模型3  D.模型4
解析:选A 两个变量y与x的经验回归模型中,它们的决定系数R2越接近于1,这个模型的拟合效果越好,所给出的四个选项中0.98是决定系数最大的值,所以拟合效果最好的模型是模型1.
3.已知一组观测值(x1,y1),(x2,y2),…,(xn,yn)满足yi=a+bxi+ei(i=1,2,…,n),若ei恒为0,则R2=(  )
A.0    B.0.5    C.0.9    D.1
解析:选D 若ei恒为0,则残差平方和
(yi-i)2==0,
所以R2=1-=1-0=1.
4.如果有95%的把握说事件A和B有关系,那么具体计算出的数据为(  )
A.χ2>3.841 B.χ2<3.841
C.χ2>6.635 D.χ2<6.635
解析:选A 由独立性判断的方法可知,如果有95%的把握,即小概率值α=0.05,则χ2>3.841.
5.观察两个变量(存在线性相关关系)得如下数据:
x -10 -6.99 -5.01 -2.98 3.98 5 7.99 8.01
y -9 -7 -5 -3 4.01 4.99 7 8
则两变量间的线性经验回归方程为(  )
A.=x+1 B.=x
C.=2x+ D.=x+1
解析:选B 根据表中数据得=×(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,=×(-9-7-5-3+4.01+4.99+7+8)=0,所以两变量x,y的经验回归方程过样本点的中心(0,0),可以排除A、C、D选项,故选B.
6.某地使用中西医结合方法治疗流感后,每周治愈的患者人数如下表所示:
周数(x) 1 2 3 4 5
治愈人数(y) 2 17 36 93 142
由表格可得y关于x的二次回归方程为=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为(  )
A.5 B.4 C.1 D.0
解析:选A 设t=x2,则=(1+4+9+16+25)=11,=(2+17+36+93+142)=58,a=58-6×11=-8,所以=6x2-8.令x=4,得e4=y4-4=93-6×42+8=5.
7.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:
单位:人
喜爱程度 性别 合计
男(Y=0) 女(Y=1)
爱好(X=0) 10 40 50
不爱好(X=1) 20 30 50
合计 30 70 100
参考数据及公式:
P(χ2≥xα) 0.10 0.05 0.01
xα 2.706 3.841 6.635
其中χ2=,n=a+b+c+d.
则下列结论正确的是(  )
A.根据小概率值α=0.05的独立性检验,认为爱吃零食与性别有关
B.根据小概率值α=0.05的独立性检验,认为爱吃零食与性别无关
C.根据小概率值α=0.01的独立性检验,认为爱吃零食与性别有关
D.根据小概率值α=0.1的独立性检验,认为爱吃零食与性别无关
解析:选A 零假设为
H0:是否爱吃零食与性别相互独立,即是否爱吃零食与性别无关.
根据列联表中的数据,经计算得到
χ2=≈4.762>3.841=x0.05,
所以依据小概率值α=0.05的独立性检验,推断H0不成立,即认为是否爱吃零食与性别有关.同理可得,根据小概率值α=0.01的独立性检验,认为爱吃零食与性别无关;根据小概率值α=0.1的独立性检验,认为爱吃零食与性别有关.
8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(  )
A.83% B.72%
C.67% D.66%
解析:选A 将=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.
二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得 6分,部分选对的得部分分,有选错的得0分)
9.下列说法正确的是(  )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性经验回归模型中,样本相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的水平带状区域的宽度越狭窄,其模型拟合的精度越高
D.在经验回归模型中,R2为0.98的模型比R2为0.80的模型拟合的效果好
解析:选ACD 由于线性样本相关系数|r|≤1,且当|r|越大,线性相关性越强,故r<0时,选项B不正确,A、C、D均正确.
10.以下关于线性经验回归的判断中,正确的选项为(  )
A.若散点图中所有点都在一条直线附近,则这条直线为经验回归直线
B.散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点
C.已知经验回归方程为=0.50x-0.81,则x=25时,y的估计值为11.69
D.经验回归方程的意义是它反映了样本整体的变化趋势
解析:选BCD 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线=x+才是回归直线,所以A错误;B正确;将x=25代入=0.50x-0.81,得=11.69,所以C正确;D正确.
11.有两个分类变量X与Y,其2×2列联表如下表所示:
X Y 合计
Y=0 Y=1
X=0 a 20-a 20
X=1 15-a 30+a 45
合计 15 50 65
其中a,15-a均为大于5的整数,根据小概率值α=0.05的独立性检验,认为X与Y之间有关,则a等于(  )
A.7 B.8
C.9 D.6
解析:选BC 根据小概率值α=0.05的独立性检验,认为X与Y之间有关,需要χ2的值大于或等于3.841,
由χ2=
=≥3.841,
解得a≥7.69或a≤1.54.而a>5且15-a>5,a∈Z,
所以a=8或a=9.
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中的横线上)
12.已知样本容量为11,计算得i=510,i=214,经验回归方程为=0.3x+,则≈________,≈________.(精确到0.01)
解析:由题意得=i=≈46.36,=i=,因为=0.3+,所以=0.3×+,可得≈5.55.
答案:46.36 5.55
13.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:
性别 专业
非统计专业(Y=0) 统计专业(Y=1)
男(X=0) 13 10
女(X=1) 7 20
为了判断主修统计专业是否与性别有关系,根据表中数据,得到χ2=≈4.844>3.841,所以能根据小概率值α=________,我们断定主修统计专业与性别有关系.
解析:因为P(χ2≥3.841)=0.05,所以小概率值α=0.05.
答案:0.05
14.下表是降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于x的线性经验回归方程=0.7x+0.35,那么表中m的值为________.
x 3 4 5 6
y 2.5 m 4 4.5
解析:根据所给的表格可以求出
==4.5,==,
因为这组数据的样本点的中心在线性经验回归直线上,
所以=0.7×4.5+0.35,所以m=3.
答案:3
四、解答题(本大题共5小题,共77分.解答应写出必要的文字说明、证明过程或演算步骤)
15.(13分)手机作为客户端越来越为人们所青睐,通过手机实现衣食住行消费已经成为一种主要的消费方式.在某市随机调查了200名顾客购物时使用手机支付的情况,得到如下的2×2列联表.已知从使用手机支付的人群中随机抽取1人,抽到青年的概率为.
(1)根据已知条件完成2×2列联表,并根据小概率值α=0.005的独立性检验,判断市场购物用手机支付与年龄是否有关?
2×2列联表:
单位:人
手机支付 青年 中老年 合计
使用手机支付 120
不使用手机支付 48
合计 200
(2)现采用分层随机抽样的方法从这200名顾客中按照“使用手机支付”和“不使用手机支付”抽取得到一个容量为5的样本,设事件A为“从这个样本中任选2人,这2人中至少有1人是不使用手机支付的”,求事件A发生的概率.
附:χ2=,其中n=a+b+c+d,
α 0.05 0.025 0.010 0.005
xα 3.841 5.024 6.635 7.879
解:(1)∵从使用手机支付的人群中随机抽取1人,抽到青年的概率为,
∴使用手机支付的人群中的青年的人数为×120=84.
则使用手机支付的人群中的中老年的人数为120-84=36,
所以2×2列联表为:
单位:人
手机支付 青年 中老年 合计
使用手机支付 84 36 120
不使用手机支付 32 48 80
合计 116 84 200
χ2==≈17.734.
∵17.734>7.879,P(χ2≥7.879)=0.005,
根据小概率值α=0.005的独立性检验,认为市场购物用手机支付与年龄有关,此推断犯错误的概率不超过0.005.
(2)这200名顾客中采用分层抽样,从“使用手机支付”和“不使用手机支付”中抽到一个容量为5的样本中,
使用手机支付的人有5×=3人,记编号为1,2,3.
不使用手机支付的人有2人,记编号为a,b.
则从这个样本中任选2人有(1,2),(1,3),(1,a),(1,b),(2,3),(2,a),(2,b),(3,a),(3,b),(a,b)共10种.
其中至少有1人是不使用手机支付的有(1,a),(1,b),(2,a),(2,b),(3,a),(3,b),(a,b)共7种.
故所求事件A的概率P(A)=.
16.(15分)在统计学中,偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差,班主任为了了解个别学生的偏科情况,对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行学科偏差分析,决定从全班56位同学中随机抽取一个容量为8的样本进行分析,得到他们的两科成绩偏差数据如表:
学生序号 1 2 3 4 5 6 7 8
数学偏差x/分 20 15 13 3 2 -5 -10 -18
物理偏差y/分 6.5 3.5 3.5 1.5 0.5 -0.5 -2.5 -3.5
(1)已知x与y之间具有线性相关关系,求y关于x的经验回归方程;
(2)若这次考试该班数学平均分为118分,物理平均分为90.5,试预测数学成绩126分的同学的物理成绩.
参考数据:iyi=324,=1 256.
解:(1)由题意,=×[20+15+13+3+2+(-5)+(-10)+(-18)]=,
=×[6.5+3.5+3.5+1.5+0.5+(-0.5)+(-2.5)+(-3.5)]=,
===,
所以=-=-×=,
故经验回归方程为=x+.
(2)由题意,设该同学的物理成绩为ω,
则物理偏差为ω-90.5.而数学偏差为126-118=8,
由(1)的结论可得,ω-90.5=×8+,解得ω=93,
所以可以预测这位同学的物理成绩为93分.
17.(15分)经观测,某昆虫的产卵数y与温度x有关,现将收集到的温度xi和产卵数yi(i=1,2,…,10)的10组观测数据作了初步处理,得到如图所示的散点图及统计表.
i i i (xi-)2 (xi-)·(yi-) (xi-)·(zi-)
275 731.1 21.7 150 2 368.36 30
其中zi=ln yi,=i.
(1)根据散点图判断,y=a+bx,y=a+与y=c1ec2x哪一个适宜作为y与x之间的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,
①试求y关于x的经验回归方程;
②已知用人工培养该昆虫的成本h(x)与温度x和产卵数y的关系为h(x)=x(ln y-2.4)+170,当温度x(x取整数)为何值时,培养成本的预报值最小?
解:(1)根据散点图,看出样本点分布在一条指数函数图象的周围,所以y=c1ec2x适宜作为y与x之间的回归方程模型.
(2)①令z=ln y,则z=c2x+ln c1,
c2===,ln c1=-c2=-3.33,z=x-3.33,所以y=ez=e-3.33.
②h(x)=x(ln y-2.4)+170=x+170=x2-5.73x+170,所以当x=≈14时,培养成本的预报值最小.
18.(17分)某乡政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的平均收入的统计数据:
年份 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5
平均收入y/千元 59 61 64 68 73
(1)根据表中数据,现有=a+bx与=c+dx2两种模型可以拟合y与x之间的关系,请分别求出两种模型的经验回归方程;(结果保留一位小数)
(2)统计学中常通过比较残差的平方和来比较两个模型的拟合效果,已知=a+bx的残差平方和是3.5,请根据残差平方和说明上述两个方程哪一个拟合效果更好,并据此预测2023年该农户种植药材的平均收入.
参考数据及公式:(ti-)(yi-)=217,(ti-)2=374,其中ti=x.
解:(1)根据农户近5年种植药材的平均收入情况的统计数据可得=(1+2+3+4+5)=3,=(59+61+64+68+73)=65,
所以(xi-)(yi-)=35,(xi-)2=10,
则b===3.5,a=65-3.5×3=54.5.
设t=x2,则=c+dx2=c+dt,所以=(12+22+32+42+52)=11,则d==≈0.6,c=-d=65-0.6×11=58.4.
所以两种模型的经验回归方程分别为=3.5x+54.5,=0.6x2+58.4.
(2)当经验回归方程为=0.6x2+58.4时,将x值代入可得估计值分别为59,60.8,63.8,68,73.4,
则残差平方和为(59-59)2+(61-60.8)2+(64-63.8)2+(68-68)2+(73-73.4)2=0.24.
而=a+bx的残差平方和是3.5,则0.24<3.5,
所以经验回归方程=0.6x2+58.4拟合效果更好,应选择该方程进行拟合.
当x=6时,=0.6×62+58.4=80,故预测2023年该农户种植药材的平均收入为80千元,即8万元.
19.(17分)为了解汉服体验店广告支出和销售额之间的关系,在洛阳洛邑古城附近抽取7家汉服体验店,得到了广告支出与销售额数据如下:
体验店 A B C D E F G
广告支出/万元 3 4 6 8 11 15 16
销售额/万元 6 10 15 17 23 38 45
对进入G体验店的400名游客进行统计得知,其中女性游客有280人,女性游客中体验汉服的有180人,男性游客中没有体验汉服的有80人.
(1)请将下列2×2列联表补充完整,依据小概率值α=0.001的独立性检验,能否认为体验汉服与性别有关联?
单位:人
性别 是否体验汉服 总计
体验汉服 没有体验汉服
女 180 280
男 80
总计 400
(2)设广告支出为变量x(单位:万元),销售额为变量y(单位:万元),根据统计数据计算样本相关系数r,并据此说明可用线性回归模型拟合y与x的关系(若|r|>0.75,则线性相关程度很强,可用线性回归模型拟合);
(3)建立y关于x的回归方程,并预测广告支出为18万元时的销售额(精确到0.1).
参考数据及公式:=727,=4 648,
iyi=1 827,≈3.74,≈3.16,≈2.64,
解:(1)根据题意,列联表完成如下.
单位:人
性别 是否体验汉服 总计
体验汉服 没有体验汉服
女 180 100 280
男 40 80 120
总计 220 180 400
根据列联表数据,经计算得
χ2=≈32.516>10.828=x0.001.
根据小概率值α=0.001的独立性检验,
认为体验汉服与性别之间有关联,此推断犯错误的概率不超过0.001.
(2)由数据可知,
=(3+4+6+8+11+15+16)=9,
=(6+10+15+17+23+38+45)=22,
r=

==≈0.98.
因为0.98>0.75,所以线性相关程度很强,可用线性回归模型拟合y与x的关系.
(3)由数据及公式可得==≈2.8,
=-=22-2.8×9=-3.2,
故y关于x的回归直线方程为=2.8x-3.2.
当x=18万元时,销售额预计为=2.8×18-3.2=47.2万元.
B卷——高考能力达标卷
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列属于相关关系的是(  )
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
解析:选B A与D是函数关系,C中两变量没有关系,B中居民收入与储蓄存款是相关的,但不具有函数关系.
2.已知一个经验回归方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则=(  )
A.58.5 B.46.5
C.60 D.75
解析:选A ==9,
因为经验回归直线必过样本点的中心(,),
所以=1.5×9+45=13.5+45=58.5.
3.已知每一吨铸铁成本y(元)与铸件废品率x%建立的经验回归方程=56+8x,则下列说法正确的是(  )
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
解析:选C 根据经验回归方程知y是关于x的单调增函数,并且由系数知x每增加一个单位,y平均增加8个单位.
4.某商品销售量y(件)与销售价格x(元/件)负相关,则其经验回归方程可能是(  )
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
解析:选A 由于销售量y与销售价格x成负相关,故排除B,D.又当x=10时,A中y=100,而C中y=-300,C不符合题意.
5.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=0.85x-85.71,则下列说法错误的是(  )
A.y与x具有正的线性相关关系
B.经验回归直线过样本点的中心
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:选D 选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79(kg).故D选项错误.
6.如图所示的是调查某地区男、女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出(  )
A.性别与喜欢理科无关
B.女生中喜欢理科的比例约为80%
C.男生比女生喜欢理科的可能性大些
D.男生中不喜欢理科的比例约为60%
解析:选C 由题图可知女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.
7.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是(  )
A.样本相关系数r变大
B.残差平方和变大
C.决定系数R2变大
D.解释变量x与预报变量y的相关性变强
解析:选B 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
8.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:
单位:人
物理成绩 数学成绩 合计
85~100分(Y=0) 85分以下(Y=1)
85~100分(X=0) 37 85 122
85分以下(X=1) 35 143 178
合计 72 228 300
根据表中数据,分析数学成绩与物理成绩有关联的出错率不超过(  )
A.0.5% B.1%
C.0.1% D.5%
解析:选D 由表中数据代入公式得
χ2=≈4.514>3.841=x0.05,
所以判断的出错率不超过5%.
二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得 6分,部分选对的得部分分,有选错的得0分)
9.对于经验回归方程=x+,下列说法正确的是(  )
A.直线必经过点(,)
B.x增加1个单位时,y平均增加个单位
C.样本数据中x=0时,可能有y=
D.样本数据中x=0时,一定有y=
解析:选ABC 经验回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.
10.下列说法中正确的有(  )
A.若r>0,则x增大时,y也相应增大
B.若r<0,则x增大时,y也相应增大
C.若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上
D.|r|越接近1,相关关系越强
解析:选ACD 若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故A正确.r<0,表示两个变量负相关,x增大时,y相应减小,故B错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故C正确,D正确.
11.根据如下样本数据:
x 3 4 5 6 7 8
y 4 2.5 -0.5 0.5 -2 -3
得到的经验回归方程为=x+,则(  )
A.>0 B.<0
C.>0 D.<0
解析:选AD 根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直线与y轴的交点在y轴正半轴,所以>0,<0.
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中的横线上)
12.为了判断高三年级学生选修文科是否与性别有关,现随机抽取70名学生,得到如图所示2×2列联表:
单位:人
性别 文理科 合计
理科(Y=0) 文科(Y=1)
男(X=0) 10 15 25
女(X=1) 30 15 45
合计 40 30 70
已知P(χ2≥3.841)≈0.05,P(χ2≥6.635)≈0.01.根据表中数据,得到χ2≈4.667,则在犯错误的概率不大于________的前提下认为选修文科与性别有关.
解析:由题意知, χ2≈4.667,因为6.635>4.667>3.841,所以在犯错误的概率不大于0.05的前提下认为选修文科与性别有关.
答案:0.05
13.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分的含量x之间的关系,现取8对观测值,计算得i=52,i=228,=478,iyi=1 849,则y对x的经验回归方程是____________.(精确到0.01)
解析:由回归系数的计算公式,得=≈2.62,=-=11.47,故所求的经验回归方程为=2.62x+11.47.
答案:=2.62x+11.47
14.已知x,y之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=x+1与l2:y=x+,利用最小二乘法判断拟合程度更好的直线是______________.
x 1 3 6 7 8
y 1 2 3 4 5
解析:用y=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=2+(2-2)2+(3-3)2+2+2=.用y=x+作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2+2+(4-4)2+2=.
因为S2答案:y=x+
四、解答题(本大题共5小题,共77分.解答应写出必要的文字说明、证明过程或演算步骤)
15.(13分)某班5名学生的数学和物理成绩如下表:
学生 A B C D E
数学成绩x/分 88 76 73 66 63
物理成绩y/分 78 65 71 64 61
(1)画出散点图;
(2)求物理成绩y关于数学成绩x的经验回归方程(结果保留三位小数).
解:(1)散点图如图所示.
(2)因为=×(88+76+73+66+63)=73.2,
=×(78+65+71+64+61)=67.8,
iyi=88×78+76×65+73×71+66×64+63×61=25 054,
=882+762+732+662+632=27 174,
所以=≈0.625,
=-≈67.8-0.625×73.2=22.050.
因此y关于x的经验回归方程为=22.050+0.625x.
16.(15分)北京时间2022年4月16日,神舟13号载人飞船返回舱在东风着陆场成功着陆,这趟神奇之旅意义非凡,尤其是“天宫课堂”在广大学生心中引起强烈反响,激起了他们对太空知识的浓厚兴趣.某中学为了解学生的性别和对天宫课堂的喜欢是否有关联,采用简单随机抽样的方法抽取100名学生进行问卷调查,得到如下列联表:
单位:人
性别 天宫课堂 合计
不喜欢 喜欢
女 20 40 60
男 10 30 40
合计 30 70 100
(1)画出列联表的等高堆积条形图,并判断该中学学生性别与喜欢天宫课堂是否有关联;
(2)依据小概率值α=0.1的χ2独立性检验,能否据此认为该中学学生性别与喜欢天宫课堂有关联.
附:χ2=,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:(1)根据2×2列联表可知,该中学女生不喜欢天宫课堂和喜欢天宫课堂的频率分别为≈0.333和≈0.667,该中学男生不喜欢天宫课堂和喜欢天宫课堂的频率分别为=0.25和=0.75.
根据以上数据,画出等高堆积条形图,如图所示.
图中灰色条和白色条的高分别表示该中学学生中不喜欢和喜欢天宫课堂的频率,从图中可以看出,女生喜欢天宫课堂的频率明显低于男生喜欢天宫课堂的频率,因此我们可认为该中学学生喜欢天宫课堂与性别有关联.
(2)零假设为H0:该中学学生喜欢天宫课堂与性别无关联.
根据列联表中的数据,得χ2==≈0.793 7<2.706=x0.1.依据小概率值α=0.1的χ2独立性检验,没有充分依据推断H0不成立,因此不能认为该中学学生喜欢天宫课堂与性别有关联.
17.(15分)某公司为了解年宣传费对年销售量的影响,对近7年的年宣传费和年销售量进行了研究,发现年宣传费x(单元:万元)和年销售量y(单位:t)线性相关,所得数据如下:
x/万元 1 2 3 4 5 6 7
y/t 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)根据表中数据建立y关于x的经验回归方程;
(2)已知这种产品的年利润z(百万元)与x,y的关系为z=y-0.05x2-1.25,根据(1)中的结果,估算该公司应该投入多少宣传费,才能使得年利润z最大,并求出利润最大值.
附:经验回归方程=x+中的斜率和截距的最小二乘估计公式分别为==,=-.
参考数据:12+22+32+42+52+62+72=140,1×2.9+2×3.3+3×3.6+4×4.4+5×4.8+6×5.2+7×5.9=134.4.
解:(1)由题意可得=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
所以=eq \f(\i\su(i=1,7,x)iyi-7 ,\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)==0.5,
则=-=4.3-0.5×4=2.3.
所以y关于x的经验回归方程为=0.5x+2.3.
(2)由(1)可知z=0.5x+2.3-0.05x2-1.25=-0.05x2+0.5x+1.05,
所以当x=-=5时年利润取得最大,最大为230万元.
故该公司应该投入5万元宣传费,才能使得年利润z最大,最大为230万元.
18.(17分)某农业兴趣小组针对两种肥料的作用进行对比试验,经过一季的试验后,对“使用肥料A”和“使用肥料B”的220株植物的生长情况进行研究,按照植株的高度大于或等于60厘米为“高株”,60厘米以下为“矮株”统计,得到如下的2×2列联表:
单位:株
使用肥料 植株的高度 合计
高株 矮株
使用肥料A 20 90 110
使用肥料B 40 70 110
合计 60 160 220
(1)根据上面的2×2列联表判断,依据α=0.001的独立性检验,能否认为“使用哪种肥料与植株的高度”有关;
(2)为了进一步研究,从这批植物高株中用分层抽样的方法抽出6株,再从这6株中抽出3株,求抽到“使用肥料A”植物的株数X的分布列和数学期望.
附:χ2=.
α 0.100 0.050 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:(1)由题意得χ2==≈9.167,
因为9.167<10.828,所以依据α=0.001的独立性检验,不能认为“使用哪种肥料与植株的高度”有关.
(2)要从这批植物高株中用分层抽样的方法抽出6株,则“使用肥料A”和“使用肥料B”的应分别抽取2株、4株.从这6株中抽出3株,抽到“使用肥料A”植物的株数X可能值为0,1,2,
所以P(X=0)==,P(X=1)==,
P(X=2)==.
所以X的分布列为
X 0 1 2
P
所以X的数学期望为E(X)=0×+1×+2×=1.
19.(17分)某县城为活跃经济,特举办传统文化民俗节.小张弄了一个套玩偶的摊位,设xi表示第i天的平均气温,yi表示第i天参与活动的人数,i=1,2,…,20,根据统计,计算得到如下一些统计量的值:
(xi-)2=80,(yi-)2=9 000,(xi-)·(yi-)=800.
(1)根据所给数据,用样本相关系数r(精确到0.01)判断是否可用线性回归模型拟合y与x的关系;
(2)现有两个家庭参与套圈,A家庭3位成员每轮每人套住玩偶的概率都为,B家庭3位成员每轮每人套住玩偶的概率分别为,,,每个家庭的3位成员均玩一次套圈为一轮,每轮每人收费20元,每个玩偶价值40元,且每人是否套住相互独立,以每个家庭的盈利的期望为决策依据,问:一轮结束后,哪个家庭损失较大?
附:样本相关系数r=.
解:(1)由题可知,
r=

==≈0.94,
故可用线性回归模型拟合y与x的关系.
(2)设A家庭中套中玩偶的人数为X1,则X1~B,所以E(X1)=3×=.
设A家庭的盈利为X2元,则X2=40X1-60,
所以E(X2)=40E(X1)-60=-24.
设B家庭中套中玩偶的人数为Y1,
则Y1的所有可能取值为0,1,2,3,
P(Y1=0)=××=,
P(Y1=1)=××+××+××=,
P(Y1=2)=××+××+××=,P(Y1=3)=××=,
所以E(Y1)=0×+1×+2×+3×=.
设B家庭的盈利为Y2元,则Y2=40Y1-60,
所以E(Y2)=40E(Y1)-60=40×-60=-30.
因为-24>-30,所以B家庭的损失较大.
21世纪教育网(www.21cnjy.com)